中国国家标准汉字信息交换编码是GB2312-80。GB2312-80是中国人民共和国国家标准汉字信息交换用编码,习惯上称为国际码、GB码或区位码。信息交换用汉字编码字符集和汉字输入编码之间的关系是,根据不同的汉字输入方法,通过必要的设备向计算机输入汉字的编码,计算机接收之后,先转换成信息交换用汉字编码字符,这时计算机就可以识别并进行处理;汉字输出是先把机内码转成汉字编码,再发送到输出设备。扩展资料GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为“高字节”,第二个字节为“低字节”。GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2OH)。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画 顺序排列。故而GB2312最多能表示6763个汉字。
我国内地发布使用的汉字编码有多种,无论哪一种标准,每个汉字均用2字节进行编码。为什么不对? 我国规定的汉字代码标准GB2312-80为6763个常用汉字规定了二进制代码,每个汉字占用2个字节,就是16个BYTE。近年来开始使用的新的国家标准GB13000,使用四个字节表示一个汉字。
中国的汉字如何编码? 所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一内部特征,这个字符排列顺序被称为“编码”。字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编码标准,和中文字库有关的常见编码有:单字节编码、GB2312-80、GB12345-90、GBK、Unicode编码、ISO10646/Unicode字符集、GB18030-2000、BIG5编码,下面简要介绍一下:单字节编码MS Windows:Windows Latin 1(ANSI)MS-DOS:MS-DOS Latin USMacintosh:Macintosh RomanGB2312-80全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。P-Windows3.2和苹果OS就是以GB2312为基本汉字编码,Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。双字节编码范围:A1A1~FEFEA1-A9:符号区,包含682个符号B0-F7:汉字区,包含6763个汉字GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。GB12345-901990年制定了繁体。