ZKX's LAB

中国的汉字如何编码? 中国常用汉字编码标准

2021-04-25知识3

我国内地发布使用的汉字编码有多种,无论哪一种标准,每个汉字均用2字节进行编码。为什么不对? 我国规定的汉字代码标准GB2312-80为6763个常用汉字规定了二进制代码,每个汉字占用2个字节,就是16个BYTE。近年来开始使用的新的国家标准GB13000,使用四个字节表示一个汉字。

中国的汉字如何编码? 所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一内部特征,这个字符排列顺序被称为“编码”。字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编码标准,和中文字库有关的常见编码有:单字节编码、GB2312-80、GB12345-90、GBK、Unicode编码、ISO10646/Unicode字符集、GB18030-2000、BIG5编码,下面简要介绍一下:单字节编码MS Windows:Windows Latin 1(ANSI)MS-DOS:MS-DOS Latin USMacintosh:Macintosh RomanGB2312-80全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。P-Windows3.2和苹果OS就是以GB2312为基本汉字编码,Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。双字节编码范围:A1A1~FEFEA1-A9:符号区,包含682个符号B0-F7:汉字区,包含6763个汉字GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。GB12345-901990年制定了繁体。

GB_2312字符集是目前最常用的汉字编码标准,windows95/98/2000中使用的GBK字符集就包含了GB2312,或者说和GB2312兼容,GB_2312字符集包含了6763个的简体汉字,和682个标准。

#英语单词汉字编码记忆法#国标码属于汉字输入编码吗#汉字编码的常用编码是#汉字的两种编码是什么#五笔字型汉字编码速查表

随机阅读

qrcode
访问手机版