ZKX's LAB

. 写出汉字编码的处理过程 详细说明汉字在计算机中的处理流程以及汉字编码在处理过程中的转化关系

2021-04-09知识7

在汉字信息处理中,汉字输入编码方法主要分为 62616964757a686964616fe59b9ee7ad9431333337393465计算机中汉字的表示也是用二进制编码,同样是人为编码的。根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。1.外码(输入码)外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。2.交换码(国标码)计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312-80《信息交换用汉字编码字符集-基本集》,即国标码。区位码是国标码的另一种表现形式,把国标GB2312-80中的汉字、图形符号组成一个94×94的方阵,分为94个“区”,每区包含94个“位”,其中“区”的序号由01至94,“位”的序号也是从01至94。94个区中位置总数=94×94=8836个,其中7445个汉字和图形字符中的每一个占一个位置后,还剩下1391个空位,这1391个位置空下来保留备用。3.机内码根据国标码的规定,每。

详细说明汉字在计算机中的处理流程以及汉字编码在处理过程中的转化关系 一般字库文件是按照GB 2312-80标准,也就是通常所说的国标码或区位码的标准排列的.国标码分为 94 个区(Section),每个区 94 个位(Position),所以也称为区位码.其中01~09 区为符号、数字区,16~87 区为汉字区.而 10~15 区、88~94 区是空白区域.如何取得汉字的区位码呢?在计算机处理汉字和ASCII字符时,使每个ASCII字符占用1个字节,而一个汉字占用两个字节,其值称为汉字的内码.其中第一个字节的值为区号加上32(20H),第二个字节的值为位号加上32(20H).为了与ASCII字符区别开,表示汉字的两个字节的最高位都是1,也就是两个字节的值都又加上了128(80H).这样,通过汉字的内码,就可以计算出汉字的区位码.具体算式如下:qh=c1-32-128=c1-160 wh=c2-32-128=c2-160 或 qh=c1-0xa0 wh=c2-0xa0 qh,wh为汉字的区号和位号,c1,c2为汉字的第一字节和第二字节.根据区号和位号可以得到汉字字模在文件中的位置:location=(94*(qh-1)+(wh-1))*一个点阵字模的字节数.

按照汉字的“输入”-“处理”的流程,不同阶段的汉字编码一般分别对应——? 找书看。

#汉字编码的处理过程#. 写出汉字编码的处理过程

随机阅读

qrcode
访问手机版