ZKX's LAB

不同阶段使用的汉字编码分别为 一个汉字对应的编码有哪几种,个有什么作用

2021-04-26知识1

详细说明汉字在计算机中的处理流程以及汉字编码在处理过程中的转化关系 一般字库文件是按照GB 2312-80标准,也就是通常所说的国标码或区位码的标准排列的.国标码分为 94 个区(Section),每个区 94 个位(Position),所以也称为区位码.其中01~09 区为符号、数字区,16~87 区为汉字区.而 10~15 区、88~94 区是空白区域.如何取得汉字的区位码呢?在计算机处理汉字和ASCII字符时,使每个ASCII字符占用1个字节,而一个汉字占用两个字节,其值称为汉字的内码.其中第一个字节的值为区号加上32(20H),第二个字节的值为位号加上32(20H).为了与ASCII字符区别开,表示汉字的两个字节的最高位都是1,也就是两个字节的值都又加上了128(80H).这样,通过汉字的内码,就可以计算出汉字的区位码.具体算式如下:qh=c1-32-128=c1-160 wh=c2-32-128=c2-160 或 qh=c1-0xa0 wh=c2-0xa0 qh,wh为汉字的区号和位号,c1,c2为汉字的第一字节和第二字节.根据区号和位号可以得到汉字字模在文件中的位置:location=(94*(qh-1)+(wh-1))*一个点阵字模的字节数.

按照汉字的“输入”-“处理”的流程,不同阶段的汉字编码一般分别对应——? 找书看。

汉字编码按编码方法不同,可分为哪四大类 汉字编码2113主要分为四大类:汉字输5261入码、汉字交换码、汉字内码和汉4102字字形码1653。(1)汉字的外部码汉字的外部码简称外码,又叫输人码,是输人汉字的一组键盘符号。使用不同的输入方法,同一汉字的外部码不同。用户应选用易记忆、操作简单、位码少、重码少和输人速度快的外码。(2)汉字的内部码汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区分,内码的最高位设为“1”。内码通常用汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可以是字库中的存储位置。(3)汉字交换码在计算机之间交换信息时,要求传送的汉字代码符合国家规定的交换码标准,即符合GB2312-80信息交换用汉字编码集,又称为国标码。国标码收集了7445个图形字符,其中有6763个汉字和各种符号709个。国标码规定,每个汉字用两个字节表示,每个字节仅用低7位,最高位为0。汉字的国标码和内码有—一对应关系,即将高位加l,国标码就变为内码。(4)汉字字形码在显示或打印汉字时,还涉及到字形码,又称输出码。汉字字形是指原来铅字排版汉字的大小和形状,在计算机中指组成汉字的。

#不同阶段使用的汉字编码分别为

随机阅读

qrcode
访问手机版