ZKX's LAB

2.汉字编码的处理过程 汉字系统把一个汉字表示为二个字节的二进制编码,这种编码叫?

2021-04-09知识5

简述汉字处理中汉字编码转换过程 ?汉字在计算机上的编码主要有三种:输入码、机,内码和输出码,1.用于输入的汉字的编码—输入码(外码62616964757a686964616fe59b9ee7ad9431333431346434)计算机上输入汉字的方法很多,如键盘编码输入、语音输入、手写输入、扫描输入等,其中键盘编码输入是最容易实现和最常用的一种汉字输入方法。英文等可以用键盘上的每个字母键来输入,而输入汉字则不同,不可能用有限的按键来对应每一个汉字,为了让用户能直接使用英文键盘输入汉字,于是就有了输入汉字时使用的汉字输入码,它一般由键盘上的字母或数字组成,代表某个汉字或某些汉字、词组或句子。当前用于汉字输入的编码方案很多,如区位码、拼音码、王码(五笔字型)、自然码等。2.用于储存汉字的编码—机内码(内码)由于汉字输入码的编码方案多种多样,同一个汉字如果采用的编码方案不一样,其输入码就有可能不一样。如果计算机内部存放的是汉字输入码本身,就会造成相同汉字在机内可以用不同的编码表示,这样显然不合理,也给计算机内部的汉字处理增加了难度。为了将汉字的各种输入码在计算机内部统一起来,就引进了汉字的机内码。3.用于输出汉字的编码—输出码(字型码)存储在计算机内的汉字在屏幕上。

详细说明汉字在计算机中的处理流程以及汉字编码在处理过程中的转化关系 一般字库文件是按照GB 2312-80标准,也就是通常所说的国标码或区位码的标准排列的.国标码分为 94 个区(Section),每个区 94 个位(Position),所以也称为区位码.其中01~09 区为符号、数字区,16~87 区为汉字区.而 10~15 区、88~94 区是空白区域.如何取得汉字的区位码呢?在计算机处理汉字和ASCII字符时,使每个ASCII字符占用1个字节,而一个汉字占用两个字节,其值称为汉字的内码.其中第一个字节的值为区号加上32(20H),第二个字节的值为位号加上32(20H).为了与ASCII字符区别开,表示汉字的两个字节的最高位都是1,也就是两个字节的值都又加上了128(80H).这样,通过汉字的内码,就可以计算出汉字的区位码.具体算式如下:qh=c1-32-128=c1-160 wh=c2-32-128=c2-160 或 qh=c1-0xa0 wh=c2-0xa0 qh,wh为汉字的区号和位号,c1,c2为汉字的第一字节和第二字节.根据区号和位号可以得到汉字字模在文件中的位置:location=(94*(qh-1)+(wh-1))*一个点阵字模的字节数.

按照汉字的”输入→_→处理→_→输出”的流程,不同阶段使用的汉字编码分别对应为什么? 首先用汉字的外码将汉字输入,其次用汉字的内码存储并处理汉字,最后用汉字的字形码将汉字输出。

#汉字编码的处理过程#2.汉字编码的处理过程

随机阅读

qrcode
访问手机版