ZKX's LAB

GB2312-80是唯一的汉字编码方案,对吗? 汉字编码什么是唯一的

2021-04-26知识8

什么是国家标准汉字编码 所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理.在此介绍的是《国家标准信息交换汉字编码》.这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同.(1)按音序查常用汉字按音序几乎都可查到,例如:“白”字,首先,按其发音bai查在汉字编码表中的位置,然后在bai范围内查“白”字,找到“白”字后,其汉字右侧的数字1655就是“白”的汉字编码.(2)关于多音字的查找由于汉字编码是一种无重码的汉字编码,所以多音字只有一个编码.在查多音字时,如果用某个音查不到,可换另外的音去查.例如:重庆的“重”和重量的“重”,字同音不同,汉字“重”的编码是按Zhong音编码的.

汉字无论在何种汉字编码字符集中所对应的机内码是唯一的? 错在“无论何种汉字编码”,不同编码存储的同一字的机内码肯定是不一样的比如 GB2312(2字节)和UTF-8(3字节)等而如果机内码一样,字形码不一样,其实就是同一种编码的汉字,换了个字体文件

汉字的内码是唯一的吗 汉字在计算机内部其内码是唯一的。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和。的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即汉字机内码=汉字国标码+8080H例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。汉字机内码的基础是汉字国标码。机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。

#汉字编码什么是唯一的

随机阅读

qrcode
访问手机版