ZKX's LAB

汉字编码的字符集 包中元汉字编码

2021-04-27知识9

我知道常用汉字大约有3000,那么汉字一共有多少个? ·汉字数量很大,《汉语大字典》共收单字56000个。但是,实际通用的汉字并不很多。根据专家统计,3500个常用字就覆盖了现代出版物用字的99.48%;《毛泽东选集》四卷,总字数为660273个,使用不同的单字只有2981个。1988年国家语委语用所汉字室与二炮二所合作,对14省市的人口普查资料抽样选取了57万条姓名,统计结果表明:57万条姓名的人名用字仅为4141字。而其中的1505字就覆盖了57万条姓名的99%,剩下的2600多字仅为1%的人所使用;而在2600字中超出《信息交换用汉字编码字符集·基本集》(6763字)的仅有500多字,使用人口不足0.1%。为极少数人使用生僻字的需要去无限增大字库,是一种资源的浪费。《信息导刊》〔2003年 第25期

汉字编码的字符集 ① GB2312-80字符集,中文名国家标准字符集(GB=GuóBiāo国标)。收入汉字6763个,符号715个,总计7478个字符,这是大陆普遍使用的简体字字符集。楷体-GB2312、仿宋-GB2312、华文行楷等市面上绝大多数字体支持显示这个字符集,亦是大多数输入法所采用的字符集。市面上绝大多数所谓的繁体字体,其实采用的是GB-2313字符集简体字的编码,用字体显示为繁体字,而不是直接用GBK字符集中繁体字的编码,错误百出。② Big-5字符集,中文名大五码,是台湾繁体字的字符集,收入13060个繁体汉字,808个符号,总计13868个字符,普遍使用于台湾、香港等地区。台湾教育部标准宋体楷体等港台大多数字体支持这个字符集的显示。③ GBK字符集,中文名国家标准扩展字符集(GB=GuóBiāo国标;K=Kuò扩,即扩展),兼容GB2312-80标准,包含Big-5的繁体字,但是不兼容Big-5字符集编码,收入21003个汉字,882个符号,共计21885个字符,包括了中日韩(CJK)统一汉字20902个、扩展A集(CJK Ext-A)中的汉字52个。Windows 95/98简体中文版就带有这个GBK.txt文件。宋体、隶书、黑体、幼圆、华文中宋、华文细黑、华文楷体、标楷体(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字体支持。

区位码、国标码和机内码如何转换? 汉字系统中的过程包括区内码、国标码和机内码,其中的转换关系如下:1.区位码(十进制)转换成区位码(十六进制)。这里要把前两个位换成十六进制,然后后两位换成十六进制。

#贵州中元包写法#包中元汉字编码#中元包的写法

随机阅读

qrcode
访问手机版