汉字编码的类型有哪些? 1984年9月,五笔字型汉字编码输入法在联合国做操作演示,达到每分钟输入120个字的速度,每个汉字及词组的输入最多4键,从此,计算机的汉字输入问题得到了根本的解决。此后,汉字输入技术的发展越来越先进,但都是利用西文电脑键盘为汉字编制代码,输入代码就相应完成了汉字的输入。现有的汉字编码已有四五百种之多,主要可分为形码、声码和形声码。五笔字型是形码,它把汉字分解为若干字根,分别由字母代表;声码则是根据汉语拼音制作的编码,如双拼双音输入法;形声码是把形码和声码的特点结合起来,将字根转换成拼音进行编码,兼有两者的优长。汉字编码正朝着日趋简化的方向发展,目前,语音识别输入技术已逐渐趋于完善,并得到应用,使汉字电脑输入变得越来越容易。由于汉字有数万之众,为了不占用计算机的内存空间,于是出现了将汉字资源做成硬件的汉卡。汉卡能使计算机达到与处理英文同等的效率。20世纪80年代初的汉卡又笨又大,后来采用超大规模集成电路,浓缩度达到几万分之一。汉卡的微型化为微型计算机的多功能化提供了条件。
什么是汉字编码 计算机内部使用的汉字编码称为汉字内码或汉字机内码。汉字机内码由国标码(GB2312-80)演化而来,把表示国际码的两个字节的最高位分别加1,就变成了汉字机内码。汉字字模信息码即汉字字形码,用点阵方式来构造汉字字型。它们的关系是这样的,汉字输入编码是外部码,同一个汉字可以有不同的输入编码,但它们的汉字机内码是惟一的。汉字的输出则根据点阵方式构成的汉字字模信息码输出。汉字编码系统为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。BIG5码。收录13053个汉字。在台湾和香港使用的一字节或两字节编码。Unicode并不被中国政府很好的接受。中国政府要求在中国大陆出售的软件必须支持GB 18030编码。在国际通信化和软件设计领域,CJK编码收集了汉语、日语、韩语中的汉字集。
什么是国家标准汉字编码 所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理.在此介绍的是《国家标准信息交换汉字编码》.这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同.(1)按音序查常用汉字按音序几乎都可查到,例如:“白”字,首先,按其发音bai查在汉字编码表中的位置,然后在bai范围内查“白”字,找到“白”字后,其汉字右侧的数字1655就是“白”的汉字编码.(2)关于多音字的查找由于汉字编码是一种无重码的汉字编码,所以多音字只有一个编码.在查多音字时,如果用某个音查不到,可换另外的音去查.例如:重庆的“重”和重量的“重”,字同音不同,汉字“重”的编码是按Zhong音编码的.