哪位大侠有unicode的汉字编码表 GB2312与unicode不是完全兼容,要转换的化,就需要有张对应表,对应表的大小与支持的汉字的多少有关系。我有张20000多汉字的对照表,显然是贴不上来的。
什么是unicode编码? Unicode码扩展自ASCII字元集。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽;而Unicode使用全16位元字元集。这使得Unicode能够表示世界上所有的书写语言中可能用于电脑通讯的字元、象形文字和其他符号。Unicode最初打算作为ASCII的补充,可能的话,最终将代替它。考虑到ASCII是电脑中最具支配地位的标准,所以这的确是一个很高的目标。Unicode影响到了电脑工业的每个部分,但也许会对作业系统和程式设计语言的影响最大。从这方面来看,我们已经上路了。Windows NT从底层支援Unicode。目前计算机中用得最广泛的字符集及其编码,是由美国国家标准局(ANSI)制定的ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),它已被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式。Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符,比如汉字\"经\"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换。
急!求hu(匈牙利语)的本地系统标准编码,以及对应的Unicode的codepage号?速求。。。 回应求助现代匈牙利文,使用拉丁字母,日常不严肃使用时,大体可以兼容包括英文在内的西欧latin-1完全兼容的本地编码,是latin-2,即ISO/IEC 8859-2。对应的unicode,也在拉丁字符区一起。旧匈牙利文,使用一些古图形,被收录在unicode的U+10C80.10CFF区。