ZKX's LAB

在计算机领域中,ASCII码用一个字节来表示一个字符,汉字编码用两个连续的字节来表示一个汉字 汉字编码采用几个字符

2021-04-06知识5

<信息交换用汉字编码字符集基本集>有几个汉字和图形符号 GB2312码是中华人民共2113和国国家汉字信息交换用编码,全5261称《信息交换用汉4102字编码字符集-基本集》,1653由国家标准总局发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中汉字占6763个。GB2312规定\"对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为\"高字节”,第二个字节为\"低字节”。GB2312-80包含了大部分常用的一、二级汉字,和9区的符号。该字符集是几乎所有的中文系统和国际化的软件都支持的中文字符集,这也是最基本的中文字符集。其编码范围是高位0xa1-0xfe,低位也是0xa1-0xfe;汉字从0xb0a1开始,结束于0xf7fe。GB2312将代码表分为94个区,对应第一字节(0xa1-0xfe);每个区94个位(0xa1-0xfe),对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区(0xb0-0xf7),10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个。

中文字符编码采用 那编码可多了。一般纯英文单字节字符都用ascii码。汉字是双字节字符,常见的编码有gb2312,gbk,utf8.另外还有ISO组织推出的unicode

在计算机领域中,ASCII码用一个字节来表示一个字符,汉字编码用两个连续的字节来表示一个汉字 B ASCII用一个字节表示,汉字用两个字节,1KB可以存1024个ASCII,存512 个汉字。所以是2:1

#python字符编码汉字#汉字编码采用几个字符

随机阅读

qrcode
访问手机版