ZKX's LAB

让java识别汉字编码 关于java处理汉字的问题。

2021-04-24知识2

java 使用什么字符集是什么 Java语言所使用的字符集是16位Unicode编码。另外再介绍一些常见的字符集:1、最早在dos下写pascal的时候,就遇到ASCII字符集,后来还是dos下写c,也是ascii字符集特点:目前最通用的单字节编码字符集表示:单字节最早ascii用7bit表示,总共能表示2^7=128个字符,后来扩展到8bit,就表示2^8=256个字符2、GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981年5月1日实施。特点:当然是能表示99%的中国汉字,还包括拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母等表示:双字节3、GBK是汉字编码标准之一,全称《汉字内码扩展规范》,GBK 向下与GB2312编码兼容,向上支持ISO10646.1国际标准。可以认为GBK是在GB2313基础上通过内码扩展出来的一个标准。特点:完全兼容GB2312标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字表示:双字节4、Big5,台湾那边使用比较多。5、GB 18030,全称是GB18030-2000《信息交换用汉字编码字符集基本集的扩充》,是我国政府于2000年3月17日发布的新的汉字编码国家标准,2001年8月31日后在。

java读取含有unicode编码的文件内容,并转换成汉字? 可以通过BufferedReader 流的形式进行流缓存,之后通过readLine方法获取到缓存的内容。BufferedReader bre=null;try {String file=\"D:/test/test.txt;bre=new BufferedReader(new FileReader(file));此时获取到的bre就是整个文件的缓存流while((str=bre.readLine())。null)/判断最后一行不存在,为空结束循环{System.out.println(str);原样输出读到的内容(unicode会自动转换为中文的)};备注:unicode不需要转换的,直接输出即可,会自动变成中文,如:System.out.println(\"\\u0061\\u0062\\u6c49\\u5b57\");结果就是:ab汉字。

java编码 我写了个fixString方法可以把s,转化成汉字,然后你在比较,不就可以了public class t {public static void main(String[]args){String s=\"%u4e2d%u56fd;“中国”的Unicode编码s=s.replaceAll(\"%\",\"\\\\\\\\\");System.out.println(\"s=\"+s);结果是s=\\u4e2d\\u56fdString s2=\"\\u4e2d\\u56fd;System.out.println(\"s2=\"+s2);结果是“s2=中国”System.out.println(fixString(s).equals(s2));}static String fixString(String s){while(true){int index=s.indexOf(\"\\\\u\");if(index。1){String s1=s.substring(index,index+6);if(s1.matches(\"\\\\\\\\u[0-9A-Fa-f]{4}\")){char c=(char)Integer.parseInt(s1.replace(\"\\\\u\",\"\"),16);s=s.substring(0,index)+c+s.substring(index+6);}} else {break;}}return s;}}

#让java识别汉字编码#java汉字编码

随机阅读

qrcode
访问手机版