按照字符读取 字节文件时 为什么不是把两个字节合并起来读取
如一个文件 内容是: "a我d" 0x(61 CE D2 64)四个字节.
用Reader类读取时 为什么第一个字符是 61 而不是 0x(61 CE)? 0x(61)是一个字节阿 可是Reader是按照字符(两个字节)处理
按照字符读取 字节文件时 为什么不是把两个字节合并起来读取
如一个文件 内容是: "a我d" 0x(61 CE D2 64)四个字节.
用Reader类读取时 为什么第一个字符是 61 而不是 0x(61 CE)? 0x(61)是一个字节阿 可是Reader是按照字符(两个字节)处理
收起
因为Reader在读输入流的时候做了编码转换。你的文件是GB2312/GBK编码的,而Java语言支持的char是UTF-16编码的。Reader系的类在不指定底层流的编码时会采用系统的默认编码,在中文Windows上是GBK;于是输入到Reader的是GBK的内容,中间经过转换,出来就变成Java内部统一的UTF-16了。GBK是变长多字节编码,GBK里“a”“我”“d”这是3个字符,Reader读取后对应的也变成UTF-16的3个字符。
报告相同问题?