JAVA任意文件转码成utf-8

JAVA将任意编码方式的文件转成编码方式为utf-8的文件,请问怎么实现,请各位大佬指点

3个回答

1 要自动判断出文件的格式:
确定文件是
ANSI
GBK
UTF-16
UTF-8 with BOM
UTF-8
...

要识别这些特征的话,比如中文GBK,根据中文的编码规则,进行匹配,如果匹配上了,可能是GBK。
还要继续匹配其他的格式,如果最终匹配到两个类型,那么就不好选了,当文档的字符很少的时候,会出现这样的情况。
确定了文档格式,那么转化就是调用API的事了。

识别文档格式要看GBK,UTF-16 ,UTF-8 with BOM,UTF-8,UTF-32 还有其他的格式,知道这些格式定义规则,就能识别。

希望对你有帮助.

http://www.cnblogs.com/yejg1212/p/3402322.html 这样这个方法识别出文件编码,然后 new String(str.getBytes("识别出文件编码"),"UTF-8")

这种东西基本上很不稳,容易翻车,而且实现上确实比较难

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问
相关内容推荐