day2862 2020-05-21 10:35 采纳率: 100%
浏览 1901
已采纳

java用UTF-8编码读取GBK编码的文本文件,将读取内容用GBK编码写文件,生成的文本文件为什么还是乱码?

1、如题。读写的时候操作的是字节,文本内容对应的16进制编码应该不会变,结果为何还是乱码。

2、在nodepad中先用ansi编码编写中文,然后转成UTF-8后乱码,但转回ansi又能正常显示。这和java先用错误编码读取,在用正确编码写文件的差别在哪呢。

有点迷惑,希望大神解答,谢谢!

  • 写回答

2条回答 默认 最新

  • 关竹 2020-05-21 12:32
    关注

    因为你在java里对文件内容,在乱码的基础上进行了再编码,这个时候输出的结果已经不是原文件的内容了。
    你可以输出一下前后的二进制码比对以下看看。
    而在nodepad里,是对同样的二进制进行不同的组合来满足不同的编码需求,最底层的二进制码没有变,只是读的方式变了。

    编码可以看作是一种加密方式,原先的文件已经经过了一次gbk加密,你用utf-8去解密,得到了乱码,再对乱码进行gbk加密,得到的自然不是原来的结果。如果要回到原来的内容,只要进行utf-8解码就好了。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥15 安装svn网络有问题怎么办
  • ¥15 Python爬取指定微博话题下的内容,保存为txt
  • ¥15 vue2登录调用后端接口如何实现
  • ¥65 永磁型步进电机PID算法
  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥15 latex怎么处理论文引理引用参考文献