day2862 2020-05-21 10:35 采纳率: 100%
浏览 1922
已采纳

java用UTF-8编码读取GBK编码的文本文件,将读取内容用GBK编码写文件,生成的文本文件为什么还是乱码?

1、如题。读写的时候操作的是字节,文本内容对应的16进制编码应该不会变,结果为何还是乱码。

2、在nodepad中先用ansi编码编写中文,然后转成UTF-8后乱码,但转回ansi又能正常显示。这和java先用错误编码读取,在用正确编码写文件的差别在哪呢。

有点迷惑,希望大神解答,谢谢!

  • 写回答

2条回答 默认 最新

  • 关竹 2020-05-21 12:32
    关注

    因为你在java里对文件内容,在乱码的基础上进行了再编码,这个时候输出的结果已经不是原文件的内容了。
    你可以输出一下前后的二进制码比对以下看看。
    而在nodepad里,是对同样的二进制进行不同的组合来满足不同的编码需求,最底层的二进制码没有变,只是读的方式变了。

    编码可以看作是一种加密方式,原先的文件已经经过了一次gbk加密,你用utf-8去解密,得到了乱码,再对乱码进行gbk加密,得到的自然不是原来的结果。如果要回到原来的内容,只要进行utf-8解码就好了。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥50 关于#html5#的问题:H5页面用户手机返回的时候跳转到指定页面例如(语言-javascript)
  • ¥15 无法使用此凭据登录,因为你的域不可用,如何解决?(标签-Windows)
  • ¥15 yolov9的训练时间
  • ¥15 二叉树遍历没有报错但无法正常运行
  • ¥15 在linux系统下vscode运行robocup3d上场球员报错
  • ¥15 Python语言实验
  • ¥15 SAP HANA SQL 增加合计行
  • ¥20 用C#语言解决一个英文打字练习器,有偿
  • ¥15 srs-sip外部服务 webrtc支持H265格式
  • ¥15 在使用abaqus软件中,继承到assembly里的surfaces怎么使用python批量调动