java读取一GBK文本文件跳过一段字节乱码如何处理

用JAVA读取一个用GBK编码的文本文件时，需要跳过一段字节，比如1000 从第1001个字节开始读取。那么在这儿就有可能出现乱码， new String(字节数组,1000,"gbk");
因为第1001个字节可能是一个字符的高字节，有可能是上一个字符的低字节，如过是高字节那么就正常，反之new String(字节数组,1000,"gbk")这个构造的字符窜就会出现乱码，

这个问题困惑住小弟很久了， 请教哪位仁兄或前辈给予指教，谢谢！

这是目前我查到的一点资料:\
GBK的整体编码范围是为0x8140-0xFEFE，不包括低字节是0×7F的组合。高字节范围是0×81-0xFE，低字节范围是0x40-7E和0x80-0xFE。

if 0x81&=ch1&=0xFE and (0x40&=ch2&=0x7E or 0x7E&=ch2&=0xFE): #is gb char 这个语句只能判断这两个字节所表示的字符是不是一个GBK字符而不能区分出我所遇到的问题.

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
iteye_4573 2010-05-18 20:25
关注
试下转成unicode

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Java读取TXT文本文件乱码解决方案.doc
2021-09-30 22:59

"Java读取TXT文本文件乱码解决方案" Java 读取 TXT 文本文件乱码解决方案中，主要讨论的是在 Java 中读取 TXT 文本文件时出现乱码的问题，并提供了解决方案。首先，文章中提供了一个简单的读取 TXT 文件的代码，...
Java读取TXT文本文件乱码解决方案(1).doc
2025-07-23 03:04

Java在读取TXT文本文件时可能会遇到乱码问题，这种现象往往与字符编码不匹配有关。在上述提供的文件中，详细介绍了Java读取TXT文件时出现乱码的解决方案。首先，当Java程序在读取TXT文本文件时遇到乱码，通常是...
Java读取、写入文件如何解决乱码问题
2020-09-03 11:22

文件可能使用了特定的字符编码（例如UTF-8、GBK等），而Java程序在处理这些文件时没有正确识别或指定这个编码，从而导致乱码。解决这个问题的关键在于理解和正确处理字符编码。首先，我们要理解文本文件和二进制...
Java读取TXT文本文件乱码解决方案.pdf
2022-11-26 19:14

在 Java 中，当读取文本文件时，默认使用的是平台的默认编码，这在处理某些特定编码的文件时可能会引发乱码。以下是针对这个问题的详细解释和解决方案。 1. **乱码产生的原因**： - 当文本文件的编码格式与 Java ...
Java读取TXT文本文件乱码解决方案.docx
2022-11-26 19:14

Java 读取 TXT 文本文件时遇到乱码问题通常是由于编码格式不匹配导致的。在 Java 中，当读取文本文件时，默认使用的是平台的默认编码，这在处理非 ASCII 字符时可能会出现问题，尤其是当文件采用不同编码（如 UTF-16...
java 逐行读取txt文本如何解决中文乱码.rar
2023-07-10 22:34

在Java编程中，读取文本文件是常见的任务，特别是对于txt格式的文本文件。然而，当文本文件包含中文字符时，如果没有正确处理编码问题，可能会出现中文乱码的情况。本篇将深入探讨如何使用Java有效地逐行读取含有...
java 逐行读取txt文本如何解决中文乱码
2020-09-05 17:35

在Java编程中，读取包含中文字符的TXT文本文件时，由于编码不一致或处理不当，经常会出现中文乱码的问题。解决这个问题的关键在于理解和统一文本的编码格式。以下是详细的步骤和示例代码来帮助初学者解决这个困扰： ...
Java 解决字符流读取文本文件中文乱码情况
2024-04-12 17:54

剑指25校招的博客问题截图：问题分析：在window操作系统中文本文件的编码集默认是UTF-8，而Java中使用的编码格式也是UTF-8，与之对应，所以在不对文本文件进行修改的情况下是不会出现中文乱码的情况。仔细检查文本的编码格式发现...
java读取txt文件内容乱码_java读取txt文件乱码解决方法
2021-02-27 19:05

吴前锐的博客 java读取txt文件，如果编码格式不匹配，就会出现乱码现象。所以读取txt文件的时候需要设置读取编码。txt文档编码格式都是写在文件头的，在程序中需要先解析文件的编码格式，获得编码格式后，在按此格式读取文件就...
java读取文件是乱码_java读取txt文件乱码解决方案
2021-02-12 13:18

weixin_39618597的博客因为txt默认的选项是ANSI，即GBK编码。GBK和GB2312都是中文编码，在这里解释一下两者的区别。总体说来，GBK包括所有的汉字，包括简体和繁体。而gb2312则只包括简体汉字。GBK: 汉字国标扩展码,基本上采用了原来GB2312...
没有解决我的问题, 去提问

java读取一GBK文本文件 跳过一段字节 乱码如何处理

1条回答 默认 最新

java读取一GBK文本文件跳过一段字节乱码如何处理

1条回答默认最新