Python中读取文件时出现UnicodeDecodeError: 'gbk' codec can't decode byte 0x8c如何解决？

在Python中读取文件时，如果遇到`UnicodeDecodeError: 'gbk' codec can't decode byte 0x8c`错误，通常是因为文件的实际编码与指定的编码不匹配。默认情况下，Python可能使用系统默认编码（如GBK）读取文件，但如果文件是其他编码格式（如UTF-8），就会引发解码错误。解决方法如下： 1. **明确文件编码**：先确定文件的实际编码格式，可以使用工具如`chardet`或`utf-8-detector`检测编码。 2. **指定正确编码**：在读取文件时，通过`open`函数的`encoding`参数指定正确的编码。例如： ```python with open('file.txt', 'r', encoding='utf-8') as f: content = f.read() ``` 3. **忽略或替换错误字符**：如果无法确定编码，可使用`errors`参数跳过问题字符，例如： ```python with open('file.txt', 'r', encoding='gbk', errors='ignore') as f: content = f.read() ``` 通过以上方法，可以有效避免因编码不匹配导致的`UnicodeDecodeError`错误。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

风扇爱好者 2025-05-05 23:00

关注

1. 问题概述

在Python中读取文件时，如果遇到UnicodeDecodeError: 'gbk' codec can't decode byte 0x8c错误，通常是因为文件的实际编码与指定的编码不匹配。Python默认可能使用系统编码（如GBK）读取文件，但当文件是其他编码格式（如UTF-8）时，就会引发解码错误。

为了解决这一问题，我们需要从以下几个方面入手：

明确文件的实际编码格式。
指定正确的编码参数。
处理无法确定编码的情况。

2. 明确文件编码

在解决编码问题之前，首先需要确定文件的实际编码格式。可以通过以下方法检测文件编码：

使用chardet库: chardet是一个流行的编码检测工具，能够自动检测文件的编码格式。
示例代码:


import chardet

with open('file.txt', 'rb') as f:
    raw_data = f.read()
    result = chardet.detect(raw_data)
    print(result['encoding'])

通过上述代码，可以获取文件的编码信息，例如输出可能是utf-8或gbk。

3. 指定正确编码

一旦明确了文件的实际编码格式，就可以在读取文件时通过open函数的encoding参数指定正确的编码。以下是具体步骤：

编码类型	适用场景	示例代码
UTF-8	广泛使用的国际标准编码	`with open('file.txt', 'r', encoding='utf-8') as f:`
GBK	中文环境下的常见编码	`with open('file.txt', 'r', encoding='gbk') as f:`

通过指定正确的编码，可以有效避免解码错误的发生。

4. 忽略或替换错误字符

在某些情况下，文件的编码可能非常复杂或者混合了多种编码，此时可以使用errors参数来忽略或替换无法解码的字符：


# 忽略无法解码的字符
with open('file.txt', 'r', encoding='gbk', errors='ignore') as f:
    content = f.read()

# 替换无法解码的字符为指定符号
with open('file.txt', 'r', encoding='utf-8', errors='replace') as f:
    content = f.read()

这种方法虽然不能完全解决编码问题，但在无法明确文件编码时，可以作为一种权宜之计。

5. 流程图

以下是解决UnicodeDecodeError问题的整体流程图：


graph TD;
    A[开始] --> B{是否明确编码};
    B --是--> C[指定正确编码];
    B --否--> D{是否需要忽略错误};
    D --是--> E[设置errors参数];
    D --否--> F[使用编码检测工具];
    F --> G[重新检测编码];
    G --> H[返回B节点];

通过上述流程，可以系统化地解决问题。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

Python读取文件时出现UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position ...
2021-12-28 11:37

weixin_52012241的博客 UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 165: illegal multibyte sequence 这种情况往往是因为编码的问题，主要通过改变打开文件的编码方式解决方法： 1、加一个编码方式解决上面...
Python读取文件时出现UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position xx: 解决方案
2021-06-01 22:48

Triumph19的博客 Python在读取文件时 ...UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 145: illegal multibyte sequence 此时有两种解决方案： 1.将第一条语法改为 with open('article.txt','rb') as f:
解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c in position : illegal multibyte sequence
2023-02-08 13:30

DEDSEC_Roger的博客 \Users\dedsec\.python_history`文件下（可以用命令`os.path.expanduser('~/.history')`获取该文件路径），每次启动交互式环境就会读取这个文件，使我们能调用历史命令，不过如果输入了中文，则会出现无法读取的问题...
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 出编码问题
2025-06-06 21:45

落月_无痕的博客摘要：在Python中处理文件时，建议将文件打开模式从默认的文本模式改为二进制模式('rb')以避免编码问题。当使用默认的with open(opt.data) as f:方式可能会遇到编码错误，应修改为with open(opt.data, 'rb') as f:。...
Python读取文件时出现UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position xx: 解决方案
2018-12-06 09:56

大美文的博客 python读取文件时出现编码问题时的解决方案出现以上问题时有两种解决方案加上open()，因为路径中有时会出现中文，也会导致编码错误，加上open()就不会报错了，在open()中加上’rb’，可以解决编码错误问题。('rb...
pycharm 读取文件出现错误UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c in position 3: illegal multib
2020-07-03 22:54

四六或的博客在实现python读取外部txt文件时，出现问题UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x8c in position 3: illegal multibyte sequence 通过百度，其他csdn博客主说是这里出现问题了将上面语句改成...
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 198: illegal multibyte sequence
2022-12-07 20:06

AI浩的博客在做YoloV5剪枝的时候，遇到如下问题; 读取data的yaml文件遇到了无法解析的字符。新版本的YoloV5，在yaml文件里有个小火箭的图标把这个删除掉就可以了
Python报错:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c in position 20: illegal multibyte...
2022-04-12 17:01

An efforter的博客 UnicodeDecodeError: 'gbk' codec can't decode byte 0x8c in position 20: illegal multibyte sequence
Python 报错 unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c
2024-03-21 22:43

SmallerFL的博客 Python 解决读取文件报错 “unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c”
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c in position 151: illegal multibyte sequence
2021-08-09 14:08

dropdropjack的博客 UnicodeDecodeError解释为Unicode的解码（decode）出现错误了，也就当前正在处理某种编码类型的字符串，是想要将该字符串去解码，变成Unicode，但是在解码的过程中发生错误了。解决办法使用windows-1252编码的...
python打开txt文件以gbk_python读取txt文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x8e in position...
2020-12-24 14:47

weixin_39966602的博客 python读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x8e in position 8: illegal multibyte sequence，如下代码：#coding:utf-8import shutilreadDir = "F:\\爬取数据\\11.txt"writeDir = "F:...
python打开文件出现UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 18: illegal multibyte
2020-04-09 09:44

top啦它的博客 f = open("C:/Users/top/PycharmProjects/untitled4/venv/wowo.txt",'r') print(f.read()) ...UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 18: illegal multibyte 只需将“r”改为...
解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 0: illegal multibyte sequence问题
2022-09-25 21:39

非零因子的博客 2、解决UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 0: illegal ...1、解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte。
Python报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 10
2021-08-19 20:02

_苏歌的博客 UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 10: illegal multibyte sequence 代码如下： # 打印歌词 file = open("歌曲.txt") # 读取文件 file_read = file.read() print(file_read) #...
编码问题UnicodeDecodeError: ‘gbk ‘ codec can‘t decode byte 0x80 in position 83: illegal multibyte
2023-04-19 17:18

小范好好学习的博客记录实习编程的问题，差点把15000张数据...之前在学校做实验跑代码也出现了这个问题，比较粗鲁的解决数据集而没有关注代码原因，数据集编码格式utf-8，应该在读取文件中声明编码格式，这属于计算机基本功不扎实的问题。
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multib
2020-05-07 13:04

阳阳阳～��的博客 python读取文件时提示"UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 205: illegal multibyte sequence" 解决办法1. f= open('data.csv','r', encoding='UTF-8') 解决办法2. f= open('...
python 读取文件时报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 5: illegal multib
2019-06-22 19:55

wanttifa的博客 python读取文件时提示"UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 5: illegal multibyte sequence" 解决办法1: FILE_OBJECT= open('order.log','r', encoding='UTF-8') 解决办法2： ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月5日