UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 8 中文字符无法进行decode('gbk')解码

读取文件：

fbook1 = open("MOOC PYTHON\TeleAddressBook.txt","rb")

对元素进行解码并添加进列表：

list1_name.append(str(elements[0].decode('gbk')))

报错：

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 8: incomplete multibyte sequence

请问大家如何解决这个无法decode的问题
完整代码（合并两个文件）如下：

fbook1 = open("MOOC PYTHON\TeleAddressBook.txt","rb") # 二进制读取 因为文件中有中文，所以避免乱码用rb
fbook2 = open("MOOC PYTHON\EmailAddressBook.txt","rb")

fbook1.readline() # 跳过第一行
fbook2.readline()
lines1 = fbook1.readlines()
lines2 = fbook2.readlines()

list1_name = [] # 建立空列表来存储姓名电话email
list1_tele = []
list2_name = []
list2_email = []

for line in lines1:
    elements = line.split() # 用空格区分的元素
    list1_name.append(str(elements[0].decode('gbk'))) # 姓名和电话分别储存临时列表 中文字符进行decode('gbk')解码
    list1_tele.append(str(elements[1].decode('gbk')))
for line in lines2:
    elements = line.split() 
    list2_name.append(str(elements[0].decode('gbk'))) # 姓名和电话分别储存临时列表 中文字符进行decode('gbk')解码
    list2_email.append(str(elements[1].decode('gbk')))

# 合并处理
lines = []
lines.append('姓名\t  电话\t   邮箱\n') # \t 空格
# 处理列表1
for i in range(len(list1_name)):
    s = ''
    if list1_name[i] in list2_name:
        j = list2_name.index(list1_name) # 找到姓名列表1对应列表2中的姓名的位置序号！
        s = '\t'.join([list1_name[i], list1_tele[i], list2_email[j]]) # join([]) 这个[]是干嘛的
        s += '\n'
    else:
        s = '\t'.join([list1_name[i], list1_tele[i], str('    -----    ')])
        s += '\n'
    lines.append(s)
# 处理列表2中剩下的没有遍历的姓名
for i in range(len(list2_name)):
    s = ''
    if list2_name[i] not in list1_name:
        s = '\t'.join([list2_name[i], str('    -----    '), list2_email[i]])
        s += '\n'
    lines.append(s)
# 将新生成的合并数据写入新的文件中
fbook3 = open('MOOC PYTHON\AddressBook.txt','w')
fbook3.writelines(lines)

fbook1.close()
fbook2.close()
fbook3.close()
print('The addressBooks are merged!')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
想上天的狗 2021-10-08 02:06
关注
open("MOOC PYTHON\EmailAddressBook.txt","rb")

改为

open("MOOC PYTHON\EmailAddressBook.txt","rb",encoding='utf-8')

要是utf-8不行的话，你可以改成其他的试试，uft-8-sig,bytes,gbk等等
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 0: invalid start byte flask python
2022-04-04 11:44

回答 2 已采纳不是应该用二进制模式传吗 with open(image_loca_path,"rb") as f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0x93 in position 596: illegal multibyte sequence nlp python
2023-02-12 23:40

回答 3 已采纳在第5行中，应将open函数的参数改为'rb'；在第13行中，应将print函数的参数改为len(ws.vocab)；在第14行中，应将open函数的参数改为'wb'；经过修改后，代码如下：
UnicodeDecodeError: 'gbk' codec can't decode byte 0xb0 in position 18: illegal multibyte sequence python
2021-12-27 10:34

回答 6 已采纳这个CSV到底时啥编码呀。发邮件给我看看。hndm@qq.com
【Python】成功解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 45: illegal multibyte
2024-06-13 20:14

高斯小哥的博客 **【Python攻略】告别UnicodeDecodeError，解码GBK不是梦！** 遭遇UnicodeDecodeError，你是否感到头大？不用担心，本文带你轻松...#Python编码问题 #UnicodeDecodeError #GBK解码 #字符编码理解 #编码规范 #最佳实践
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8f in position 22: invalid start byte python 有问必答
2021-10-24 09:55

回答 2 已采纳直接用pandas的read_excel导入成为一个数据框，试下看看。
Python，UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 0: invalid start byte eclipse python
2019-11-27 14:43

回答 2 已采纳 wb 改为w是试下 ``` fb = open('./report/test.html', 'w') ```
python3，Win环境下报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd3 in position 2: invalid cont python
2021-08-08 21:50

回答 2 已采纳我来解释一下，你发送的内容是中文，所以用gbk替换掉utf-8，程序都改为gbk就好了如果明白了，点击右上角给个采纳哦~
【Python】解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9A in position xxx: illegal multibyte
2024-06-12 15:58

云天徽上的博客这个错误提示是由于文件编码与读取时指定的编码不一致导致的。要解决这个问题，可以指定正确的编码、使用错误处理机制、用二进制模式读取...在编写处理文本文件的Python代码时，了解并正确处理文件编码是非常重要的。
UnicodeDecodeError：“gbk”编解码器问题 pycharm python 有问必答
2021-11-29 23:08

回答 3 已采纳题主这个代码从哪搞来的，应该好老了。采集的这个页面已经不存在了，跳转到http://quote.eastmoney.com/center/gridlist.html#hs_a_board这个页面，这个
python 3.8安装第三方包（pip install）报 unicodedecodeerror错误，请教！ python windows
2022-08-05 17:25

回答 1 已采纳把你的-r去掉
django启动服务时报错 UnicodeDecodeError: 'utf8' codec can't decode byte 0xcb django python
2019-04-19 00:26

回答 2 已采纳代码含有中文，并且所在py文件开头未添加编码声明
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9a in position 27: illegal multibyte sequence怎么办
2024-02-04 16:10

嘬一口冰美式的博客 UnicodeDecodeError: 'gbk' codec can't decode byte 0x9a in position 27: illegal multibyte sequence怎么解决。
使用pip instal -r requirements.txt安装的时候报错如下： python 有问必答
2022-03-26 18:10

回答 2 已采纳把 requirements.txt 贴出来研究一下一般来说 requirements.txt 只包含库及版本试试修改下 requirements.txt pip
【yolo系列报错：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x98 in position 1093】
2023-08-11 16:43

落叶霜霜的博客这应该是windows特有的问题，因为win的默认编码方式为utf-8，而Python读入文本文件的默认编码方式为gbk。直接下载的源码一般没有任何问题，需要修改系统变量的python读取格式。直接修改yolov7的yaml为下面，粘贴即可...
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x98 in position 1093: illegal multibyte sequence
2022-07-01 17:10

活成自己的样子啊的博客 UnicodeDecodeError: 'gbk' codec can't decode byte 0x98 in position 1093: illegal multibyte sequence
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x8c in position 151: illegal multibyte sequence
2021-08-09 14:08

dropdropjack的博客 UnicodeDecodeError解释为Unicode的解码（decode）出现错误了，也就当前正在处理某种编码类型的字符串，是想要将该字符串去解码，变成Unicode，但是在解码的过程中发生错误了。解决办法使用windows-1252编码的...
解决：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x81 in position 18: illegal multibyte sequence
2022-07-26 14:30

Funing7的博客意思就是：UnicodeDecodeError：'gbk'编解码器无法解码位置18中的字节0x81：非法的多字节序列。这是我使用python发送邮件的时候出现的报错信息我编码格式使用的是utf-8并不是gbk ，但是却无法解码于是我回头看...
UnicodeDecodeError : 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence
2019-02-23 16:27

Williams Yan的博客 UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence 解决方案：经过分析错误原因是因为“gbk”编解码器无法解码文件中的部分字符串，加入红色字符串，...
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x83 in position 38: illegal multibyte sequence
2021-10-09 23:02

猿栈老许的博客 UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x83 in position 38: illegal multibyte sequence 在练习一个读取txt的练习时，出现了这样一个错误，错误的意思是：Unicode的解码（Decode）出现错误（Error...
UnicodeDecodeError: 'gbk' codec can't decode byte 0x82 in position 66: illegal multibyte sequence
2019-08-09 23:50

qq_41629976的博客 file_in=“C:\Users\Administrator\Desktop\parking datum.txt” data=’’ fbegin=0 fend=0 d=’’ with open(file_in,“r”) as file: for i in file.readlines(): for e in i: if e==’"’: continue; if e==’}...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月8日

悬赏问题

¥15 python实现CAD识图
¥15 如何实现在renpy中创建并应用不同大小尺寸对话框？
¥15 table表格有一列是固定列滑动到最下面时固定的那一列有几行没显示出来
¥20 单细胞数据注释时报错
¥20 dify工作流分析sql查询结果
¥15 vscode编译ros找不到头文件，cmake.list文件出问题，如何解决？(语言-c++|操作系统-linux)
¥15 通过AT指令控制esp8266发送信息
¥15 有哪些AI工具提供可以通过代码上传EXCEL文件的API接口，并反馈分析结果
¥15 二维装箱算法、矩形排列算法（相关搜索：二维装箱）
¥20 nrf2401上电之后执行特定任务概率性一直处于最大重发状态

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 8 中文字符无法进行decode('gbk')解码

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新