tensorflow2.3版本运行Python深度学习这本书上第六章的例程序出现字符解码错误


import os

imdb_dir = '/home/ubuntu/data/aclImdb'
train_dir = os.path.join(imdb_dir, 'train')

labels = []
texts = []

for label_type in ['neg', 'pos']:
    dir_name = os.path.join(train_dir, label_type)
    for fname in os.listdir(dir_name):
        if fname[-4:] == '.txt':
            f = open(os.path.join(dir_name, fname))
            texts.append(f.read())
            f.close()
            if label_type == 'neg':
                labels.append(0)
            else:
                labels.append(1)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-HGJ 2021-12-17 23:35
关注
在f = open(os.path.join(dir_name, fname))这句里，打开文件语句中指定编码方式。
添加 encoding='utf-8'或encoding='gbk'试试。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

tensorflow2.3版本运行Python深度学习这本书上第六章的例程序出现字符解码错误 keras python 有问必答深度学习
2021-12-17 13:45

回答 1 已采纳在f = open(os.path.join(dir_name, fname))这句里，打开文件语句中指定编码方式。添加 encoding='utf-8'或encoding='gbk'试试。
在python 2.5 的代码中出现的 “UR” 会导致程序错误，这是一个语法吗？应如何修改？ python 有问必答
2021-12-11 10:49

回答 1 已采纳字符串前加u,后面字符串以 Unicode格式进行编码 exp = U"我是中文字符串” 字符串前加r 去掉反斜杠的转移机制。（特殊字符：即那些，反斜杠加上对应字母，表示对应的特殊含义的，比如最常
python 客户端JSON解码错误 python 有问必答
2021-05-06 16:06

回答 4 已采纳可以转啊，没有问题 import json ss = b'[{"2021": ["2\\u67083\\u65e5\\u81f38\\u67086\\u65e5", "8\\u67087\\u6
黑马程序员3天带你玩转Python深度学习TensorFlow框架学习笔记
2022-06-01 17:27

wisdom_zhe的博客黑马程序员3天带你玩转Python深度学习TensorFlow框架学习笔记
python2.7 编码解码问题 python
2022-06-10 16:07

回答 1 已采纳 cahrdet有置信度的，换句话说，它也不是百分百自信检查出来的一定正确
Python程序的编码器无法解析如何解决？ python
2022-05-04 22:33

回答 1 已采纳在读取文件的时候注意反斜线会被Python误认为转义。在文件路径前加个小写字母 r 试试 txt=open(r"C:\Users\cpy\Desktop\ceshikeben.txt","r").re
Python程序设计开发基础任务六-1：文本文件操作 python 有问必答
2021-12-15 16:39

回答 1 已采纳编解码部分，分别用encode和decode,文件读写部分，使用open或 with open建立文件对象，指定模式和编码，read读取，write写入内容。 s='人生苦短我学Python' enc
python+TensorFlow实现人脸识别智能小程序的项目（包含TensorFlow版本与Pytorch版本）（一）
2023-08-26 22:02

郭庆汝的博客 python+TensorFlow实现人脸识别智能小程序的项目（包含TensorFlow版本与Pytorch版本）（一）
求助 python json解码出错 python
2021-05-06 13:55

回答 2 已采纳字符长度的问题，你传输的数据是用什么连接传输的呀，json解析数据的时候，有阈值，超过之后，切下来的数据是不规则的json数据所以会报错，tcp发包也有大小要求的！
python正则表达式匹配中文字符后面手机号码问题 python 正则表达式
2022-11-15 00:42

回答 2 已采纳你这里使用了^字符，这个表示从字符开头开始匹配，所以开头不是1[3-9]的都匹配不上
Python pop3连接出现:poplib.error_proto: b'-ERR Unknown message' python
2023-03-11 10:53

回答 1 已采纳可以查看手册：python-poplib --- POP3 协议客户端中的内容
Python - 字符串编解码
2022-06-24 21:22

伊织Scope的博客 Python 编解码，字节字符串
如何用python %s调用程序？ python
2021-12-19 16:30

回答 1 已采纳这个是带参数的 python 程序文件。VS 应该也有对应输入参数的设置pycharm 是这个位置比如这个这个程序命名为 work.py ，你要分析的文件是 doc1.txt一般就是去命令提
【Python技能树共建】字符编码与解码
2022-05-08 08:00

梦想橡皮擦的博客 Python 字符编码与解码是什么在 Python3 中字符默认编码是 Unicode 字符，而编码指的是将字符转换成字节流，解码是相反的操作。在正式开始前，我们还需要梳理一些基本概念 Python 中的字符串计算机中 8 比特（bit...
python 字符串获取倒数第二个_Python 学习第二篇：数据类型（字符串）
2020-12-06 12:12

weixin_39582569的博客 Python没有C语言的字符和字符串之分，只有字符串。从严格意义上说，字符串是单个字符的序列，支持基于位置的操作，能够通过位置索引字符；由于字符串具有不可变性，不能对原始的字符串进行修改，也就是说，不能通过...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月17日

悬赏问题

¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog
¥15 Excel发现不可读取的内容
¥15 关于#stm32#的问题：CANOpen的PDO同步传输问题
¥20 yolov5自定义Prune报错，如何解决？

tensorflow2.3版本运行Python深度学习这本书上第六章的例程序出现字符解码错误

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新