没有小蛋糕 2021-09-29 23:12 采纳率: 33.3%

浏览 61

pandas导入时utf-8编码报错，使用gbk编码后在分词的时候报错，这可咋整？

如果使用encoding=utf-8，报错如下

将导入时encoding改成GBK
split的时候报错

stop=[]
text=[]
after_text=[]
file_stop=r"D:\stopword（停用词）.txt"
file_text=r"D:/简历表.csv"
with open(file_stop, "r", encoding="GBK") as f:
    for line in f.readlines():
        lline=line.strip()
        stop.append(lline)
with open(file_text, "r", encoding="GBK") as f:
    print(f.readlines())
    for line in f.readlines():
        lline = line.split()
        for i in lline :
            if i not in stop:
                after_text.append(i)
print(after_text)
with open(r"D:\新桌面\前端\训练数据\训练数据\stop.txt","w+") as f:
    for i in after_text:
        f.write(i)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Lyna Tlncgbnn 2021-09-30 16:42
关注
用pandas 自带的读取函数，里面有属性调整读取格式，可以网上查一下

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月29日

悬赏问题

¥20 微信h5网页如何静默获取到用户的基本信息（头像昵称）
¥15 有做通信软件的技术团队吗
¥15 如图所示交换机网络该如何规划配置
¥15 CUDA driver error
¥15 Dijkstra 算法的堆优化方法
¥15 师哥师姐们，如何帮我下载一下python？
¥15 Office版本升级，Oracle连接报错
¥20 利用python搜索PDF文件中是否存在1
¥15 ImportPathMismatchError
¥15 滤波器这个效果是对的么