encoding 问题

这个情感词分析的代码我之前用别人转给我们的txt统计出来是没问题的。但是我自己从深交所爬年报pdf转成txt，然后再用的这个感情词分析代码一直统计不了，一直出code的问题，想问下大家这要怎么解决

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

10条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2023-11-18 22:23
关注
引自强大而免费的微信小程序：皆我百晓生。

这个问题出现在使用Python解码Unicode字符时遇到了无效的起始字节。可能是因为文本文件的编码与指定的'utf-8'编码不匹配。

你可以尝试以下解决方法：

确认文本文件的编码：使用文本编辑器（例如Notepad++）打开txt文件，并查看文件编码格式。确保你在代码中使用与文件编码匹配的正确编码。例如，如果文件编码为'gbk'，则应将代码中的'utf-8'更改为'gbk'。

使用错误处理：在使用open函数打开文本文件时，可以使用错误处理参数。例如，你可以尝试更改代码中的open函数为open(path, encoding='utf-8', errors='ignore')。这将忽略无效的字节而不抛出错误。

尝试不同的编码：如果上述方法都不起作用，尝试使用其他编码格式打开文件。可以尝试一些常用的编码格式，如'utf-8'、'gbk'、'latin-1'等。

检查文件完整性：确保从深交所爬取的pdf文件已正确转换为txt文件，并且文件没有损坏或损失任何字符。

希望以上解决方法能帮助你解决问题。如有需要，请提供更多信息以便我们提供更准确的帮助。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(9条)

报告相同问题？

关注问题

去编程语言：json编组
2014-09-18 18:10

回答 1 已采纳 This is a known issue with 1.3 of the go language. see https://code.google.com/p/go/issues/detail
用python语言解决字典问题 python
2021-11-28 22:40

回答 1 已采纳 d = {} with open('words.txt', 'r', encoding='utf-8') as f: for i in f.read().split('\n'):
表达式语言中文乱码问题
2009-03-27 09:49

回答 1 已采纳找到tomcat \conf 试试
Go编程语言.zip
2024-05-25 17:30

Go编程语言，也被称为Golang，是由Google在2009年推出的静态类型、编译型的编程语言。它的设计目标是提供一种简洁、高效、安全的编程方式，特别适合于构建大规模的分布式系统和网络服务。Go语言的语法结构清晰，强调...
使用`encoding / json`的默认值golang结构？
2016-08-26 07:33

回答 3 已采纳 You can't because in Go types do not have constructors. Instead, have either an explicit initiali
Go语言中的地图序列化和反序列化问题
2016-03-28 13:04

回答 1 已采纳 Decoding is a process that requires the encoded information which will be in buffer used for encod
自定义xml解码器问题
2014-10-06 15:34

回答 1 已采纳 Your code successfully captures the faultstring and faultcode, but then unintentionally overwrites
GB,Big5和UTF-8编码互换,vb用于网页和其它编程语言之间的数据据交换
2023-07-09 14:54

本文将深入探讨GB、Big5和UTF-8这三种编码体系，并重点讲解如何在VB（Visual Basic）环境下进行它们之间的转换，这对于网页开发和其他编程语言的数据交换至关重要。首先，我们来了解这三种编码： 1. **GB（GBK）...
docker libcontainer的导入问题
2014-12-09 20:23

回答 1 已采纳 I was building on OSX, which cannot be done when using libcontainer. After using a debian VM the w
Go语言程序错误[关闭]
2015-05-18 02:01

回答 2 已采纳 The output clearly tells you what is your problem. undefined: json.Marshall means that ther
为什么我的函数命令突然执行不了了呀？ python 开发语言
2022-01-25 13:52

回答 3 已采纳换个别的名字？
Java编程中中文问题的产生及其解决方案.pdf
2023-04-11 09:43

Java编程中的中文问题主要源于编码和解码过程中可能出现的不匹配。Java语言内部使用Unicode编码，这是一种能够表示世界上大部分字符的编码标准。然而，在不同环境下，操作系统、文件系统、文本编辑器等可能会采用...
hibernate的sessionFactory的问题
2014-08-08 17:35

回答 1 已采纳 no class found啊，亲有cglib包吗？
encoding-training：编程训练
2021-02-09 21:20

编码训练是提升个人编程技能的重要途径，尤其是在C、C++这样的语言中，熟练掌握编程技巧并能解决实际问题至关重要。本资源包"coding-training-main"似乎是一个针对编程训练的项目，包含了多个方面来帮助学习者深化对...
Go语言编程基础（高清视频教程） .rar
2022-01-21 15:02

Go语言，又称Golang，是由Google开发的一种静态类型的、编译型的、并发型的、垃圾回收的、C风格的编程语言。它旨在提高程序员的工作效率，特别适合构建大规模的网络服务和分布式系统。本教程“Go语言编程基础”通过...
【ASP.NET编程知识】ASP.NET MVC中解析淘宝网页出现乱码问题的解决方法.docx
2023-05-17 00:04

ASP.NET MVC 中解析淘宝网页出现乱码问题的解决方法在 ASP.NET MVC 中，解析淘宝网页出现乱码问题是非常常见的，今天我们就来探讨一下这个问题的解决方法。首先， lets 回顾一下乱码问题的原因。在 ASP.NET MVC 中...
编程语言javadoc转chm.pdf
2021-10-01 22:00

标题中的“编程语言javadoc转chm.pdf”指的是将编程语言的Javadoc文档转换成CHM（Compiled HTML Help）格式的教程。CHM是微软的一种帮助文档格式，它具有文件小巧、查阅便捷的特点，适用于软件的帮助文档。描述中...
计算机编程语言的代码——编码
2020-04-07 09:25

Atom_QQ2022313691的博客 UTF-16 UTF-16是Unicode字符编码五层次模型的第三层：字符编码表（Character Encoding Form，也称为 “storage format”）的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数（即码元）的序列，用于...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月18日

悬赏问题

¥15 Workbench中材料库无法更新，如何解决？
¥20 如何推断此服务器配置
¥15 关于github的项目怎么在pycharm上面运行
¥15 内存地址视频流转RTMP
¥100 有偿，谁有移远的EC200S固件和最新的Qflsh工具。
¥15 有没有整苹果智能分拣线上图像数据
¥20 有没有人会这个东西的
¥15 cfx考虑调整“enforce system memory limit”参数的设置
¥30 航迹分离，航迹增强，误差分析
¥15 Chrome Manifest扩展引用Ajax-hook库拦截请求失败

encoding 问题

10条回答 默认 最新

问题事件

悬赏问题

10条回答默认最新