python的pathlib怎么读中文文本

python读文件时候报错，报错内容为UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 20: illegal multibyte sequence，去百度了还是没找到方法。代码内容大致就是from pathlib import Path,txt文本里面的内容就古诗就朝辞白帝彩云间那个，我print出来报错说gbk编码没办法读，但我在括号里加上encoding='utf-8'也不行，百度了好久都是说用with open as file的方式来改成utf-8的方式，但有没有path方式的呀，就不要用with open的，help！！！！！！！！！！！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
无疆76 2024-11-09 17:26
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

在Python中，使用pathlib模块读取文件时遇到UnicodeDecodeError通常是因为文件的实际编码与读取时指定的编码不匹配。从您提供的报错信息和文件内容来看，文件内容似乎是以UTF-8编码的，但在读取时可能默认使用了GBK编码，导致解码错误。

对于pathlib中的Path.read_text()方法，您可以直接通过传递encoding参数来指定编码。您应该尝试使用UTF-8编码读取文件，像这样：

path = Path("./content.txt") content = path.read_text(encoding='utf-8') # 显式指定使用UTF-8编码读取文件 print(content)

这样应该可以正确读取文件内容，而不会导致UnicodeDecodeError。请尝试这种方法并看看是否能够解决您的问题。

另外，如果您不确定文件的实际编码，您可以使用一些工具或库（如chardet）来检测文件的编码，然后再使用相应的编码读取文件。这样也可以避免编码错误。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容