pythom 中文显示乱码？

#需求：获取三国演义小说所有的章节标题和章节内容
#地址：https://www.shicimingju.com/book/sanguoyanyi.html


import lxml
import requests
from bs4 import BeautifulSoup

if __name__ == "__main__":
    url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
    headers = {
        'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 88.0.4324.182 Safari / 537.36 Edg /88.0.705.81'
    }
    page_text = requests.get(url,headers=headers).text
    print（page_text）

到这里爬取到的网页中文显示是乱码
原网页编码显示为‘UTF-8’，
尝试用page_text.encoding = "utf-8"，但是就直接报错

   用 print(type(page_text))，查看显示数据类型为str 。

展开全部

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
多鱼的夏天 2021-03-04 15:09
关注
page_text是返回的text，没有encoding属性

两种方法解决编码问题

方法一

url='https://www.shicimingju.com/book/sanguoyanyi.html' r = requests.get(url) html=r.content html_doc=str(html,'utf-8')

方法二

url='https://www.shicimingju.com/book/sanguoyanyi.html' r=requests.get(url) r.encoding='utf-8' print(r.text)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 2
无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

python读txt文件中文乱码 python 有问必答
2021-06-02 04:53

回答 5 已采纳把GBK改成UTF-8试一下，还有就是你的txt文档的编码格式不对。
python爬虫中网页出现乱码如何解决？ python
2021-09-21 14:16

回答 1 已采纳 request.encoding = request.apparent_encoding
为什么我用pythen爬取百度显示汉字乱码？ python 有问必答
2021-07-01 12:13

回答 3 已采纳获取requests.get()请求数据之后要先用 res.encoding='utf-8' 设置内容的编码再取 res.text 内容 res=requests.get(f'http://www.x
linux下python中文乱码解决方案详解
2020-09-14 14:55

本篇文章将深入探讨如何解决Linux下Python中文乱码的常见问题，并提供实际操作的解决方案。首先，问题通常出现在当Python程序需要显示或输出包含中文字符的数据，例如在使用matplotlib库绘制图表时。一个具体的...
python报错，乱码了 python
2021-09-27 03:16

回答 1 已采纳你的错误出现在这一行里面,你的templateVocab应该是个字典,但是在直接取值的时候出现了字典中没有的值,才会报错,你的意外值就是报错的最后一行红字,解决方法是使用get函数 templateV
PYTHON保存中文到SQLSERVER乱码 python sqlserver
2022-08-22 05:02

回答 5 已采纳 StoreProductCategory = StoreProductCategory.encode("latin-1", errors="ignore").decode("gbk", errors=
Python解决乱码问题 python
2021-12-13 17:14

回答 2 已采纳这种情况应该用:html=resp.content.decode("gbk")
python查询mysql中文乱码问题
2020-09-10 03:56

Python查询MySQL时遇到的中文乱码问题是一个常见的编程困扰，特别是在使用Python 2.7版本时更为突出。本文将深入探讨这个问题的成因，并提供一套详细的解决方案。首先，我们需要了解问题的根本原因。当Python与...
想请教一下python爬虫中文乱码问题 python 有问必答正则表达式
2021-07-02 14:54

回答 3 已采纳教你一招，请求数据之前先右键查看网页源代码，看看最上面的charset是啥，一般都是utf-8或者gbk的，要按它给的写程序，你这个网页是utf8编码，所以可以这样写，参考： import reque
Python 爬虫乱码 python 开发语言
2023-01-25 05:07

回答 3 已采纳有点怪，源代码在我的环境里运行后，没有乱码。想了想，有可能是如下原因导致乱码：（1）在用户未知的情况下，环境自动按某种格式编译了内容，然后在反复、不对应的编译格式转换下出现乱码。（2）指定的编码格
python爬取基金净值导出CSV文件后中文显示乱码 python 有问必答
2022-02-14 07:47

回答 4 已采纳指定read_html的编码。 import pandas as pd import csv for i in range(1,2): url = 'https://fundf10.ea
python图片显示中文_python图片中文乱码怎么办？
2020-12-08 04:50

weixin_39910824的博客 python图片中文乱码一般有修改默认配置信息和修改当前程序字体两种方式。方法是：1、找到matplotlibrc文件所在路径并修改font和minus；2、在当前程序修改rcParams的font参数和minus参数。解决方式一：import...
python操作mysql中文显示乱码的解决方法
2020-09-10 04:12

在Python编程语言中，与MySQL数据库进行交互时，有时会遇到中文字符显示为乱码的问题。这通常是由于编码不一致导致的。以下是一些解决Python操作MySQL时中文乱码问题的关键步骤和方法： 1. **Python文件编码设置**...
解决c++调用python中文乱码问题
2021-01-19 15:50

windows中文操作系统下，vs的c++项目默认编码是GB2312 python默认是utf-8编码最好在c++程序顶上加： #pragma execution_character_set(“GB2312”) c++中的字符串一定就是gbk编码传入python前要做编码转换准备一...
Python转译日文乱码（txt文件内容）
2023-03-04 06:16

拖动日文乱码txt文本到exe启动程序上，自动将其内容中的乱码转译为正常日文，注意乱码文本中不可含有非乱码的中文、txt文本不可为utf-8编码、也不能用该程序打开体积过大的文本文件！如需拖动到py文件上启动，请...
没有解决我的问题, 去提问

悬赏问题

¥100 IED中交流采样通道、以及程序流程的设计
¥15 我如果只想表示节点的结构信息，使用GCN方法不进行训练可以吗
¥15 GPTs营销指令提示词和创建方案
¥15 QT6将音频采样数据转PCM
¥15 本地安装org.Hs.eg.dby一直这样的图片报错如何解决？
¥15 下面三个文件分别是OFDM波形的数据，我的思路公式和我写的成像算法代码，有没有人能帮我改一改，如何解决？
¥15 Ubuntu打开gazebo模型调不出来，如何解决？
¥100 有chang请一位会arm和dsp的朋友解读一个工程
¥50 求代做一个阿里云百炼的小实验
¥15 查询优化：A表100000行，B表2000 行，内存页大小只有20页，运行时3页，设计两个表等值连接的最简单的算法

pythom 中文显示乱码？

1条回答 默认 最新

悬赏问题

1条回答默认最新