爬出的网页内容是乱码

用python爬出的网页内容是乱码的怎么回事，该怎么改呀求告知

import requests
from bs4 import BeautifulSoup

def get_novel_chapter():
    root_url = 'https://fanqienovel.com/page/7377020139255893054?enter_from=search'
    response = requests.get(root_url)
    response.encoding = 'utf-8'
    soup = BeautifulSoup(response.text, 'html.parser')
    data = []
    for chapter in soup.find_all('div', class_='chapter-item'):
        link = chapter.find('a')
        if not link:
            continue
        data.append(("https://fanqienovel.com%s"%link['href'],link.get_text()))
    return data

def get_chapter_content(url):
    response = requests.get(url)
    response.encoding = 'utf-8'
    soup = BeautifulSoup(response.text, 'html.parser')
    return soup.find('div', class_='muye-reader-content noselect').get_text()


for chapter in get_novel_chapter():
    url, title = chapter
    with open("%s.txt"%title,"w",encoding='utf-8') as fout:
        fout.write(get_chapter_content(url))
    break

输出的结果是乱码的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
九月镇灵将 2024-09-25 16:24
关注
这个不是响应数据编码问题，而是某茄小说有字体反爬，你需要拿到对应的字体文件得到字体映射字典，然后一一映射才能拿到正常的文本

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

pycharm爬虫生成HTML文件时里面内容中文乱码 pycharm python 爬虫
2022-11-14 00:35

回答 2 已采纳保存时用utf-8编码with open("mybaiodu.html",mode = "w",encoding="utf-8") as f
为什么我爬取的内容是乱码 python 爬虫
2022-05-31 21:10

回答 2 已采纳这行去掉就行了 res.encoding='utf-8'
关于爬虫response出现乱码 python 开发语言有问必答爬虫
2022-11-12 10:11

回答 4 已采纳 session.post(hfUrl, headers=hfHeader, data=hfData, params=hfParam).content.decode('对方网站的编码，比如gbk或者ut
3种Python爬虫中文乱码的处理方法
2024-08-08 17:59

编程阿布的博客 Python爬虫在抓取网页数据时，经常会遇到中文乱码问题。这通常是因为网页的编码格式与Python处理时使用的编码格式不一致导致的。以下是三种常见的处理中文乱码的方法，并附上相应的代码示例。
python爬虫中网页出现乱码如何解决？ python
2021-09-21 22:16

回答 1 已采纳 request.encoding = request.apparent_encoding
爬虫程序返回值只有中文是乱码 python 爬虫
2021-09-15 13:49

回答 2 已采纳帮你修改了下 import requests from bs4 import BeautifulSoup #爬取所有的章节标题和章节内容 # https://www.xbiquge.la/13/13
网页显示正常，源代码是乱码 asp.net html5 python
2021-04-18 19:07

回答 1 已采纳这个网站单独给乱码部分写了特殊的字体来显示。。要还原有点难搞。。没研究过字体，一定要还原简单粗暴的方法做个文字对应表。。。显示的的话可以下载字体，设置你显示页面那块内容的字体为下载的ttf字
python如何查看网页代码
2020-12-17 16:14

在Python编程语言中，查看网页代码通常涉及到网络请求和数据解析。这里我们将详细讨论如何使用Python的`requests`库来获取网页的HTML源代码。`requests`是一个强大的库，允许我们方便地向服务器发送HTTP请求并接收...
网络爬虫爬百度时乱码问题 python 有问必答
2022-03-21 17:17

回答 3 已采纳 response.encoding=utf-8放上来 import requests url='https://www.baidu.com/' r=requests.get(url) r.encod
Python 爬虫乱码 python 开发语言
2023-01-25 13:07

回答 3 已采纳有点怪，源代码在我的环境里运行后，没有乱码。想了想，有可能是如下原因导致乱码：（1）在用户未知的情况下，环境自动按某种格式编译了内容，然后在反复、不对应的编译格式转换下出现乱码。（2）指定的编码格
r语言导入txt文件中文出现乱码是什么原因 r语言
2023-03-06 13:04

回答 1 已采纳将txt文件另存为UTF8编码
python爬虫时遇到乱码，以及动态显示的数据无法爬取
2024-07-05 11:41

序列02的博客在爬取的时候有很多种乱码，我遇到的是类似ÉÌÆ·ÁÐ±í-Ó¢ÐÛÁªÃËµÀ¾Û³Ç这种的，在查找资料后是以读取gbk导致的，最后解决办法是发送get请求后通过这个代码就可以显示出来，乱码有很多种，其他更...
Jupyter Notebook 爬取网页内容时出来的结果是乱码要怎么解决 jupyter python
2022-02-23 15:27

回答 2 已采纳需要换一下编码
java 自动识别网页乱码爬取
2024-06-30 03:12

Matt小特的博客 Java自动识别网页乱码爬取在进行网页数据爬取时，经常...本文将介绍如何使用Java编程语言自动识别网页乱码并进行数据爬取的方法。乱码问题分析在网页中，不同的网站可能会使用不同的编码方式来展示页面内容，如UT...
Python 爬虫中文乱码一文通
2022-07-27 01:14

H-大叔的博客还在找python中文乱码的解决方法？来跟我学习，一文直接PASS。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月25日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

爬出的网页内容是乱码

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新