python爬虫时为什么网页源码经过xpth处理后无法解析了呢

在爬取一个小说网站的时候我发现在网页的response中可以看到相关的值，但是在获取的时候就出现了问题

具体问题是这样的，

爬取的网站链接为：https://www.qiushuzw.com/t/38890/10253657.html

from lxml import etree
import requests

class Xiaoshuospider:
    def __init__(self):
        self.start_url = 'https://www.qiushuzw.com/t/38890/10253656.html'
        self.headers = {
            "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
            "Accept-Encoding": "gzip, deflate, br",
            "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
            "Cache-Control": "max-age=0",
            "Connection": "keep-alive",
            "Cookie": "BAIDU_SSP_lcr=https://www.80txt.com/txtml_38890.html; Hm_lvt_c0ce681e8e9cc7e226131131f59a202c=1554447305; Hm_lpvt_c0ce681e8e9cc7e226131131f59a202c=1554447305; UM_distinctid=169ec4788554ea-0eba8d0589d979-1a201708-15f900-169ec4788562c1; CNZZDATA1263995655=929605835-1554443240-https%253A%252F%252Fwww.80txt.com%252F%7C1554443240",
            "Host": "www.qiushuzw.com",
            "If-Modified-Since": "Thu, 31 Jan 2019 03:00:17 GMT",
            "If-None-Match": 'W/"5c5264c1 - 3f30"',
            "Referer": "https://www.80txt.com/txtml_38890.html",
            "Upgrade-Insecure-Requests": "1",
            "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36",
        }

    def parse(self):
        res = requests.get(self.start_url,headers=self.headers).content.decode()
        html = etree.HTML(res)
        content = html.xpath("div[@class='book_content']/text()")
        print(content)

    def run(self):
        self.parse()

if __name__ == '__main__':
    xiaoshuo = Xiaoshuospider()
    xiaoshuo.run()

根据xpath规则我将这些信息处理以后无法找到相应小说文本内容，小说的详细信息无法使用xpath提取出来

有没有哪位大佬也遇到相应的问题

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2023-11-25 10:14
关注
看看xpath

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫解析VIP电影[可运行源码]
2025-11-13 08:02

Python爬虫技术近年来得到广泛的应用，特别在数据采集和网络信息处理方面显示出巨大的潜力。本文详细介绍了如何运用Python爬虫技术对VIP电影进行解析，使得用户可以在没有会员权限的情况下也能观看这些资源。文章的...
python爬虫实战项目开发源码资源.zip
2024-12-05 11:05

在众多Python爬虫项目中，一个名为“spider-master”的项目脱颖而出，成为一个备受关注的实战开发资源。通过深入研究和分析该项目的源码，我们可以获得宝贵的学习经验，并在实战中提升我们的编程和数据处理能力。 ...
python爬虫代码源码.rar
2023-02-25 12:42

python爬虫程序可用于收集数据。这也是最直接和最常用的方法。由于爬虫程序是一个程序，程序运行得非常快，不会因为重复的事情而感到疲倦，因此使用爬虫程序获取大量数据变得非常简单和快速。由于99%以上的网站是...
爬虫代码实例源码大全+Python 爬虫Scrapy课件源码.zip
2024-03-27 03:27

"爬虫代码实例源码大全（纯源码不带视频的实例）"这部分是学习Python爬虫的重要资料。源码实例通常包括了各种常见的爬虫应用场景，如爬取网页HTML内容、解析JSON或XML数据、处理JavaScript加载的内容、登录验证、...
电影天堂上的Python爬虫源码.zip
2023-08-26 10:49

电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python...
python爬虫爬网页部分内容空白，但源码可以看到，已解决
2020-12-22 19:08

奇怪的同一个网站同一个榜单，只是页数不同，前若干页能爬取，后若干页就爬取不了，一度怀疑是不允许爬。最后终于发现原因！因为Cookie找错了（kao！！！！！）注意要用这里的cookie！（下图是Chrome的开发者...
基于Python的网页爬虫设计源码
2024-04-16 10:33

本源码项目是基于Python的网页爬虫设计，包含60个文件，主要使用Python和HTML编程语言。该项目旨在帮助用户在大数据时代通过爬虫技术获取所需信息，包括微博正文、点赞数、转发数、评论数以及拉钩招聘信息等。爬虫...
一个使用 Python 编写的租房信息爬虫源码，以自如为例
2025-08-03 14:01

使用Python编写租房信息爬虫源码，以自如为例的知识点涵盖了Python编程、网络爬虫的构建、数据采集和分析等多个方面。首先，Python作为一种广泛使用的高级编程语言，以其简洁易读、高效率等特点，在数据分析、网络...
基于Python爬虫的电商比价系统的设计与实现源码+文档说明（毕业设计）
2024-10-24 15:24

基于Python爬虫的电商比价系统的设计与实现源码+文档说明（毕业设计）基于Python爬虫的电商比价系统的设计与实现源码+文档说明（毕业设计）基于Python爬虫的电商比价系统的设计与实现源码+文档说明（毕业设计）基于...
Python爬虫技术详解[项目源码]
2025-11-16 08:08

Python爬虫技术详解[项目源码]这篇文章主要从网络编程的角度出发，详细解读了Python爬虫开发所涉及的核心技术和相关原理。文章开始部分对HTTP协议进行了基础性的阐述，涵盖了请求和响应的组成要素和交互过程，并通过...
没有解决我的问题, 去提问

python爬虫时为什么网页源码经过xpth处理后无法解析了呢

在爬取一个小说网站的时候我发现在网页的response中可以看到相关的值，但是在获取的时候就出现了问题

具体问题是这样的，

有没有哪位大佬也遇到相应的问题

1条回答 默认 最新

1条回答默认最新