python爬虫时为什么网页源码经过xpth处理后无法解析了呢

在爬取一个小说网站的时候我发现在网页的response中可以看到相关的值，但是在获取的时候就出现了问题

具体问题是这样的，

爬取的网站链接为：https://www.qiushuzw.com/t/38890/10253657.html

from lxml import etree
import requests

class Xiaoshuospider:
    def __init__(self):
        self.start_url = 'https://www.qiushuzw.com/t/38890/10253656.html'
        self.headers = {
            "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
            "Accept-Encoding": "gzip, deflate, br",
            "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
            "Cache-Control": "max-age=0",
            "Connection": "keep-alive",
            "Cookie": "BAIDU_SSP_lcr=https://www.80txt.com/txtml_38890.html; Hm_lvt_c0ce681e8e9cc7e226131131f59a202c=1554447305; Hm_lpvt_c0ce681e8e9cc7e226131131f59a202c=1554447305; UM_distinctid=169ec4788554ea-0eba8d0589d979-1a201708-15f900-169ec4788562c1; CNZZDATA1263995655=929605835-1554443240-https%253A%252F%252Fwww.80txt.com%252F%7C1554443240",
            "Host": "www.qiushuzw.com",
            "If-Modified-Since": "Thu, 31 Jan 2019 03:00:17 GMT",
            "If-None-Match": 'W/"5c5264c1 - 3f30"',
            "Referer": "https://www.80txt.com/txtml_38890.html",
            "Upgrade-Insecure-Requests": "1",
            "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36",
        }

    def parse(self):
        res = requests.get(self.start_url,headers=self.headers).content.decode()
        html = etree.HTML(res)
        content = html.xpath("div[@class='book_content']/text()")
        print(content)

    def run(self):
        self.parse()

if __name__ == '__main__':
    xiaoshuo = Xiaoshuospider()
    xiaoshuo.run()

根据xpath规则我将这些信息处理以后无法找到相应小说文本内容，小说的详细信息无法使用xpath提取出来

有没有哪位大佬也遇到相应的问题

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
堅持就是勝利！ 2023-11-25 10:14
关注
看看xpath

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫只解析了一部分网页？ python 爬虫
2021-11-19 14:39

回答 1 已采纳第一个问题，你用html.xpath('//div[@class="co_content8"]/ul/table')找不到，是因为在table那一类，有很多分支标签，所以定位不到具体的元素。第二个问题
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python爬虫爬网页部分内容空白，但源码可以看到，已解决
2020-12-22 19:08

奇怪的同一个网站同一个榜单，只是页数不同，前若干页能爬取，后若干页就爬取不了，一度怀疑是不允许爬。最后终于发现原因！因为Cookie找错了（kao！！！！！）注意要用这里的cookie！（下图是Chrome的开发者...
python爬虫爬虫的网站源码不齐全怎么办 python
2019-04-26 16:05

回答 1 已采纳现在都是动态网页,你爬取到的只是一个基本框架而已。你可以用f12 然后检测一下http请求，基本上获取到的都是第一个请求。后面的数据都是通过js修改后的网页。交互式的。所以要想做复杂爬虫，
Python爬虫requests反还内容与网页内容不相同 python 有问必答
2022-03-08 22:50

回答 2 已采纳 requests.get得到的是源代码，ajax动态加载或者js动态生成的html代码获取不到，需要直接请求接口获取数据或者从源代码中找到js数据源进行解析。截图中右边块的数据接口为下面这个，直接re
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
基于python爬虫学习项目源码.zip
2023-09-23 17:51

基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习项目源码.zip基于python爬虫学习...
python爬取动态网页时为什么动态网页的url的源码和网页源码不一样？ html5 python 正则表达式
2020-01-30 18:11

回答 1 已采纳加载更多是通过ajax异步加载的请求的是 Request URL: https://cn.burberry.com/service/shelf/mens-new-arrivals-new-in/?
python爬虫如何解析到$0里的内容 python 有问必答
2021-08-29 16:20

回答 1 已采纳解析不到要么xpath没有写正确，要么是该元素是js动态加载。查看一下requests.get()到得的网页代码，可使用bs4对节点标签解析试试。
python爬虫获取源码与网页不同 python 爬虫
2017-09-29 14:07

回答 1 已采纳网页中有js脚本的话，可以在下载网页后动态修改/添加网页本身，也就是ajax
电影天堂上的Python爬虫源码.zip
2023-08-26 10:49

电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python...
Python爬虫，爬虫访问网站时遇到415. UnsupportedMediaType错误，运行结果为空 python 爬虫
2022-08-22 11:35

回答 3 已采纳
基于Python的网页爬虫设计源码
2024-04-16 10:33

本源码项目是基于Python的网页爬虫设计，包含60个文件，主要使用Python和HTML编程语言。该项目旨在帮助用户在大数据时代通过爬虫技术获取所需信息，包括微博正文、点赞数、转发数、评论数以及拉钩招聘信息等。爬虫...
python爬虫爬取58同城信息源码
2023-10-09 11:05

内容为Python编写的爬取58同城同城信息转让信息爬取的示例
没有解决我的问题, 去提问

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘