关于使用xpath解析数据返回空列表

**今天使用xpath去解析从豆瓣中爬取的数据时发现返回空列表
于是我对于xpath路径从前往后测试时发现：
碰到下图绿色箭头所示的标签处就返回空列表，
该标签的上一个标签的属性能够成功获取，
就是卡在了这个标签处，这是为什么呢？*

import requests
from lxml import etree
url='https://movie.douban.com/typerank?type_name=%E5%96%9C%E5%89%A7&type=24&interval_id=100:90&action=' //指定url
headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'}//UA伪装

response=requests.get(url=url,headers=headers).text//获取响应数据
tree=etree.HTML(response)//实例tree对象

path_0='//*[@id="content"]/div/div[1]/div[6]/@class'//出现问题标签的前一个标签的xpath路径
path_1='//*[@id="content"]/div/div[1]/div[6]/div'出现问题的标签的路径

list_data_0=tree.xpath(path_0)
list_data_1=tree.xpath(path_1)

print(list_data_0)//打印第一个的属性
print(list_data_1)//

图片说明

然后我就去查看了一下页面的源代码，发现了一个很诡异的事情，页面的源码中，是没有我上述爬取失败的标签，但是这个标签在抓包工具却可以定位到，我好迷呀？？？

图片说明

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
放风喽 2020-10-29 02:46
关注
网页上的所有东西，都可以用js来生成，
而requests获取的，只是服务器第一次渲染的html内容。
等浏览器运行后，js开始运行的时候，JS可以再次对原始的html进行修改。

selenium或者找到接口

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 6
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python用xpath爬取数据返回空列表解决
2018-12-08 16:20

SL_World的博客笔者以爬取2018年AAAI人工智能顶会论文元数据为例。其中包括标题(title)和摘要(abstract)等字段 ①tbody问题 URL:2018AAAI的第一篇论文元数据页面页面如下：笔者通过谷歌浏览器选取上图红框内容的xpath如下...
Python用xpath爬取数据返回空列表解决 python爬虫，关于使用xpath写爬虫获取不到内容，获取到空列表的解决方案
2021-11-26 15:11

'一生所爱的博客关于xpath路径问题之前在做的爬虫都是用的xpath去获取内容，又想偷懒，所以就直接在源码那里直接复制路径，然后就很容易踩雷了（我算是踩了很多坑了，不知道有没有小伙伴和我一样踩过这样的坑）：此时可能会...
关于xpath正确仍然返回空列表的原因
2023-01-14 00:18

无唔吾的博客 1.元素中有tbody，xpath无法解析 2.网页有js渲染，requests获取的源代码是渲染前的代码，xpath解析不到这个内容所以返回空 3.获取到的源代码被注释掉了
关于python使用xpath爬取网页内容返回值为空列表的解决方法
2023-09-16 20:30

妄想...的博客在使用XPath爬取网站中遇到的写完代码发现运行后返回值为 [] 空列表解决方法： 1、首先看看你的这段代码中是否有 "tbody"存在，把"tbody"去掉 text=dom.xpath('/html/body/div[2]/div[3]/div[3]/table/tbody/tr[1...
python爬取数据返回空列表_Xpath在选择器中正确，在代码中返回的是空列表问题...
2020-11-29 14:04

weixin_39712865的博客是元素中有tbody的原因，这个元素是html生成时产生的，在使用xpath解析的时候无法解析，因此返回的列表为空值。2.是因为没有写入获取的内容。比如在xpath选择其中可以使用但是在解析中没有带入//text()三、解决办法...
Python爬虫实战之xpath解析
2022-08-01 19:59

阿浩(￣▽￣)的博客 XPath是一门在XML文档中查找信息的语言，最初是用来搜寻XML文档的，但是它同样适用于HTML文档的搜索。所以在Python爬虫中，我们经常使用xpath解析这种高效便捷的方式来提取信息。
【Python爬虫详解】第四篇：使用解析库提取网页数据——XPath
2025-04-24 16:30

Luck_ff0810的博客通常比BeautifulSoup更快，特别是在处理大型文档时跨平台通用：几乎所有编程语言都有XPath的实现灵活性高：可以通过各种轴、谓词和函数构建复杂的选择条件在Python中，我们主要通过lxml库来使用XPath功能。...
利用PYTHON爬虫，Xpath路径正确但是返回数据为空
2022-11-22 10:50

lililimx的博客利用PYTHON爬虫，Xpath路径正确但是返回数据为空
关于xpath解析出空列表的原因
2020-07-21 11:59

Sanzy_k的博客第一种，网上搜的很多关于这方面的内容都是与tbody标签有关，解决方法无非是去掉这个标签第二种，网页标签class，id属性等一定要注意看后面有没有空格第三种，xpath表达式正确，仍然解析不出，一定要查看对应网址...
python xpath 返回列表为空求解
2021-08-30 19:59

zlwyp的博客 python url='https://www.pearvideo.com/category_31' headers=headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'} se=...
没有解决我的问题, 去提问

关于使用xpath解析数据返回空列表

1条回答 默认 最新

1条回答默认最新