关于xpath返回空列表的问题

问题遇到的现象和发生背景

为什么下面一个xapth取不到内容返回的是一个空的列表，
但是xpath是正确的啊

问题相关代码，请勿粘贴截图

import requests
import os
from lxml import etree

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/527.36 (KHTML, like Gecko)'
' Chrome/96.0.8664.55 Safari/537.36 Edg/56.0.054.43'}
picture_e = 'picture_e'
if not os.path.exists(picture_e):
os.mkdir(picture_e)
url = 'https://www.vilipix.com/tags/%E5%A5%B3%E3%81%AE%E5%AD%90/illusts'
fn_q = requests.get(url, headers=headers)
html_q = fn_q.text
dy_q = etree.HTML(html_q)
fn_li_q = dy_q.xpath('//*[@class="illust"]//img/@alt')
print(fn_li_q)

运行结果及报错内容

C:\Users\21905\Documents\PythonProject\reptile\venv\Scripts\python.exe
[]

进程已结束，退出代码为 0

我的解答思路和尝试过的方法

xpath定位我写过几个代码有时候有用有时候没用，感觉就特别玄学。

我想要达到的结果

得到网页图片下的名字

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-天际的海浪 2021-12-07 04:37
关注
你这个网页中的内容是通过js代码读取外部json数据来动态更新的。
requests只能获取网页的静态源代码，动态更新的内容取不到。
对于动态更新的内容要用selenium 来爬取。

或者是通过F12控制台分析页面数据加载的链接，找到真正json数据的地址进行爬取。

在页面上点击右键，右键菜单中选 "查看网页源代码"。

这样看到的才是网页的静态源代码。
如果这个网页的静态源代码中有你需要爬取的内容，就说明该页面没有动态内容，可以用requests爬取。
否则就说明该页面的内容是动态更新的，要用selenium 来爬取.

你题目的解答代码如下：

from selenium import webdriver import time import os from lxml import etree url = 'https://www.vilipix.com/tags/%E5%A5%B3%E3%81%AE%E5%AD%90/illusts' driver = webdriver.Chrome() driver.get(url) time.sleep(3) html_q = driver.page_source dy_q = etree.HTML(html_q) fn_li_q = dy_q.xpath('//*[@class="illust"]//img/@alt') print(fn_li_q)

如有帮助，望采纳！谢谢!
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 8

无用 1
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于xpath返回空列表的问题 python 有问必答
2021-12-06 18:59

回答 1 已采纳你这个网页中的内容是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通过F12控
关于python的xpath返回空列表的问题求解 python
2022-05-22 11:35

回答 1 已采纳直接用正则匹配啊
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python爬取数据返回空列表_Python用xpath爬取数据返回空列表解决
2020-11-29 14:04

weixin_39918043的博客笔者以爬取2018年AAAI人工智能顶会论文元数据为例。其中包括标题(title)和摘要...①tbody问题笔者通过谷歌浏览器选取上图红框内容的xpath如下：from lxml import etreeimport requestsurl = 'https://aaai.org/ocs/...
关于使用xpath解析数据返回空列表 python
2020-10-28 20:47

回答 1 已采纳网页上的所有东西，都可以用js来生成，而requests获取的，只是服务器第一次渲染的html内容。等浏览器运行后，js开始运行的时候，JS可以再次对原始的html进行修改。 sel
Python使用xpath无论如何都返回空列表 python 有问必答爬虫
2022-02-14 15:59

回答 3 已采纳 tree=etree.HTML('page_text')改为tree=etree.HTML(page_text) 加载变量的值，而不是直接加载page_text这字符，当然无法找到内容
用xpath解析返回为空列表 python selenium 爬虫
2023-04-04 16:31

回答 1 已采纳效果如下问题是点击链接之后没有跳转到对应窗口所以找不到对应的XPATH这边也是写了跳转和返回的逻辑构建对象的路径还需要你这边改回来，应该对你有所帮助有用请采纳 from lxml import et
Python用xpath爬取数据返回空列表解决
2021-12-21 21:40

jackwen888的博客 Python用xpath爬取数据返回空列表解决
pycharm中xpath返回的一直是一个空列表 python
2022-10-18 22:14

回答 2 已采纳 Xpath定位少一步，我的代码和结果是这个，你看看是不是你的需求，有问题再说替换你的解析代码如下 html = etree.HTML(resp.text) divs = html.x
python3中使用xpath无法定位，为什么一直返回空列表？ html5 python
2019-01-11 17:23

回答 3 已采纳最后一句会报错，去掉最后一句正常运行，可以参考下我的代码看看问题出现在哪： ```python from lxml import etree import requests url =
从浏览器复制的xpath为什么打出来是个空列表 python 有问必答爬虫
2022-05-13 15:29

回答 2 已采纳积存金是用iframe加载的，在下面这个页面里面https://mybank.icbc.com.cn/icbc/newperbank/perbank3/gold/goldaccrual_query_o
关于xpath正确仍然返回空列表的原因
2023-01-14 00:18

无唔吾的博客 1.元素中有tbody，xpath无法解析 2.网页有js渲染，requests获取的源代码是渲染前的代码，xpath解析不到这个内容所以返回空 3.获取到的源代码被注释掉了
用selenium定位元素返回空列表 css python selenium
2021-10-12 19:27

回答 1 已采纳要先触发那个登陆画面，然后，可以用例如 id 去 click WebElement el = driver.findElement(By.xpath("//div[@class='user-icon-
Python用xpath爬取数据返回空列表解决 python爬虫，关于使用xpath写爬虫获取不到内容，获取到空列表的解决方案
2021-11-26 15:11

'一生所爱的博客关于xpath路径问题之前在做的爬虫都是用的xpath去获取内容，又想偷懒，所以就直接在源码那里直接复制路径，然后就很容易踩雷了（我算是踩了很多坑了，不知道有没有小伙伴和我一样踩过这样的坑）：此时可能会...
python爬取数据返回空列表_Xpath在选择器中正确，在代码中返回的是空列表问题...
2020-11-29 14:04

weixin_39712865的博客是元素中有tbody的原因，这个元素是html生成时产生的，在使用xpath解析的时候无法解析，因此返回的列表为空值。2.是因为没有写入获取的内容。比如在xpath选择其中可以使用但是在解析中没有带入//text()三、解决办法...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月6日

悬赏问题

¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效
¥15 悬赏！微信开发者工具报错，求帮改
¥20 wireshark抓不到vlan
¥20 关于#stm32#的问题：需要指导自动酸碱滴定仪的原理图程序代码及仿真
¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
¥15 stata安慰剂检验作图但是真实值不出现在图上
¥15 c程序不知道为什么得不到结果
¥40 复杂的限制性的商函数处理
¥15 程序不包含适用于入口点的静态Main方法