selenium爬虫 WebDriver调用click之后WebElement报错的思考

对于如下报错信息的思考理解

Message: stale element reference: element is not attached to the page document

本来打算利用selenium 爬取豆瓣新片榜的是电影信息。

目标网址为 https://movie.douban.com/

在网址上通过find_element_by_xpath方法找到排行榜按钮

然后用click跳转到排行榜页面，再去获取电影信息，问题出现在click这里。一开始代码如下：

from time import sleep

from selenium import webdriver

url = 'https://movie.douban.com/'

driver = webdriver.Chrome()

driver.get(url)

driver.find_element_by_id('db-nav-movie')

rank = driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]')
rank.click()
print(type(rank))
sleep(1)

rank.find_element_by_id('content')
movies = rank.find_elements_by_xpath('.//div/div[1]/div/div/table')

for i in movies:
    print(i.text)

运行报错了

网上查了查大概意思就是找不到这个rank了。并且rank是个webelement类型。

后来不断尝试和测试。不定义rank而是直接用driver跳转，最后成功了。

driver.find_element_by_id('db-nav-movie')

driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]').click()
sleep(1)

最后代码如下：

from time import sleep

from selenium import webdriver

url = 'https://movie.douban.com/'

driver = webdriver.Chrome()

driver.get(url)

driver.find_element_by_id('db-nav-movie')

driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]').click()
sleep(1)

print(type(driver))
driver.find_element_by_id('content')
movies = driver.find_elements_by_xpath('.//div/div[1]/div/div/table')

for i in movies:
    print(i.text)

个人理解：rank是webelement类型，driver是webdriver类型。两个代码都是webelement调用了click(),但是实际跳转任务的“执行者”是webdriver，并且跳到另一个网页之后原网页的webelement就无法使用了。

想要跳回去的话是driver.back()。并且试了试跳回去之后一开始的webelement也是不能用的，所以back就是相当于跳到一个新网站一样。

rank = driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]')
print(rank.text)
rank.click()
sleep(1)
driver.back()
print(rank.text)

不知道我理解的对不对

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lshen01 2023-03-16 10:40
关注
参考GPT和自己的思路：

你的理解是正确的。当使用selenium的WebDriver操作浏览器进行页面跳转后，之前找到的WebElement会变成stale(陈旧、过期)状态，也就是不再attached(附着在页面）上。因此，在跳转到新页面后，之前的WebElement对象就不能再使用了，需要重新查找。而WebDriver对象并不会变成stale状态，可以继续使用。

所以，在你的代码中，使用了driver来执行click操作成功了，而使用rank来执行click操作失败是因为在跳转之后，rank对象已经变成了stale状态。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

selenium.webdriver.remote.webelement.WebElement 和shadow-root定位问题 javascript python selenium 有问必答
2022-01-17 15:59

回答 2 已采纳参考下：https://blog.csdn.net/dyfDewey/article/details/116454716
webdriver.Chrome()报错：selenium.common.exceptions.WebDriverException: Message: unknown error: python selenium 爬虫
2022-08-22 18:22

回答 2 已采纳需要把chromedriver.exe的路径添加进去。比如我的是这么写的： from selenium import webdriver from selenium.webdriver.chrome
centos服务器端运行python+selenium+webdriver出现报错 centos python selenium 有问必答
2021-08-10 22:28

回答 1 已采纳第一次单纯的只取cookie，取得cookies后，存储到文件。下次使用cookies的时候，先打开要使用cookies的页面，然后加载cookies，最后再要使用cookies的页面刷新一次，就可以
Selenium-webdriver Chrome实战
2020-09-01 13:49

data-life的博客什么是selenium selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera...
python爬虫selenium基础问题，异常报错 python selenium 爬虫
2021-08-04 10:07

回答 1 已采纳错误提示告诉你，你获取的内容的编码问题，你的程序是按GBK的编码方式取的内容，换种编码。
selenium和PhantomJS的配合使用：AttributeError: module 'selenium.webdriver' has no attribute 'PhantomJS' python selenium
2021-12-25 18:39

回答 4 已采纳如果一定要用 PhantomJS ，那要考虑卸载当前 Selenium ，降档到3.141.0 或者以下版本去用如果只是为了无界面，也可以考虑用 chorme , 用无界面模式。
selenium.webdriver相关使用问题 python selenium 爬虫
2022-04-01 08:33

回答 3 已采纳好
【Python爬虫】—— Selenium 的基本使用
2020-07-14 16:11

Giyn的博客在很多情况下，Ajax 请求的接口通常会包含加密的参数。由于接口的请求加上了参数，如果不...Selenium 是一个自动化测试工具，利用它可以驱动浏览器执行特定的动作，如点击、下拉等操作，同时还可以获取浏览器当前呈现
python selenium爬虫遇到弹窗报错 chrome python selenium
2023-03-15 21:51

回答 2 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 这有个类似的问题, 你可以参考下: https://ask.csdn.net/questions/7633385你也可以参考下这篇文章：使用sel
selenium自动化测试输入中文报错 python selenium
2021-03-24 09:51

回答 4 已采纳总算找到原因了找到python安装路径的这个文件__init__.py 我的路径是D:\python\Lib\json 打开这个py文件，找到def dumps()方法，将 ensure_
python selenium运行chrome时打开浏览器但是报错 python 有问必答
2021-06-03 14:40

回答 3 已采纳补全域名，www.baidu.com 修改为 https://www.baidu.com 试试
Python爬虫：学习selenium的正确方式
2021-02-20 18:21

chinaherolts2008的博客 selenium的安装是不是会有很多小伙伴会认为这个安装有...进入Python命令交互模式，导入selenium包，如果没有报错，那么就说明安装成功。但是这样还不够，但是这样还不够，因为我们需要用到浏览器（如Chrome、Firef
appium➕vs code：selenium.webdriver.common.options selenium 测试工具测试用例
2022-07-14 17:48

回答 1 已采纳 from selenium.webdriver.chrome.options import Options from selenium import webdriver option = Opt
爬虫动态渲染页面爬取Selenium中级篇
2019-01-19 14:39

chengqiuming的博客一声明浏览器对象 1 点睛 Selenium支持非常多的浏览器，如Chrome、Firefox、Edge等，还有Android、BlackBerry等手机...from selenium import webdriver browser = webdriver.Chrome() browser = webdriver.Fir...
九四、node+selenium-webdriver爬虫高级
2019-09-05 16:33

夏河始溢的博客使用Selenium库爬取前端渲染的网页反反爬虫技术 Selenium简介官方原文介绍： Selenium automates browsers. That’s it! What you do with that power is entirely up to you. Primarily, it is for automating ...
没有解决我的问题, 去提问

悬赏问题

¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮

selenium爬虫 WebDriver调用click之后WebElement报错的思考

1条回答 默认 最新

悬赏问题

1条回答默认最新