m0_43450539 2021-04-18 12:37 采纳率: 50%
浏览 103

selenium爬虫 WebDriver调用click之后WebElement报错的思考

对于如下报错信息的思考理解

Message: stale element reference: element is not attached to the page document

 

本来打算利用selenium 爬取豆瓣新片榜的是电影信息。

目标网址为 https://movie.douban.com/

在网址上通过find_element_by_xpath方法找到排行榜按钮

然后用click跳转到排行榜页面,再去获取电影信息,问题出现在click这里。一开始代码如下:

from time import sleep

from selenium import webdriver

url = 'https://movie.douban.com/'

driver = webdriver.Chrome()

driver.get(url)

driver.find_element_by_id('db-nav-movie')

rank = driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]')
rank.click()
print(type(rank))
sleep(1)

rank.find_element_by_id('content')
movies = rank.find_elements_by_xpath('.//div/div[1]/div/div/table')

for i in movies:
    print(i.text)

运行报错了

网上查了查大概意思就是找不到这个rank了。并且rank是个webelement类型。

后来不断尝试和测试。不定义rank而是直接用driver跳转,最后成功了。

driver.find_element_by_id('db-nav-movie')

driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]').click()
sleep(1)

最后代码如下:

from time import sleep

from selenium import webdriver

url = 'https://movie.douban.com/'

driver = webdriver.Chrome()

driver.get(url)

driver.find_element_by_id('db-nav-movie')

driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]').click()
sleep(1)

print(type(driver))
driver.find_element_by_id('content')
movies = driver.find_elements_by_xpath('.//div/div[1]/div/div/table')

for i in movies:
    print(i.text)

个人理解:rank是webelement类型,driver是webdriver类型。两个代码都是webelement调用了click(),但是实际跳转任务的“执行者”是webdriver,并且跳到另一个网页之后原网页的webelement就无法使用了。

想要跳回去的话是driver.back()。并且试了试跳回去之后一开始的webelement也是不能用的,所以back就是相当于跳到一个新网站一样。

rank = driver.find_element_by_xpath('.//div[@class="nav-secondary"]/div/ul/li[4]')
print(rank.text)
rank.click()
sleep(1)
driver.back()
print(rank.text)

不知道我理解的对不对

  • 写回答

1条回答 默认 最新

  • lshen01 2023-03-16 10:40
    关注

    参考GPT和自己的思路:

    你的理解是正确的。当使用selenium的WebDriver操作浏览器进行页面跳转后,之前找到的WebElement会变成stale(陈旧、过期)状态,也就是不再attached(附着在页面)上。因此,在跳转到新页面后,之前的WebElement对象就不能再使用了,需要重新查找。而WebDriver对象并不会变成stale状态,可以继续使用。

    所以,在你的代码中,使用了driver来执行click操作成功了,而使用rank来执行click操作失败是因为在跳转之后,rank对象已经变成了stale状态。

    评论

报告相同问题?

悬赏问题

  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题
  • ¥15 C#算法问题, 不知道怎么处理这个数据的转换
  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮