怎么获取所有链接下的单个链接里面的数据

#获取了页面所有链接，但是不能去获取一个一个链接里面的数据

import requests
from time import sleep
from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Firefox()
driver.get('https://www.amazon.de/')
word = input('请输入你需要的关键词：')
driver.find_element(by=By.NAME, value="field-keywords").send_keys(word)
sleep(2)
driver.find_element(By.XPATH, "//input[@type='submit']").click()
driver.find_element(By.ID, "nav-search-submit-button").click()
url = 'https://www.amazon.de/s?k={}'.format(word)
headers = {
    'User-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/112.0',
    'Referer': 'https://www.amazon.de/'
}
res = requests.get(url=url, headers=headers)
html_data = res.text

for links in driver.find_elements(By.XPATH,
                                  '//*[@class="a-link-normal s-underline-text s-underline-link-text s-link-style '
                                  'a-text-normal"]'):
    sleep(1)
    print(links.get_attribute('href'))
a = []
for links in driver.find_elements(By.XPATH,
                                      '//*[@class="a-link-normal s-underline-text s-underline-link-text s-link-style '
                                      'a-text-normal"]'):
    sleep(1)
    print(links.get_attribute('href'))
    a.append(links.get_attribute('href'))
    driver.find_element(By.XPATH, '//*[@class="a-link-normal s-underline-text s-underline-link-text s-link-style '
                                  'a-text-normal"]').click()
    driver.find_element(By.ID, "sellerProfileTriggerId").click()
    box = driver.find_element(By.XPATH, "/html/body/div[1]/div[2]/div/div/div/div/div[9]/div/div/div").text
    print(box)
    driver.back()
    driver.back()


for i in adriver.find_element(By.XPATH, '//*[@class="a-link-normal s-underline-text s-underline-link-text s-link-style '
                              'a-text-normal"]').click():

    print(i)
    element = WebDriverWait(driver, 10).until(EC.element_to_be_clickable(
        (By.XPATH, '//*[@class="a-link-normal s-underline-text s-underline-link-text s-link-style a-text-normal"]')))
    element.click()

#问题报错为

Traceback (most recent call last):
  File "C:/Users/Administrator/PycharmProjects/pythonProject/amzone/进阶.py", line 36, in <module>
    print(links.get_attribute('href'))
  File "F:\venv\lib\site-packages\selenium\webdriver\remote\webelement.py", line 179, in get_attribute
    f"/* getAttribute */return ({getAttribute_js}).apply(null, arguments);", self, name
  File "F:\venv\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 500, in execute_script
    return self.execute(command, {"script": script, "args": converted_args})["value"]
  File "F:\venv\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 440, in execute
    self.error_handler.check_response(response)
  File "F:\venv\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 245, in check_response
    raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.StaleElementReferenceException: Message: The element with the reference d629e098-386b-4e55-abac-2271d0ca6c39 is stale; either its node document is not the active document, or it is no longer connected to the DOM
Stacktrace:
RemoteError@chrome://remote/content/shared/RemoteError.sys.mjs:8:8
WebDriverError@chrome://remote/content/shared/webdriver/Errors.sys.mjs:182:5
StaleElementReferenceError@chrome://remote/content/shared/webdriver/Errors.sys.mjs:484:5
element.getKnownElement@chrome://remote/content/marionette/element.sys.mjs:488:11
deserializeJSON@chrome://remote/content/marionette/json.sys.mjs:233:33
cloneObject/result<@chrome://remote/content/marionette/json.sys.mjs:50:52
cloneObject@chrome://remote/content/marionette/json.sys.mjs:50:25
deserializeJSON@chrome://remote/content/marionette/json.sys.mjs:244:16
cloneObject@chrome://remote/content/marionette/json.sys.mjs:56:24
deserializeJSON@chrome://remote/content/marionette/json.sys.mjs:244:16
json.deserialize@chrome://remote/content/marionette/json.sys.mjs:248:10
receiveMessage@chrome://remote/content/marionette/actors/MarionetteCommandsChild.sys.mjs:85:30

#初步解决driver.refresh和time.sleep但是还是出现原有的报错

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

Zyb0627 2023-04-22 17:38

关注

引用chatGPT作答，这个报错是元素过期（stale element）引起的。这通常是因为在获取元素后，页面发生了变化，导致原有的元素无法再被使用。

你需要重新获取需要点击的元素，而不是直接使用之前获取的元素。

另外，你在点击链接后获取数据时，也需要等待页面加载完成再获取元素，否则可能会出现找不到元素的错误。你可以使用WebDriverWait等待特定的元素出现。

以下是修改后的代码示例，你可以参考一下：

import requests
from time import sleep
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
 
driver = webdriver.Firefox()
driver.get('https://www.amazon.de/')
word = input('请输入你需要的关键词：')
driver.find_element(by=By.NAME, value="field-keywords").send_keys(word)
sleep(2)
driver.find_element(By.CSS_SELECTOR, "input.nav-input[type='submit']").click()
 
# 等待搜索结果加载完成
WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, "div.s-search-results")))
 
# 获取搜索结果的链接
links = driver.find_elements(By.CSS_SELECTOR, 'a.a-link-normal.s-no-outline')
url_list = [link.get_attribute('href') for link in links]
 
# 点击链接获取数据
for url in url_list:
    driver.get(url)
    # 等待页面加载完成
    WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, "productTitle")))
    # 获取数据
    seller_link = driver.find_element(By.ID, "sellerProfileTriggerId").get_attribute('href')
    print(seller_link)
 
driver.quit()

在这个代码中，我使用了By.CSS_SELECTOR来获取元素，并且使用了WebDriverWait等待特定的元素出现。在循环中，我获取每个链接，然后等待页面加载完成后再获取数据。

报告相同问题？

关注问题

Go编程语言Go编程语言Go编程语言Go编程语言Go编程语言Go编程语言Go编程语言Go编程语言.zip
2024-05-08 09:19

4. **静态链接**：Go程序通常编译成单个可执行文件，包含了所有依赖，这使得部署变得更加简单。 5. **C风格的语法**：虽然Go语言具有现代编程语言的特点，但其语法仍保留了C语言的风格，如分号结束语句、花括号包裹...
go 语言实现的使用modbus 协议通过DTU tcp 链接采集数据.zip
2024-01-03 00:26

`Go`语言，又称为Golang，是Google开发的一种静态类型的、编译型的、并发型且具有垃圾回收功能的编程语言。它设计简洁，适合编写系统工具和服务器程序，特别适用于并发编程和网络通信，因此在物联网(IoT)和工业自动...
调用动态链接库 3 - 简单数据类型参数的设置-综合文档
2021-05-23 03:25

本篇将重点讲解如何在不同编程语言中调用动态链接库，并针对简单数据类型的参数设置进行详细阐述。一、动态链接库的工作原理动态链接库文件是编译后的代码库，它们不被直接执行，而是由运行中的应用程序加载。在...
大语言模型编程与应用基础教程.md
2024-09-03 21:21

1. 编程语言选择：Python是大语言模型编程中最常用的编程语言之一，因其简洁易用及丰富的库支持，此外，R和Java也被某些场景使用。 2. 常用库：HuggingFace Transformers、Google的BERT、OpenAI的GPT是目前大语言...
汇编输入单个字符获取其ASCII值
2025-10-03 03:58

汇编语言是一种低级编程语言，它与机器语言十分接近，但提供了一些符号来代表机器码的操作码和操作数。汇编语言允许程序员直接操作硬件，因此能够精确控制计算机系统的每个方面。在汇编语言中，处理输入输出和字符...
编程语言
2021-03-01 21:38

Go编程语言，也被称为Golang，是由Google在2009年推出的开源编程语言，旨在提供一种简洁、高效且具有现代特性的系统级编程工具。Go语言的设计目标是提高开发者的生产力，同时保持运行时的高性能，尤其适合云计算、...
modbus TCP dll 动态链接库源码
2018-03-15 05:23

- 掌握C/C++编程语言，因为这些源码通常使用这些语言编写。综上所述，Modbus TCP DLL源码提供了开发高效、可靠Modbus TCP通信功能的基础。通过研究和定制这个源码，开发者不仅可以提升其编程技能，还能为自己的...
72.调用动态链接库 4 - 结构型参数的设置.doc-综合文档
2021-05-23 17:39

在编程领域，调用动态链接库（DLL）是常见的跨语言交互方式，允许不同编程语言的应用程序共享功能。本文将详细探讨如何在调用DLL时处理结构型参数的设置，特别是针对C语言和LabVIEW之间的映射问题。首先，我们要...
多种计算机编程语言简介
2021-01-10 18:42

回忆童真的博客原标题：究竟有多少种编程语言？看这个你就知道了！计算机编程语言可用于将指令传达给计算机。它们基于某些句法和语义规则，定义了编程语言中每种结构的含义。现在我得到了一个凡是可以找得到的每种编程语言的...
集体智慧编程源码及对应的数据集
2017-02-28 10:37

这些代码可能使用Python、R或其他编程语言编写，因为它们在数据科学领域中广泛应用且具有良好的社区支持。通过学习和理解这些源码，开发者可以了解到如何利用集体智慧进行预测、分类、聚类以及模式识别。数据集是...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 4月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月22日

怎么获取所有链接下的单个链接里面的数据

4条回答 默认 最新

问题事件

4条回答默认最新