用RPA怎么抓取一个商品“电脑”的所有数据，就是用RPA去操作把网页淘宝的电脑所有数据抓出来，但是我抓不到那个显示URI无效，格式不对，

用RPA怎么抓取一个商品“电脑”的所有数据，就是用RPA去操作把网页淘宝的电脑所有数据抓出来，但是我抓不到那个显示URI无效，格式不对，
其中抓取的文字怎么改成链接形式呢？
在源码里改什么

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
IT大鸵鸟 2023-04-13 21:01
关注
打开网页并进行搜索。
等待网页加载完成。
找到商品信息的HTML元素。
解析HTML元素并提取所需数据。
将提取的数据保存到文件或输出到控制台。
下面是一个Python实现的例子：

import time from selenium import webdriver # 启动Chrome浏览器 driver = webdriver.Chrome() # 打开淘宝首页并搜索“电脑” driver.get('https://www.taobao.com/') driver.find_element_by_name('q').send_keys('电脑') driver.find_element_by_class_name('btn-search').click() # 等待页面加载完成 time.sleep(5) # 获取商品信息的HTML元素 items = driver.find_elements_by_class_name('item') # 提取商品信息并保存到文件 with open('items.txt', 'w', encoding='utf-8') as f: for item in items: title = item.find_element_by_class_name('title').text price = item.find_element_by_class_name('price').text link = item.find_element_by_class_name('title').get_attribute('href') f.write(f'{title}\t{price}\t{link}\n') # 关闭浏览器 driver.quit()

在这个例子中，我们使用了Python的selenium库来模拟浏览器操作。首先，我们启动了Chrome浏览器并打开淘宝首页。然后，在搜索框中输入“电脑”并点击搜索按钮。接着，我们等待页面加载完成，使用find_elements_by_class_name方法获取所有商品信息的HTML元素，然后使用text和get_attribute方法提取商品标题、价格和链接信息。最后，我们将提取的数据保存到文件中，并关闭浏览器。
如果你想将提取的文字变成链接形式，可以在保存数据时将标题和链接信息组合成HTML超链接的格式，例如：

with open('items.html', 'w', encoding='utf-8') as f: for item in items: title = item.find_element_by_class_name('title').text price = item.find_element_by_class_name('price').text link = item.find_element_by_class_name('title').get_attribute('href') f.write(f'<a href="{link}">{title}</a>\t{price}<br>\n')

在这个例子中，我们将每个商品的标题和链接信息组合成一个HTML超链接，并将其保存到文件中。注意，在这种情况下，我们将数据保存到HTML文件中，而不是文本文件中。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么用python解包rpa文件时出现 [Errno 2] No such file or directory？ python 有问必答
2022-02-26 14:07

回答 2 已采纳换到待解压的目录下运行cmd试试
【tagui：rpa for 】我想使用网页例的href元素，然后拼接成url python 有问必答
2021-06-05 11:24

回答 3 已采纳可以啊，你获取了之后，直接拼接就行。
列举国内主流RPA产品，并分别介绍一下各自优势和缺点其他
2022-08-20 00:50

回答 1 已采纳目前国内RPA市场，按照公司基因可以分为5类：一是纯RPA公司，如影刀RPA、Cyclone弘玑、云扩科技、九科信息、慧流科技，二是有丰富to B经验的软件行业老玩家，如艺赛旗。三是大公司孵化，阿里云
比python更精简的语言，两行代码抓取淘宝/京东平台的商品数据--Uibot
2021-03-20 10:37

始终是个小白的博客 3.启动Uibot，两行代码获取淘宝网商品数据 4.写在最后 1. Uibot简介 UiBot是一种RPA平台，RPA的全称是Robotic Process Automation，中文翻译为机器人流程自动化。如果你不了解RPA，那么“按键精灵“你总该知道了...
运行 Tagui的rpa for python 报错 python 有问必答
2021-06-04 07:38

回答 2 已采纳错误是提示找不到rpa_python了，这个代码没设好吧？还有一个报错是先调用url()才能调用init() 如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
RPA无法下载中文路径下的文件 python
2023-04-11 15:15

回答 1 已采纳如果RPA下载FTP中文名的文件夹，只有一个中文名的空文件夹，有以下几个情况注意检查：可以采用判断远程文件是否存在，例如：判断远程文件“/文件名.后缀名”是否存在，输出到；如果只是下载制定的文件夹，
RPA适用于烟草行业吗？有哪些应用案例？人工智能大数据
2023-03-10 18:37

回答 2 已采纳适用，而且十分必要。这是因为烟草行业作为烟草产业链上重要一环，外部连接烟草工业企业、零售客户、消费者，内部包含营销、专卖、烟叶、物流等诸多业务，信息系统众多，企业数据量庞大。因此，清楚地了解自身存在的
用RPA实现高效批量下载图片，轻松解决繁琐操作！
2023-12-14 17:12

八爪鱼大数据的博客 RPA易操作、无需编程的特点使得用户可以轻松使用，帮助电商从业人员高效批量下载商品图片。
爬虫爬回“您操作太频繁,请稍后再访问”怎么解决 python 爬虫
2021-08-23 23:05

回答 1 已采纳用代理池找一堆免费代理ip,高匿级别的,每次爬取的时候轮询ip池ps.不建议爬取频率太高,真的把目标网站爬崩了要负法律责任的有帮助望采纳
Javascript,js，怎么滚动到XPath元素位置并且可微调？ 2 js怎么用XPath更新输入框的值？ 3, 网页悬浮图标怎么点？ javascript 自动化
2023-03-25 10:16

回答 2 已采纳 1、 window.scroll(0,document.evaluate('//*[@id="anony-group"]/div/div[1]/h2/a', document).iterateNex
ruby 能够抓取动态网页内容如javascript或者ajax更新的内容？ ruby
2009-10-27 00:12

回答 2 已采纳我做过一个抓数据的脚本, 代码如何, 是否对你有帮助? [code="java"] class ClassName HOST = "www.xxx.com" URL = '/xxxx/
微软RPA工具Power Automate Desktop
2021-12-06 07:45

dotNET跨平台的博客什么是RPARPA（机器人流程自动化）系统是一种应用程序，它通过模仿用户在电脑上的操作方法, 实现自动化操作流程,协助人在计算机、手机等计算设备中完成重复的工作流任务。Power Auto...
mysql server 问题 mysql
2023-01-31 10:17

回答 2 已采纳增加MySQL服务器的缓冲区大小。增加最大并发请求数。
淘宝店铺商品信息抓取
2024-04-26 17:58

甩手掌柜大侠的博客我目前采用的是“粒元数字员工”，通过这款RPA可以自动抓取，进入目标店铺首页，遍历商品列表获取商品信息，然后存储到Excel中。通过使用粒元RPA工具，可以减少人力资源的投入，降低企业的运营成本，提高工作效率。...
机器人（RPA路程自动化）RPA流程自动化和AI的区别。
2019-05-22 14:51

鹧鸪菜的博客 RPA的全称为机器人流程自动化（Robotic Process Automation），是一款软件产品，可模拟人在电脑上的不同系统之间操作行为，替代人在电脑前执行具有规律与重复性高的办公流程。瞎说开发那些事 18-05-2510:02 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月13日

悬赏问题

¥15 悬赏Python-playwright部署在centos7上
¥15 psoc creator软件有没有人能远程安装啊
¥15 快速扫描算法求解Eikonal方程咨询
¥20 我的是道格手机，重置后屏幕右上角出现红色字的未写入tee key 和未写入google key请问怎么去掉啊
¥30 关于R语言运行分区生存模型中的问题！
¥15 校内二手商品转让网站
¥20 高德地图聚合图层MarkerCluster聚合多个点，但是ClusterData只有其中部分数据，原因应该是有经纬度重合的地方点，现在我想让ClusterData显示所有点的信息，如何实现？
¥100 求Web版SPC控制图程序包调式
¥20 指导如何跑通以下两个Github代码
¥15 大家知道这个后备文件怎么删吗，为啥这些文件我只看到一份，没有后备呀

用RPA怎么抓取一个商品“电脑”的所有数据，就是用RPA去操作把网页淘宝的电脑所有数据抓出来，但是我抓不到那个显示URI无效，格式不对，

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新