python 使用selector.xpath来爬取天猫数据，爬不了月销量

如题：我使用selector.xpath('//*[@class="tm-count"]/text()')

来爬的时候，会爬到最下方的128

我想要爬到11278这个数据

这个selector.xpath('')应该怎么写呢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lyhsdy 2018-12-14 01:37
关注
←如果以下回答对你有帮助，请点击右边的向上箭头及采纳下答案

刚测试了一下，天猫有浏览器内核检测机制，能检测到你使用的是selenium，大部分数据不正常加载（不用无头模式可以看到），且频繁显示登录框要求登录，在登录页面又出现滑块验证，滑块在selenium无法通过验证（人工操作也是错误），所以一定要用selenium去爬取，只能通过正常的在
浏览器中登录后，将登录的cookies复制下来，然后在加载到selenium完成登录后才可以看到销量，才可以爬取到对应的数据

def tm(): driver = webdriver.Chrome() driver.get(url='https://login.tmall.com/') cookies='你登录的cookies' nml=re.findall(' (.*?)=',cookie) val=re.findall('=(.*?);',cookie) for i in range(0,20): cookie_dict = { "domain": ".taobao.com", # 火狐浏览器不用填写，谷歌要需要 'name': nml[i], 'value': val[i], "expires": "", 'path': '/', 'httpOnly': False, 'HostOnly': False, 'Secure': False} driver.add_cookie(cookie_dict) print ("ok") driver.get(url='https://detail.tmall.com/item.htm?id=530559465281') driver.implicitly_wait(30) price= driver.find_element_by_xpath("//div[@id='J_DetailMeta']/div/div/div/ul/li/div/span[2]").text print(price) driver.quit() tm()

这种方法在爬虫里不合适，在频繁的采集之后，cookies的失效，要求重新登录
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

2024年Python最新Python爬虫学习教程：天猫商品数据爬虫
2024-05-01 08:56

2401_84584628的博客定义一个taobao类#对象初始化def(self):options.add_experimental_option(“prefs”, {“profile.managed_default_content_settings.images”: 2}) # 不加载图片,加快访问速度。
【Python爬虫教程】天猫商品数据爬取（演示视频+源码分享+代码解析）
2024-07-12 16:14

进击的六角龙的博客 Python爬虫教程：天猫商品数据爬取（演示视频+源码分享+代码解析）
Python爬虫xpath使用例，爬取图片
2022-07-20 00:22

瑆玥琼的博客本例教程嫌麻烦可直接跳到最底下复制代码粘贴运行，在Python中完成爬虫功能分三步，建立网页请求——解析网页——保存文件。
python爬取天猫_Python如何抓取天猫商品详细信息及交易记录
2020-12-05 14:53

weixin_39687301的博客本文实例为大家分享了Python抓取天猫商品详细信息及交易记录的具体代码，供大家参考，具体内容如下一、搭建Python环境本帖使用的是Python 2.7涉及到的模块：spynner, scrapy, bs4, pymmssql二、要获取的天猫数据三、...
Python爬虫学习教程：天猫商品数据爬虫
2024-04-30 14:43

m0_60635176的博客 script(js) sleep(0.1) js = “var q=document.documentElement.scrollTop=100000” self.browser.execute_script(js) sleep(0.2) 爬取天猫商品数据 def crawl_good_data(self): 对天猫商品数据进行爬虫 self....
爬虫_8 xpath的使用好段子爬取_爬虫_python_
2021-10-02 01:11

通过这个简单的示例，你已经学会了如何使用XPath和Python的`lxml`库来爬取网页数据。在实际项目中，你可能需要处理更复杂的网页结构，例如处理嵌套的标签、动态加载的内容或者分页。此外，还需要考虑反爬虫策略，如...
超强干货之---Python-数据爬取（爬虫）
2024-07-12 17:01

.房东的猫的博客特点递归：通常用递归实现，或者使用栈来模拟递归过程。内存占用低：在有大量分支的情况下，内存占用比广度优先搜索低。适合目标较深的情况：如果目标节点距离起始节点较深，DFS能更快找到目标。适用场景需要遍历...
python爬虫 selector xpath提取网页内容
2018-09-24 09:05

squabLi的博客 3.xpath提取网页内容 selector模块 XML 节点选择表达式描述 nodename 选取此节点的所有子节点。 / 从根节点选取。 // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的...
Python Scrapy使用Selector、xpath、css选择器提取数据
2019-08-01 17:51

阿优乐扬的博客从页面中提取数据的核心技术是HTTP文本解析，在Python 中常用以下模块处理此类问题: BeautifulSoup lxml 非常流行的HTTP解析库，API 简洁易用，但解析速度较慢。由C语言编写的xml解析库( libxml2)，解析...
2.天猫商品数据爬虫(已模拟登录)
2022-11-25 15:00

斌擎科技的博客 # 天猫商品数据爬虫 ## 使用教程 1. [点击这里下载][1]下载chrome浏览器 2. 查看chrome浏览器的版本号，[点击这里下载][2]对应版本号的chromedriver驱动 3. pip安装下列包 - [x] pip install selenium - [x] pip ...
【Python爬虫详解】第四篇：使用解析库提取网页数据——XPath
2025-04-24 16:30

Luck_ff0810的博客通常比BeautifulSoup更快，特别是在处理大型文档时跨平台通用：几乎所有编程语言都有XPath的实现灵活性高：可以通过各种轴、谓词和函数构建复杂的选择条件在Python中，我们主要通过lxml库来使用XPath功能。...
python爬虫之xpath的使用
2022-08-20 17:59

谦虚且进步的博客 python爬虫之xpath的使用
没有解决我的问题, 去提问

python 使用selector.xpath来爬取天猫数据，爬不了月销量

2条回答 默认 最新

2条回答默认最新