关于#python#的问题：python爬虫

请问为什么这个代码只能爬取每一页的第一条评论啊？是循环有什么问题吗？求解。

def drag_code(self):
    time.sleep(0.5) #在执行查询之前，加一个延时time.sleep(0.5) #在执行查询之前，加一个延时
    image_info = self.track.get_image()

all_comments = [] #所有评论
xingji = []
shijian = []
zp_time = []
tp_ner = []
zhichi = []
huifu = []

for i in range(13):
    for j in range(1,11):
        all_comments.append(browser.find_element(By.XPATH, "//div[@class = 'commentList']/div[@class = 'commentItem']/div[@class = 'contentInfo']/div[@class='commentDetail']".format(j)).text)
        xingji.append(browser.find_element(By.XPATH, "//div[@class = 'commentList']/div[@class = 'commentItem']/div[@class = 'contentInfo']/div[@class = 'scroreInfo']/span[@class = 'averageScore']".format(j)).text)
        shijian.append(browser.find_element(By.XPATH, "//div[@class = 'commentList']/div[@class = 'commentItem']/div[@class = 'contentInfo']/div[@class = 'commentFooter']/div[@class='commentTime']".format(j)).text)
       
    bot = browser.find_element(By.XPATH, "//div[@class = 'poiDetailPage']/div[@class = 'moduleWrap']/div[@class = 'mainModule']/div[@class = 'commentModuleRef']/div[@class = 'commentModule normalModule']/div[@class = 'myPagination']/ul[@class = 'ant-pagination']/li[@class = ' ant-pagination-next']/span[@class = 'ant-pagination-item-comment']")
    browser.execute_script("arguments[0].click();",bot)#通过XPath定位败#浏览器执行脚本
    time.sleep(2)#使当前正在执行的Python程序进入睡眠或延迟几秒钟。
    browser.implicitly_wait(3)#浏览器隐式等待 3
    print(i)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
深度学习客 2023-04-06 21:56
关注
根据代码片段，您的问题可能出现在XPath表达式上。您在获取评论列表的Xpath表达式中使用了.format(j)，但是您并没有在字符串中使用花括号来表示要替换的值。因此，.format(j)部分被忽略了，只使用了原始的XPath表达式。

正确的XPath表达式应该包含一个花括号，用于表示要替换的值。例如，您可以这样修改XPath表达式：

"//div[@class='commentList']/div[@class='commentItem'][{0}]/div[@class='contentInfo']/div[@class='commentDetail']"
然后，在获取评论文本时，使用以下代码：

for j in range(1,11): xpath = "//div[@class='commentList']/div[@class='commentItem'][{0}]/div[@class='contentInfo']/div[@class='commentDetail']".format(j) all_comments.append(browser.find_element(By.XPATH, xpath).text)

同样地，您还需要相应地修改其他XPath表达式，以确保它们包含花括号并使用正确的值进行替换。

希望这可以帮助您解决问题。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python编程：网络爬虫
2025-06-24 20:05

倔强老吕的博客 Python 是编写网络爬虫的流行语言，因为它有丰富的库和框架支持。
Python 万能代码模版：爬虫代码篇
2021-09-14 15:27

AI悦创Python一对一辅导的博客很多同学一听到 Python 或编程语言，可能条件反射就会觉得“很难”。但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要...
Python爬虫第一课：了解爬虫与浏览器原理
2022-10-15 15:05

DangerousPerson的博客浏览器工作原理爬虫工作原理爬虫的四个步骤requests库。
Python爬虫入门实例：7个爬虫小案例！
2025-04-06 17:18

Python_trys的博客下面我将为你提供一个Python爬虫入门实例，包含7个简单的爬虫案例，适合初学者学习。这些案例涵盖了基本的网页抓取、数据解析和存储等常见操作。希望这7个案例能帮助你入门Python爬虫！每个案例都可以进一步扩展和...
【Python爬虫详解】第一篇：Python爬虫入门指南
2025-04-20 09:15

Luck_ff0810的博客为了应对不同的爬取需求和反爬挑战，Python生态系统提供了多种爬虫相关的库。库名特点适用场景Requests简单易用的HTTP库基础网页获取HTML/XML解析器静态网页内容提取Scrapy全功能爬虫框架大型爬虫项目Selenium浏览器...
Python 基础（一）：入门必备知识
2019-10-30 08:59

Python小二的博客 Python 入门必备知识，你都掌握了吗？
利用Python爬虫获取API接口：探索数据的力量
2025-01-07 15:49

不会玩技术的技术girl的博客 API（Application Programming Interface，应用程序编程接口）是一组预先定义的函数或协议，它允许不同的软件应用程序之间进行交互和通信。在Web开发中，API接口通常以HTTP请求的形式存在，通过发送特定的请求，我们...
【Python爬虫实战入门】：笔趣阁小说爬取，一篇教你爬虫入门
2024-07-16 18:59

爱喝兽奶的荒天帝的博客 requests简介requests模块官方文档requests 是 Python 编程语言中一个常用的第三方库，它可以帮助我们向 HTTP 服务器发送各种类型的请求，并处理响应。向 Web 服务器发送 GET、POST 等请求方法；在请求中添加自定义...
Python爬虫实战实例：Python6个爬虫小案例（附源码）
2024-08-15 17:38

小尤笔记的博客 Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找...接下来将分享7个Python爬虫的小案例，帮助大家更好地学习和了解Python爬虫的基础知识。
Python 爬虫：异步编程提升效率
2025-02-14 22:15

挖掘机技术我最强的博客 Python 的异步编程能有效解决这一问题，让程序在等待网络响应时可以处理其他任务。本文将深入介绍异步编程的原理、相关库的使用，并结合爬虫实例展示如何运用异步编程提升爬虫效率。异步编程是提升 Python 爬虫效率...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月6日

关于#python#的问题：python爬虫

2条回答 默认 最新

问题事件

2条回答默认最新