关于#python#的问题：selenium打开豆瓣短评网页

selenium打开豆瓣短评网页，怎么继续获取短评的url

import requests
from bs4 import BeautifulSoup
import pandas as pd
import os
from time import sleep
import pymongo
import random
import time
from selenium.webdriver.common.by import By
from selenium import webdriver

word = input('请你输入你需要找的电影：')

options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ["enable-automation"])
options.add_experimental_option('useAutomationExtension', False)

driver = webdriver.Chrome()
driver.maximize_window()
driver.get('https://movie.douban.com/')
driver.implicitly_wait(10)
time.sleep(3)

# 点击页面上的一个链接
driver.find_element(By.XPATH,'//*[@id="db-global-nav"]/div/div[1]/a').click()

time.sleep(1)

# 点击页面上的一个元素
driver.find_element(By.XPATH,'//*[@id="account"]/div[2]/div[2]/div/div[1]/ul[1]/li[2]').click()

time.sleep(1)

# 在用户名输入框中输入用户名
driver.find_element(By.ID,'username').send_keys('15761473658')

# 在密码输入框中输入密码
driver.find_element(By.ID,'password').send_keys('ahd7459420')

time.sleep(5)

# 点击页面上的一个链接
driver.find_element(By.XPATH,'//*[@id="account"]/div[2]/div[2]/div/div[2]/div[1]/div[4]/a').click()

time.sleep(10)

# 在搜索框中输入用户输入的电影名称
driver.find_element(By.XPATH,'//*[@id="inp-query"]').send_keys(word)

# 点击搜索按钮
driver.find_element(By.XPATH,'//*[@id="db-nav-movie"]/div[1]/div/div[2]/form/fieldset/div[2]/input').click()
driver.find_element(By.XPATH,'//*[@id="root"]/div/div[2]/div[1]/div[1]/div/div/div/div[1]/a').click()
driver.find_element(By.XPATH,'//*[@id="comments-section"]/div[1]/h2/span/a').click()
time.sleep(3)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
渴口可乐 2023-12-15 15:01
关注
# 点击搜索按钮 driver.find_element(By.XPATH, '//*[@id="db-nav-movie"]/div[1]/div/div[2]/form/fieldset/div[2]/input').click() time.sleep(0.3) driver.find_element(By.XPATH, '//*[@id="root"]/div/div[2]/div[1]/div[1]/div/div/div/div[1]/a').click() time.sleep(0.3) driver.find_element(By.XPATH, '//*[@id="comments-section"]/div[1]/h2/span/a').click() ##//*[@id="comments"]/div[1]/div[2]/p/span 第一条评论 ##//*[@id="comments"]/div[20]/div[2]/p/span 最后一条评论

最后这些点击事件最好中间有些间隔，然后其中第一条评论和最后一条评论不难发现只是div的编号改变，所以可以利用这个编号循环获取评论内容。另外，您的账号密码漏出来了，登入也有滑动验证需要考虑进去。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1

无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python 爬虫实战：使用 Selenium 爬取豆瓣电影评论
2025-03-09 23:45

Python爬虫项目的博客豆瓣（Douban）是中国著名的文化类社区，涵盖了书籍、电影、音乐、剧集等多个领域。豆瓣电影凭借其丰富的用户评论和评分体系，成为了电影爱好者交流和获取信息的重要平台。然而，豆瓣电影的评论页面采用动态加载技术...
Python网络爬虫实战：爬取豆瓣电影评论数据
2025-04-23 15:39

lzzy_lmx_2043的博客本文以豆瓣电影《封神第二部：战火西岐》的短评数据为例，展示如何通过Python的。：若页面数据通过JavaScript加载，可使用。：用户名、赞同数、评论时间、IP地址、评论内容。通过本文，你可以快速掌握基础爬虫的实现...
python selenium爬虫豆瓣_Scrapy+Selenium爬取豆瓣电影评论
2020-12-20 23:52

weixin_39604350的博客首先需要对目标网站进行分析，具体的分析这里不详细介绍。...网页没有使用什么特殊的加载方式，所有的评论数据都在当前的源码中。翻页：https://movie.douban.com/subject/1292052/reviews?start=0https...
Python 网络爬虫实战：如何高效爬取豆瓣电影评论并提取有价值数据
2025-06-18 06:48

程序员威哥的博客本文介绍了如何利用Python爬取豆瓣电影评论并进行文本分析。通过requests和BeautifulSoup获取静态评论数据，或用Selenium处理动态加载，再借助Pandas清洗数据。使用TF-IDF提取关键词，结合TextBlob进行情感分析，...
[Python 爬虫] Selenium爬取电影《749局》豆瓣热评
2024-11-14 00:08

小白要努力变强.的博客使用selenium进行简单的爬虫实战
Python爬虫实战：抓取豆瓣影评数据的详细教程
2025-04-19 23:10

Python爬虫项目的博客本文详细介绍了如何使用Python爬虫抓取豆瓣电影影评数据，并介绍了如何使用Selenium模拟浏览器加载动态数据。通过结合Selenium、BeautifulSoup、pandas等工具，我们可以有效抓取并存储影评数据。爬虫的优化和反爬虫...
(一)selenium分析爬取豆瓣电影短评并存储到mongodb中
2020-05-04 01:09

milk-request的博客 2.打开其中一部电影url发现其所有短评皆在此页面的一个子url中，获取此url 3.进入短评页面获取数据，并存储代码步骤实现我这里用的是定义一个类来实现首先声明__init__ class DouBanSpider(o...
Python 爬虫实战：爬取豆瓣电影 / 书籍评分与评论
2026-01-01 11:42

python 爬虫工程师的博客摘要：本文详细介绍基于Python的豆瓣电影/书籍评分与评论数据爬取方法，使用Requests+BeautifulSoup技术方案实现静态页面解析。核心内容包括豆瓣页面结构分析、评分数据提取、评论分页爬取策略、反爬机制规避技巧...
Python爬虫入门实例：手把手教你抓取豆瓣电影Top250（零基础必看）
2025-05-15 19:07

「已注销」的博客今天咱们就用豆瓣电影Top250榜单来练手，准备好了吗？通过今天的小案例，相信你已经感受到了数据的魅力！但切记：能力越大，责任越大。爬虫技术是把双刃剑，用好了可以分析市场趋势、做学术研究，用不好可能就会…...
Python爬虫实战入门：手把手教你抓取网页数据（避坑指南）
2025-05-15 18:43

小乐爱技术的博客第13行：处理可能缺失的短评信息第17行：用Pandas保存数据到CSV 三、新手必踩的5大深坑（血泪经验）编码问题：遇到乱码试试response.encoding = 'utf-8' 反爬机制：网站突然返回验证码？上代理IP池！动态加载：...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 12月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月14日

关于#python#的问题：selenium打开豆瓣短评网页

1条回答 默认 最新

问题事件

1条回答默认最新