如何爬取大夫网站的完整患者评论

请问大家要如何才能够爬取到“好大夫网站”的完整患者评论呢？在爬取的时候发现电脑网页端只能查看部分患者评价，手机APP端才能查看完整评价，通过开发者工具获取的信息和教程上显示的也完全不同。这个问题困惑我非常久了，但是由于本人不懂如何解决，求解惑！QAQ

参照的是这位大大的教程@小敢摘葡萄如果您能够看到的话，不知能否为我解答疑惑（滑跪）

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-07-04 17:15
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

爬取大夫网站的完整患者评论

你遇到的问题是大夫网站的评论部分在电脑网页端和手机APP端显示不同，导致爬取完整评论变得困难。下面是一些可能的解决方案：

模拟手机APP端请求：使用 Python 的 requests 和 BeautifulSoup 库模拟手机APP端的请求，获取完整评论。可以通过分析开发者工具获取的信息和教程上显示的信息来模拟请求。
使用代理服务器：使用代理服务器来模拟手机APP端的请求，获取完整评论。可以使用 requests 库中的 proxies 参数来设置代理服务器。
分析网页端评论的结构：分析网页端评论的结构，尝试使用 BeautifulSoup 库来解析评论的 HTML 结构，获取完整评论。

以下是一个简单的示例代码，使用 requests 和 BeautifulSoup 库模拟手机APP端请求，获取完整评论：

import requests from bs4 import BeautifulSoup # 设置代理服务器 proxies = { 'http': 'http://your-proxy-server.com:8080', 'https': 'http://your-proxy-server.com:8080' } # 设置请求头 headers = { 'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1' } # 发送请求 response = requests.get('https://www.haodf.com/...', headers=headers, proxies=proxies) # 解析 HTML 结构 soup = BeautifulSoup(response.content, 'html.parser') # 获取评论 comments = soup.find_all('div', {'class': 'comment'}) # 遍历评论 for comment in comments: print(comment.text.strip())

请注意，这只是一个简单的示例代码，实际情况中可能需要更多的处理和调整。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

爬取好大夫网.py
2020-04-19 22:41

仅仅只是教学源码，并非专业爬虫所用到库，requests，bs4，re，json，time，os 代码可运行，可适当根据自身情况调整爬取频率，即 time.sleep() 中的间隔时间
Python爬取好大夫网站
2019-07-22 20:18

qq_42216752的博客本次试验只是简单的爬取好大夫官网医疗团队信息： import urllib.request import re import random uapools=[ 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:68.0) Gecko/20100101 Firefox/68.0', 'Mozilla/...
简单有效的京东评论数据爬取，附python代码
2024-12-12 22:50

吃手机用谁付的款的博客用python完成京东评论数据爬取
python实战项目52：Selenium爬取steam黑神话悟空评论
2024-11-03 23:53

wp_tao的博客 Selenium爬取steam游戏评论的思路非常简单，初始化Chromedriver，然后打开评论页面，循环下拉滚动条，每下拉一次滚动条获取一次页面源代码，使用xpath解析数据并保存数据。本文的主要目的是为大家提供完整可执行的...
jsoup实现爬取一个完整的网站，并保存到本地
2014-03-06 13:08

用jsoup实现爬取一个完整的网站，包含网站里的所有链接内容，会另存为html到本地，js和css文件也会保存到本地，可以直接在本地打开查看一个完整的网站。 eclipse项目，可以直接导入修改。提供一个链接和保存爬取后...
【2023最新B站评论爬虫】用python爬取上千条哔哩哔哩评论
2023-09-12 22:45

马哥python说的博客马哥原创：用python爬取哔哩哔哩的B站评论数据，单个视频可爬上万条。
Python爬取京东商品评论
2024-01-08 11:14

测试媛张星星的博客爬取京东商品评论
Python爬虫——爬取某网站的视频
2024-08-11 22:06

张小生180的博客爬取视频
【爬虫】4.5 实践项目——爬取当当网站图书数据
2023-06-13 00:13

即使再小的️帆也能远航的博客 Scrapy框架+Xpath信息提取方法设计商城（这里用的当当网）商品信息网站及爬虫程序，以关键字“书包”（python）搜索页面的商品，爬取（学号相关的特定某几个页面（最后一位，页面大于3）及限定数量商品（最后3位））...
Python爬取豆瓣电影评论
2024-08-10 19:41

库库林_沙琪马的博客通过上述代码，我们实现了一个简单的爬虫，它可以抓取豆瓣电影《千与千寻》的用户评论。这种方法适用于快速抓取小规模的数据集。如果你需要更高级的功能或处理大量数据，可以考虑使用更复杂的技术如异步请求、多线程...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月4日

如何爬取大夫网站的完整患者评论

7条回答 默认 最新

爬取大夫网站的完整患者评论

问题事件

7条回答默认最新