scrapy框架爬取并解析开发者工具network中的php文件

想要爬取当当图书网页的评论信息

评论页并不是一个url，而是一个javascript

如图：图片说明

这些评论信息在源代码是不显示的，返回的形式是在network里边的XHR

如图：图片说明

我需要对这个文件进行解析提取一些数据，并且我想找到一个办法能够获得这本书的评论下的所有的XHR文件

各位大佬能不能教教我

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Danchela 2022-03-01 20:46
关注
老哥你搞定没我也遇到了唉

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

scrapy-爬取京东笔记本电脑信息问题 chrome python selenium 开发语言
2020-09-01 19:12

回答 2 已采纳 ``` browser.quit() return HtmlResponse(url=request.url, body=browser.page_source, re
利用scrapy如何爬取图表中的数据 python 其他有问必答
2021-07-07 23:48

回答 1 已采纳 scrapy得出的响应内容是在network的doc里面，如图如果对你有帮助，可以点击我这个回答右上方的【采纳】按钮，给我个采纳吗，谢谢
scrapy 怎么爬取网页中标签栏下的所有标签? python 爬虫
2022-10-19 14:43

回答 1 已采纳
爬虫攻守道 - 2023最新 - JS逆向 - Python Scrapy实现 - 爬取某天气网站历史数据
2023-01-10 17:18

biaobro的博客爬虫与反爬虫 - 2023最新爬取某天气网站历史数据 - JS逆向 - Python实现
请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
Scrapy框架时爬取网页时报错 python 有问必答
2021-05-26 16:56

回答 2 已采纳你的数据清洗方法用错了，参考一下：https://blog.csdn.net/qq_43004728/article/details/84586628，如有帮助，望采纳
scrapy框架+formdata+ajax爬取及翻页问题 python 数据挖掘测试用例
2020-03-25 14:18

回答 1 已采纳 def parse(self, response): result = eval(response.body.decode('utf-8')) 兄弟，你打印一下resu
scrapy框架之创建项目
2019-11-26 12:02

蔓越莓酥的博客 scrapy startproject ProName scrapy.cfg 基本不用修改 items.py 存储相关 pipelines 储存相关 Scrapy Engine Scheduler Downloader 创建完的项目里面没有包含这三项, 代表项目以及给我们封装好了功能, ...
scrapy通用爬虫parse解析中的问题 python 爬虫
2022-10-16 01:14

回答 1 已采纳检查一下parse item 函数的response是否是正常的
如何利用scrapy爬取带标签的网页内容并保存到自己的服务器上？ mysql python sql
2018-02-09 09:34

回答 3 已采纳 1. 把整个爬取到的网页内容直接存储到数据库肯定是可以的，你之所以没有成功，应该是因为你的数据库中的相应字段错了，整个网页内容都比较长，一般都是要用text字段，甚至是LongText)（最大长度42
使用python scrapy框架写爬虫如何爬取搜狐新闻的参与人数？ python 爬虫
2016-03-29 10:07

回答 2 已采纳这个是可能异步ajax返回的，所以需要用selenium等webdriver来处理
scrapy 爬取拉勾网职位信息
2018-07-24 19:26

好好生活ying的博客使用python爬虫框架，爬取拉勾网职位信息， 2.将爬取的职位信息存储到json格式的文件中 3.将爬取的数据进行数据分析 1.图片中的链接是职位列表页的链接，进行翻页，该链接没有变化，无法从该链接中爬取数据...
scrapy框架中多爬虫文件情况下怎么设置那个爬虫走那个管道类呢？ python redis 爬虫
2021-09-02 17:19

回答 2 已采纳方法一：在pipeline里添加管道类，在close_spider方法里根据 spider.name 进行判断，进行对应处理最后在settings中开启管道。方法二：scrapy用system命令在
python3 scrapy 入门级爬虫爬取数万条拉勾网职位信息
2017-11-21 00:10

dangsh_的博客首先通过pip 安装scrapy ，安装方式一百度一大堆~ 这里就不再赘述安装成功之后，开始今天的教程执行：scrapy startproject First 生成项目文件如图所示即为创建项目成功创建成功后会生成如图所示的目录...
Python爬取新浪国内新闻课程设计实验报告（附代码）
2024-01-12 10:43

keer957的博客目的：熟悉Python网页爬取方法。分析新浪国内新闻首页页面组织，利用urllib及Beautifulsoup爬取新浪国内新闻。实现功能： 1. 爬取至少20条新闻。 2. 获取其中一条新闻的具体内容。 3. 获取20条新闻的具体内容，并以...
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)

scrapy框架爬取并解析开发者工具network中的php文件

1条回答 默认 最新

悬赏问题

1条回答默认最新