python 爬取网页里面的xhr文件。

最近在爬虫实战中，想要爬取一段网页里面的xhr文件，观察到此文件是post请求的，用python里面的request.post怎么都获取不到，但是状态码为200.后来试着在浏览器里面直接打开这个url，发现也是什么都没有。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2019-05-07 20:49
关注
首先，在常规头部获取请求的url，然后查看请求方法，获取请求状态，如果是失败，就说明不是这个。
然后，请求头部，将所有的headers放到requests的headers参数里面(可以包含cookie)
如果没有包含cookie，就在cookie参数传入，headers和cookie必然是字典类型的。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用Python爬取一个网页并解析
2021-05-15 20:27

执章学长的博客使用Python爬取一个网页并解析爬虫准备Python基础语法爬取一个网页的整体思路基础概念简单思路详细思路代码示例数据在目标url中数据通过其他url返回爬虫准备 Python基础语法首先，当你看到这篇文章的时候，我们...
【Python学习笔记】：Python爬取音频
2024-07-15 10:36

百里香酚兰的博客于是就去搜索页面这种有大量id的网页，通过检查HTML代码的方法，找到了要薅羊毛的这个大集合目标网址的HTML代码，...前面我们根据链接直接下载歌曲文件的时候，就用的content方法，直接获取歌曲的二进制文件并保存。
python爬取网页network_网页爬取时执行状态成功，但获取不到想要的数据的时候解决方法(Network,XHR,json)...
2020-12-03 06:53

weixin_39524574的博客 Network:当我们爬取网页的内容，对源代码进行请求，响应的源代码中没有我们需要的东西时，需要查看Network打开需要爬取的网页，进行源码检查，会发现左边框框里的是Elements，右边框框是我们需要关注的Network ...
Python爬虫自学笔记（三）动态网页爬取
2021-09-13 00:04

阿尔法羊的博客这里有一排菜单，最左边的是Element，显示的是网页的源代码，如果在这里能直接找到所需要爬取的内容，就说明这是静态页面，可以用 request库和BeautifulSoup4库的工具爬取所需内容。如果这里找不到所需内容，那么...
动态网页爬取：Python如何获取JS加载的数据？
2025-05-22 16:35

小白学大数据的博客本文介绍了如何使用Python爬取JavaScript加载的数据，主要方法包括分析网络请求、使用Selenium模拟浏览器行为以及使用Pyppeteer进行无头浏览器爬取。通过分析AJAX请求，可以直接获取数据；Selenium和Pyppeteer则能...
python爬取js_小白请教高手，python爬取数据遇到js隐藏div怎么办
2020-11-23 23:25

weixin_39952074的博客使用network查看XHR发现有个文件“GetBuildTableByAjax.ashx”，这里面的preview中就有相关信息。截取片段是这样的：物业类别：住宅销售状态：抵预建筑面积：117.260平米总价：71.65万元'class='border-333...
python爬取网易云_利用python爬取网易云音乐，并把数据存入mysql
2020-11-29 21:14

weixin_39607837的博客作者：sergiojune Python爱好者社区--专栏作者个人公众号：日常学python专注python爬虫，数据可视化，数据分析，python前端技术公众号：Python爱好者社区获取本文代码方式：关注Python爱好者社区，回复网易云在简单...
python爬取抖音用户数据_使用python爬取抖音视频列表信息
2020-11-23 16:30

weixin_39596835的博客下面介绍介绍如何使用python导出特定用户所有视频信息抓包分析Chrome Deveploer Tools Chrome 浏览器开发者工具在抖音APP端，复制vlogger主页地址，比如： http://v.douyin.com/kGcU4y/ ，在PC端用chrome浏览器...
Backend - Python/Django 将数据下载存储到Excel文件中
2024-11-04 11:17

萝卜干榨菜酱的博客获取数据库的数据or获取网页数据下载到Excel文件中、openpyxl、Django
python爬取虎扑评论_Python爬取NBA虎扑球员数据
2020-12-06 04:36

weixin_39592315的博客虎扑是一个认真而有趣的...受害者地址https://nba.hupu.com/stats/players本文知识点：系统分析网页性质结构化的数据解析csv数据保存环境介绍：python 3.6pycharmrequestscsv爬虫案例的一般步骤1.确定url地址(网页分...
Python 爬虫（1）基础 | XHR
2024-12-09 09:47

一个不务正业的程序猿的博客 XHR，全称XMLHttpRequest，是一种在无需重新加载整个网页的情况下，能够更新部分网页的技术。它允许网页的JavaScript代码与服务器进行异步通信，即在发送请求后，浏览器不会阻塞用户的后续操作，而是等待服务器响应...
python爬取斗鱼视频
2024-05-05 12:15

python和前端学习的博客把此方法粘贴到此处，定义a o s三个值鼠标放在aos 上复制值到代码中，执行函数console.log(ub98484234(a, o , s))视频地址，检索mp4格式文件没有，大概率是m3u8视频流，检索m3u8，找到接口getStreamUrlWeb。...
python爬取百度迁徙数据_python爬虫-动态爬取百度迁徙
2020-11-29 04:22

weixin_39679061的博客寻找的数据就不在前端上面找了，而是在加载的文件中寻找打开网页F12，一般我们先看js文件，如果没有，看看XHR等其他文件。按size排序，从大到小，查找数据点击Preview选项，一个个查找，可以看到这里与前端显示的...
Python网络数据爬取实战指南
2025-08-06 17:58

与非门c的博客 {self.products[product_id]['name']} " f"当前价{price}低于阈值" f"{self.products[product_id]['threshold']}") 七、爬虫工程师的自我修养技术栈扩展：前端基础（理解网页结构）网络协议（HTTP/HTTPS/TCP） ...
Python 爬虫爬取多页数据
2024-06-19 11:36

2401_84123265的博客小编综合了阿里的面试题做了一份前端面试题PDF文档，里面有面试题的详细解析。
Python爬虫入门(一)（适合初学者）
2022-09-08 23:09

web13985085406的博客 ajax请求一般是对动态数据进行请求，即前端向后端发起请求，动态请求到后端数据库中的数据，并将这些数据展示在前端网页中。（可能会感觉听起来云里雾里，没关系哦，后面根据一个一个的例子可以更好的了解，或者小编...
利用python中的requests模块爬取B站评论
2022-07-05 22:09

>不成大佬不改名的博客 python爬虫爬取B站评论
利用Python爬取百度指数中需求图谱的关键词
2021-03-10 22:01

不想努力的胖子-的博客文章目录需求背景一、使用datetime计算查询的日期二、爬取需求图谱关键词三、扔进csv里总结需求背景因为百度指数中需求图谱的关键词只以一周为单位显示，所以为了将更多天数的关键词汇总，写了以下代码帮助大家~ ...
python爬取js变量_Python爬虫实战入门五：获取JS动态内容—爬取今日头条
2020-12-15 18:17

weixin_39560002的博客之前我们爬取的网页，多是HTML静态生成的内容，直接从HTML源码中就能找到看到的数据和内容，然而并不是所有的网页都是这样的。有一些网站的内容由前端的JS动态生成，由于呈现在网页上的内容是由JS生成而来，我们能够...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月16日

python 爬取网页里面的xhr文件。

1条回答 默认 最新

问题事件

1条回答默认最新