python 爬虫XHR获取失败

需求是这样的，我需要写一个爬虫把
http://www.bjbus.com/home/fun_news_list.php?uNewsType=1&uStyle=1
上的所有list和其中的链接爬下来并每天定时查看有没有新的公告。进行简单的
response = urllib2.urlopen('http://www.bjbus.com/home/fun_news_detail.php?uNewsCode=00003475&uNewsType=1')
print html = response.read()
发现没有我想要的内容，进一步我发现我想要的东西是通过这个发来的
http://www.bjbus.com/home/ajax_news_list.php
但我单独请求这个没有任何返回，尝试了自己编写headers后无果，请大神们帮帮忙
怎么才能获得所有的公告和其对应的链接。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
karen__ 2017-10-23 04:09
关注
你要用post去请求，我使用的是request库
import requests
url = 'http://www.bjbus.com/home/ajax_news_list.php'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}
data = {'txtPage':1, 'txtDisplayRows':9, 'txtType':1, 'txtCode':'', 'txtContainer':'content', 'txtStyle':1}
response = requests.post(url, headers = headers, data = data)
print(response.content.decode('utf-8'))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

政策字典Python爬虫（XHR请求，详细过程附源代码）
2024-08-06 09:42

ksksksj的博客【代码】人才山东—政策字典Python爬虫（XHR请求，详细过程附源代码）
Python爬虫无xhr
2024-08-18 03:23

人生回答机的博客我整理的一些关于【Python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/Hpqqk2Python 爬虫无 XHR 的实现指南在现代网站中，数据很多时候并不是直接在 HTML 中呈现的。这些网站...
Python 爬虫（1）基础 | XHR
2024-12-09 09:47

一个不务正业的程序猿的博客 XHR，全称XMLHttpRequest，是一种在无需重新加载整个网页的情况下，能够更新部分网页的技术。它允许网页的JavaScript代码与服务器进行异步通信，即在发送请求后，浏览器不会阻塞用户的后续操作，而是等待服务器响应...
XHR如何爬虫_程序员如何炼成 Python 爬虫“王者”？
2020-10-21 22:56

weixin_39664456的博客作者 |周萝卜责编 | 郭芮出品 | CSDN(ID：CSDNnews)本文章精选了五个爬虫实例，希望能够给想要入门 Python 爬虫的小伙伴儿们一些帮助。网易精选评价爬取首先来看一个网易精选网站的爬虫例子，可以爬取评价的商品很多...
python爬虫json网页_python爬虫——Network\XHR\json
2020-11-30 11:11

weixin_39620679的博客而下一行，就是各个请求，你可以看下面这张表来理解 XHR(XHR and Fetch) Ajax技术:我们观察到浏览器的地址栏里面的网址并没有发生变化，但是网页却不断有新增的内容出现。这种技术在工作的时候，会创建一个XHR...
python爬虫之异步XHR爬取
2017-10-24 23:07

一身诗意千寻瀑的博客 1.在爬取是若json文件中key，也就是{‘key’:'value'}中的key，如有‘.’则在插入mongodb数据库的时候会提示插入失败原因是key包含‘.’ 解决方法：regex=re.compile('\.') content=regex.sub('_',content)用...
Python爬虫第四课：Network、XHR、json
2020-02-29 11:11

林小卫很行的博客在爬虫实践当中，如果我们爬取的页面的编写没有做好板块的区分，或者我们选取的标签不合适，最终我们获得的结果会多提取到出一些奇怪的东西。当使用用request获取的网页源代码里没有我们想要的数据时，需要重新...
[python爬虫基础]初步认识network/XHR
2020-07-18 18:33

Sfiaflys的博客仅查看XHR，一种不借助刷新即可传输数据的对象 Doc Document，第0个请求一般在这里。(第0个请求：浏览器的框架） Img 仅查看图片 Media 仅查看媒体文件 JS和CSS 前端代码，负责发起请求和页面实现 Front ...
python爬虫之post请求ajax数据
2024-05-22 22:03

杂记铺的博客 python爬虫之post请求ajax数据
python爬虫实战训练
2025-05-16 18:53

咕噜咕噜啦啦的博客 =200: raise Exception('error') data=r.json()["data"] #r.json()方法会将返回的JSON格式的响应解析为一个Python对象(一般为字典/列表),我们取出‘data’键的值(是字符串) data=StringIO(data) #使用StringIO对象来...
python爬虫实现POST request payload形式的请求
2020-09-17 11:58

Python爬虫实现POST请求，尤其是以request payload形式发送数据，是一种常见的网络抓取技术，尤其在处理需要提交复杂数据或模拟登录的场景中至关重要。在HTTP请求中，POST请求通常用于向服务器提交数据，而数据的...
Python爬虫篇：爬虫笔记合集
2022-04-20 17:30

五包辣条！的博客学习爬虫你完全可以理解为找辣条君借钱（借100万），首先如果想找辣条借钱那首先需要知道我的居住地址，然后想办法去到辣条的所在的（可以走路可以坐车），然后辣条身上的东西比较多，有100万，打火机，烟，手机衣服...
python爬虫笔记
2024-03-01 23:47

齐飞的博客 python爬虫笔记
Python 爬虫实战：通过 AJAX 获取简书文章标题与阅读量（XHR 请求分析与分页逻辑）
2025-05-18 20:42

Python核芯的博客在当今的互联网时代，数据已经成为了一种宝贵的资源。对于开发者来说，如何高效地获取和...本文将详细介绍如何通过 Python 爬虫技术，利用 AJAX 请求获取简书网站上的文章标题与阅读量，并分析 XHR 请求与分页逻辑。
解析Python爬虫中的Cookies和Session管理
2025-07-06 20:42

程序员威哥的博客 3)配合Selenium模拟完整登录流程获取Cookie；4)通过CookieJar持久化保存Cookie。文章还提供了常见问题排查技巧和实战建议，推荐根据需求选择不同方法，其中Selenium+requests组合对抗验证码效果最佳，Session方法...
Python爬虫系列（二）——Python爬虫批量下载百度图片
2021-10-24 16:32

纸照片的博客 Python爬虫批量下载百度图片
用python抓取一个网页的xhr,python爬取网站数据代码
2024-06-16 14:01

2401_85415578的博客这篇文章主要介绍了python抓取网页数据并写入excel，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。
超级简单的Python爬虫教程
2022-09-22 15:58

快乐老男孩！的博客这篇 Python 爬虫教程主要讲解以下 5 部分内容：了解网页；使用 requests 库抓取网站数据；使用 Beautiful Soup 解析网页；清洗和组织数据；爬虫攻防战；
python爬虫js逆向（标准算法加密）
2024-05-25 16:38

本本的小橙子的博客在爬取某些网站时，可能会遇到一些参数或头部信息进行字符串加密、数据加密...爬虫大佬必修课，2024年Python爬虫进阶教程，企业级逆向实战（逆向各种参数、验证码、滑块、算法）学爬虫看着一套就够了_哔哩哔哩_bilibili
没有解决我的问题, 去提问

python 爬虫XHR获取失败

2条回答 默认 最新

2条回答默认最新