python爬虫移动端评论，浏览器能打开url，但request.get返回内容404，已加header。

python爬虫新手，想爬取一个app评论图，用charles抓包获得url，
在浏览器上能打开是一个xml文件，但是用request.get(url,header)请求开始报错405,将https改为http后报错404
实在找不出问题是什么限制访问了，望大神解答~~~

url= "https://*********************/comment-list.html?page=1&pagesize=20&type=1&fnum=HU7781&dep_code=HAK&arr_code=PEK&tag_id=images&with=reply&user_id=&access_token=jwZ9PW62rrHUWG3ZSJehX-c9PzuSEya0"（真实网址host已用*代替）**

charles报文如下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lyhsdy 2018-10-24 01:48
关注
405错误是请求方法不被允许，404错误是客户端在浏览网页时，服务器无法正常提供信息，或是服务器无法回应，所以正确是https；

1.直接在浏览器链接打开的xml是不是你需要爬的内容？？
2.如果是，尝试通过浏览器上的请求再重新get一次试试
3.如果不是，那就是请求的url给加密了，你需要做多次请求找到url变化的规律，破解后再请求

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫移动端评论，浏览器能打开url，但request.get返回内容404，已加header。 python 爬虫
2018-10-12 07:11

回答 1 已采纳 405错误是请求方法不被允许，404错误是客户端在浏览网页时，服务器无法正常提供信息，或是服务器无法回应，所以正确是https； 1.直接在浏览器链接打开的xml是不是你需要爬的内容？？ 2.
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python 爬虫 requests.get() 所有网页都打不开 python 爬虫
2022-09-24 23:49

回答 1 已采纳 http协议都没加
Python爬虫通过替换http request header来欺骗浏览器实现登录功能
2020-12-25 07:47

一个简便的方法就是自己在浏览器上登录好，然后通过下图方法（Chrome为例），找到自己的Cookie和User-Agent，然后发送request时用这复制来的header替换掉待发送的request以达到登录的目的，server端会凭这个认为你是...
python爬虫中http.client.HTTPSConnection与request的使用 python 有问必答爬虫
2021-12-26 11:25

回答 2 已采纳用它的API啊，这样就省得怕被反爬了 https://docs.opensea.io/reference/api-overview
python里requests.get到的数据.json()出错是怎么回事，求解，急！~ python 有问必答爬虫
2021-10-05 00:13

回答 3 已采纳返回的值不符合json规范，先返回文本，打印内容看看，再做处理。
Python爬虫、requests库的get方法，带上headers后出现编码错误 python 爬虫
2018-03-25 07:07

回答 4 已采纳头有问题啊！'Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/59.0'不知道怎么会出现...这种符号！自己去复制浏览器的user-ag
python3 爬虫相关学习3：response= requests.get(url)的各种属性
2023-05-15 21:04

奔跑的犀牛先生的博客网站网页的信息比如一些时间，内容，连接情况等比较用python 爬虫连接的，requests.get(url) 的而用PC的网页打开的就不一样 1.6 response.request.headers 也就是 requests.get(url).request.headers 响应对象的...
Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 21:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
Python爬虫，我用bs4的find方法为什么反回的是空值？怎么解决（已解决）？ python
2019-08-18 15:16

回答 1 已采纳 find找到空值，就证明没找到，你可以先打印request返回的内容，确认确实返回了内容再然后就是你的find查找标签，可能标签不对，先找上一级标签，print出来看行不行一级一级往下呗。
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
python request.get
2021-06-24 10:11

gtestcandle的博客 requests.request() 构造一个请求，支撑以下各方法的基础方法 requests.get() 获取HTML网页的主要方法，对应于HTTP的GET requests.head() 获取HTML网页的头信息的方法，对应于HTTP的HEAD requests....
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
python 爬虫之URLlib之request.Request
2022-04-05 12:46

燕山之边的博客 request.Request用于请求页面数据数据，与urlopen函数相比，功能更强大，可以带参数。比如头文件请求。函数原型： urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=...
python request headers获取_Python爬虫实战—— Request对象之header伪装策略
2020-12-11 14:34

weixin_39998881的博客在header当中，我们经常会添加两个参数——cookie 和 User-Agent，来模拟浏览器登录，以此提高绕过后台服务器反爬策略的可能性。User-Agent获取User-Agent可通过随机发送请求并进入开发者工具来提取。在这里，我也...
没有解决我的问题, 去提问

悬赏问题

¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler
¥15 关于#python#的问题：自动化测试

python爬虫移动端评论，浏览器能打开url，但request.get返回内容404，已加header。

1条回答 默认 最新

悬赏问题

1条回答默认最新