python爬虫移动端评论，浏览器能打开url，但request.get返回内容404，已加header。

python爬虫新手，想爬取一个app评论图，用charles抓包获得url，
在浏览器上能打开是一个xml文件，但是用request.get(url,header)请求开始报错405,将https改为http后报错404
实在找不出问题是什么限制访问了，望大神解答~~~

url= "https://*********************/comment-list.html?page=1&pagesize=20&type=1&fnum=HU7781&dep_code=HAK&arr_code=PEK&tag_id=images&with=reply&user_id=&access_token=jwZ9PW62rrHUWG3ZSJehX-c9PzuSEya0"（真实网址host已用*代替）**

charles报文如下

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lyhsdy 2018-10-24 01:48
关注
405错误是请求方法不被允许，404错误是客户端在浏览网页时，服务器无法正常提供信息，或是服务器无法回应，所以正确是https；

1.直接在浏览器链接打开的xml是不是你需要爬的内容？？
2.如果是，尝试通过浏览器上的请求再重新get一次试试
3.如果不是，那就是请求的url给加密了，你需要做多次请求找到url变化的规律，破解后再请求

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 爬虫 requests.get() 所有网页都打不开 python 爬虫
2022-09-24 23:49

回答 1 已采纳 http协议都没加
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python爬虫中http.client.HTTPSConnection与request的使用 python 有问必答爬虫
2021-12-26 11:25

回答 2 已采纳用它的API啊，这样就省得怕被反爬了 https://docs.opensea.io/reference/api-overview
Python爬虫通过替换http request header来欺骗浏览器实现登录功能
2020-12-25 07:47

一个简便的方法就是自己在浏览器上登录好，然后通过下图方法（Chrome为例），找到自己的Cookie和User-Agent，然后发送request时用这复制来的header替换掉待发送的request以达到登录的目的，server端会凭这个认为你是...
python里requests.get到的数据.json()出错是怎么回事，求解，急！~ python 有问必答爬虫
2021-10-05 00:13

回答 3 已采纳返回的值不符合json规范，先返回文本，打印内容看看，再做处理。
Python爬虫、requests库的get方法，带上headers后出现编码错误 python 爬虫
2018-03-25 07:07

回答 4 已采纳头有问题啊！'Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/59.0'不知道怎么会出现...这种符号！自己去复制浏览器的user-ag
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
python爬虫爬取百度百科页面.zip
2024-02-02 11:35

Python爬虫通常由以下几个部分组成：请求（Request）、解析（Parsing）和存储（Storing）。请求模块负责向目标网站发送HTTP请求，获取网页内容；解析模块处理获取到的HTML或XML等格式的数据，提取所需信息；存储模块...
Python中scrapy.FormRequest老是返回400错误响应 python
2022-09-17 21:20

回答 2 已采纳你可以参考下这篇文章：scrapy框架中的Request()、FormRequest()、FormRequest.from_response()的小结
Python爬虫，我用bs4的find方法为什么反回的是空值？怎么解决（已解决）？ python
2019-08-18 15:16

回答 1 已采纳 find找到空值，就证明没找到，你可以先打印request返回的内容，确认确实返回了内容再然后就是你的find查找标签，可能标签不对，先找上一级标签，print出来看行不行一级一级往下呗。
在用request库爬虫时，已经修改了headers，但status_code仍为418，请问这是什么情况？ chrome python
2020-06-27 10:52

回答 1 已采纳试试这个 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:74.0) Gecko/20100101
python3爬虫怎样构建请求header
2020-12-23 22:40

在Python 3中进行网络爬虫开发，设置合适的请求头（Header）是至关重要的一步，因为这可以帮助我们伪装成浏览器，避免被目标网站识别为自动化工具。以下将详细讲解如何在Python 3中构建请求头，并提供相关示例。 ...
python request.get
2021-06-24 10:11

gtestcandle的博客 requests.request() 构造一个请求，支撑以下各方法的基础方法 requests.get() 获取HTML网页的主要方法，对应于HTTP的GET requests.head() 获取HTML网页的头信息的方法，对应于HTTP的HEAD requests....
python爬虫基础课件.pdf
2021-06-20 23:44

根据提供的文件信息，这份python爬虫基础课件主要涵盖了网络爬虫的概念、原理、基本流程以及实现数据抓取和处理的关键技术点。首先，网络爬虫是自动获取网页内容的程序，常用于搜索引擎、数据采集等场景。网络爬虫...
python爬虫之request.get()参数
2019-10-16 09:03

麻辣灬香蕉的博客文章目录前情回顾目前反爬总结请求模块总结解析模块总结xpath表达式增量爬虫如何实现Chrome浏览器安装插件今日笔记链家二手房案例（xpath）百度贴吧图片抓取requests.get()参数查询参数-paramsWeb客户端验证参数-...
没有解决我的问题, 去提问

python爬虫移动端评论，浏览器能打开url，但request.get返回内容404，已加header。

1条回答 默认 最新

1条回答默认最新