是奔波儿灞啊 2021-05-16 11:55 采纳率: 50%
浏览 181
已采纳

响应码是<Response [200]>, 但服务器返回的是404页面,这种情况该怎么爬取内容

最近在练习python爬虫,在爬取某个网站时,发现这个网站的响应码是200,可他返回的却是一个404页面,服务器使用的是nginx。

在网上查了一下应该是设置了反爬虫策略,这种情况应该怎么获取真正的url呢?

  • 写回答

2条回答 默认 最新

  • 江天暮雪丨 2021-05-17 09:06
    关注

    可能是请求头中有必须传的参数,用postman模拟请求试试

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥20 Qt Quick Android 项目报错及显示问题
  • ¥15 而且都没有 OpenCVConfig.cmake文件我是不是需要安装opencv,如何解决?
  • ¥15 oracleBIEE analytics
  • ¥15 github录制项目
  • ¥15 H.264选择性加密例程
  • ¥50 windows的SFTP服务器如何能批量同步用户信息?
  • ¥15 centos7.9升级python3.0的问题
  • ¥15 安装CentOS6时卡住
  • ¥20 c语言写的8051单片机存储器mt29的模块程序
  • ¥60 求直线方程 使平面上n个点在直线同侧并且距离总和最小