Python爬虫，进去一个网页之后，想要跳转到这个网页的子网页爬取，但是必须通过主网页点击才能进去。

图片说明

上面是按F12得到的该网页进入“子网页”的函数，请问怎么处理才能进去“子网页”页面？（直接访问子网页网址会提示你要从主网页进去）

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-06-30 10:22
关注
用浏览器的f12功能抓包看下。
一般来说“通过主网页点击才能进去”这个服务器是通过referer这个字段判断的，也就是拟提交的请求，包括
referer: 你的主页url
那么就可以骗过服务器，让它认为你是通过主网页点击进去的。
另一个就是，你传入的rand=xxx这个参数，要根据当前时间生成，而不能是死的。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫爬取不同网页的相似内容 python 爬虫
2022-03-11 17:52

回答 2 已采纳 re模块，正则表达式，split切分
python 爬虫 requests.get() 所有网页都打不开 python 爬虫
2022-09-24 23:49

回答 1 已采纳 http协议都没加
python--爬虫 requests库如何进行网页等待？ python 数据挖掘
2019-03-14 10:02

回答 2 已采纳好像不行，推荐用selenium吧，implicitly_wait方法
python爬取多个网页_python网络爬虫之使用scrapy自动爬取多个网页(示例代码)
2020-11-29 11:16

weixin_39994461的博客可以点击返回目录还是下一页对应的网页代码：我们再看进入后面章节的网页，可以看到增加了上一页对应的网页代码：通过对比上面的网页代码可以看到. 上一页，目录，下一页的网页代码都在下的元素的href里面。不同的是...
selenium爬虫遇到VIP页面以及爬取次数限制时该怎么办 python selenium 爬虫
2021-10-24 12:56

回答 1 已采纳遇到VIP页面，我想你应该需要一个VIP会员，并以登入破解。限制爬取次数上，可以用proxy轮转或尽量拉长sleep时间或多办几个账号以上浅见
新手做了一个随机跳转网站的爬虫，但不知道错误在哪 python
2019-02-14 22:05

回答 1 已采纳 https://blog.csdn.net/ingiaohi/article/details/72672169
selenium 怎么get到需要token的网页上？ python selenium
2021-09-22 15:39

回答 1 已采纳使用selenium 填写表单登录成功之后，可以获取到登录的cookie的，driver.get_cookies()再将获取到的cookie，放入header中，使用requests请求接口时带上co
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一...答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，这门语言入门挺简单的，特别是对于那些有其他编程语言经验的人。
使用requests 获取博客园每页内容时，为什么一直重复爬取第一页内容？感谢大佬 python 有问必答
2021-04-03 09:45

回答 4 已采纳问题出在urls构造上，第一页和后续网页的地址是不一样的，将这行改为：urls = [f'https://cnblogs.com/#p{page}' if page == 1 else f'https
爬虫爬到的新闻数据怎么让小程序展现出来？ python 后端爬虫
2022-03-27 23:50

回答 3 已采纳两种方案：实时抓取显示：由于你使用的是云开发技术，可以使用nodejs技术实现爬虫，直接将爬取的过程使用nodejs封装成一个云函数放上去运行，这样也可以省去后端服务器，我的一个菜谱小程序就是这样做
爬虫python 中国新闻网搜索引擎无法请求 python 有问必答
2021-12-23 10:17

回答 1 已采纳 headers缺少了cookie，这个网址通过js生成这__jsluid_h，__jsl_clearance这2个cookie，没有的话会输出js生成cookie然后再跳转到搜索结果页示例代码如下
Python爬虫实例：爬取某个网页的子网页
2019-10-12 17:33

VM_Alike的博客比如现在有常见域名名单（百度、腾讯、搜狐等等），笔者要做的是对每一个域名爬取其所有的子网站，比如腾讯对应的还有腾讯视频、微信、QQ、腾讯新闻等等。笔者的输入是一个包含常见域名白名单的xls文件，输出是一...
请教一个关于iframe嵌套其他页面的问题？ html python 前端框架
2021-12-05 21:11

回答 1 已采纳看你tag了python你还是爬一些关键信息存放到自己的数据库里吧，做个cache参考搜索引擎的快照功能
python爬取网页数据软件_python爬虫入门10分钟爬取一个网站
2020-12-05 12:20

weixin_39614521的博客一、基础入门1.1什么是爬虫爬虫(spider，又网络爬虫)，是指向网站/网络发起请求，获取资源后分析并提取有用数据的程序。从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的HTML代码/JSON数据/二...
python爬取重定向的网页_python爬虫解决网页重定向问题
2020-12-06 00:43

weixin_39642998的博客笔者编写的搜索引擎爬虫在爬取页面时遇到了网页被重定向的情况，所谓重定向(Redirect)就是通过各种方法（本文提到的为3种）将各种网络请求重新转到其它位置（URL）。每个网站主页是网站资源的入口，当重定向发生在...
没有解决我的问题, 去提问

悬赏问题

¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)
¥20 matlab yalmip kkt 双层优化问题
¥15 如何在3D高斯飞溅的渲染的场景中获得一个可控的旋转物体

Python爬虫，进去一个网页之后，想要跳转到这个网页的子网页爬取，但是必须通过主网页点击才能进去。

1条回答 默认 最新

悬赏问题

1条回答默认最新