求每次只能爬取第一页的数据，如何爬取这种翻页的网页代码！

最近遇到了项目遇到了这样的问题，如下所示爬虫爬取下一页的内容，求各位解决解决

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

CSDN专家-showbo 2021-08-20 20:46

关注

直接请求数据接口就行了，分页参数是pn，这修改就行，示例代码如下，有帮助麻烦点个采纳【本回答右上角】，谢谢~~有其他问题可以继续交流~

http://3.push2.eastmoney.com/api/qt/clist/get?cb=jQuery1124032332843249790666_1629461999400&pn={}&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=2&invt=2&fid=f3&fs=m:1+t:2,m:1+t:23&fields=f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152&_=1629461999333

数据对照

import requests
url="http://3.push2.eastmoney.com/api/qt/clist/get?pn={}&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=2&invt=2&fid=f3&fs=m:1+t:2,m:1+t:23&fields=f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152&_=1629461999333"
headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36" ,
    "Referer":"http://quote.eastmoney.com/center/gridlist.html"
}
for i in range(1,3):#采集前2页
    rurl=url.format(i)
    r=requests.get(rurl,headers=headers)
    data=r.json()
    for item in data['data']['diff']:
        print('代码：%s\t名称：%s\t最新价：%s\t涨跌幅：%s'%(item['f12'],item['f14'],item['f2'],item['f3']))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

求每次只能爬取第一页的数据，如何爬取这种翻页的网页代码！ python 有问必答
2021-08-20 20:07

回答 4 已采纳直接请求数据接口就行了，分页参数是pn，这修改就行，示例代码如下，有帮助麻烦点个采纳【本回答右上角】，谢谢~~有其他问题可以继续交流~ http://3.push2.eastmoney.com/api
python爬虫翻页爬取的数据是第一页的重复数据 python 爬虫问答团队
2021-12-18 19:23

回答 1 已采纳爬下一页就好了
在以瀑布流方式翻页的网站,使用scrapy网络爬虫,但是只爬取了第一页数据,没有爬取第二页. python 爬虫
2021-09-05 19:18

回答 2 已采纳那叫ajax，
python爬虫爬取网页时翻页只能翻出一页_python爬虫网页，为啥始终无法爬出翻页的内容?...
2020-12-04 02:29

weixin_39778150的博客爬出来始终是第一页的内容import requestsfrom requests.exceptions import RequestExceptionfrom pyquery import PyQuery as pqimport reimport simplejson as jsondef get_one_page(url):try:response=requests....
使用requests 获取博客园每页内容时，为什么一直重复爬取第一页内容？感谢大佬 python 有问必答
2021-04-03 09:45

回答 4 已采纳问题出在urls构造上，第一页和后续网页的地址是不一样的，将这行改为：urls = [f'https://cnblogs.com/#p{page}' if page == 1 else f'https
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
爬取链家网房源数据，无法成功翻页，求解 python 有问必答
2021-06-04 17:40

回答 2 已采纳应该是翻页的定位不准，可以打开浏览器的开发者工具，可以复制xpath，用xpath定位试试，如果翻页只是在上一页的url增加了参数，可以自己修改url，用browser.get(url)访问第二页
Python数据爬取超详细讲解（零基础入门，老年人都看的懂）
2020-07-13 11:16

码农BookSea的博客关于Python爬虫的超详细讲解，用例子来给大家一步步分析爬虫的代码原理，由浅入深，老年人来了，我也给你整明白。
请问为什么当我试图储存爬到的多个页面的数据时，只能保存最后一页的数据 python
2020-01-11 23:17

回答 1 已采纳我把你写的爬虫代码给简单改了下，用正则匹配你这个写的有问题，后期需要加强下正则学习，我用lxml解析的源代码，因为你写的是同步执行的，所以我也是同步执行的，没有改成异步的，这样爬虫用异步方式是最好的
python爬取证监会行政监管措施遭遇 IndexError: list index out of range python 有问必答爬虫
2022-01-25 13:06

回答 3 已采纳 http://www.csrc.gov.cn/searchList/58959eb1bd68458088cac63f46a5fa40?_isAgg=true&_isJson=true&_pageSiz
python爬虫数据与网页不一致 python 爬虫
2022-08-16 16:50

回答 2 已采纳 rows是行数，你改成10000，一次性爬完，不用翻页。
python爬虫爬取网页时翻页只能翻出一页_写爬虫如何获取网页页数并使程序跑完第一页继续前往下一页？...
2020-12-04 02:29

weixin_39647773的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼# -*- coding: utf-8 -*-import urllibimport reimport timeimport os#显示下载进度def schedule(a,b,c):'''''a:已经下载的数据块b:数据块的大小c:远程文件的大小'''per ...
PYTHON etree无法获得数据 python 爬虫
2021-08-27 14:40

回答 2 已采纳代码书写没问题，是你ps = tree.xpath('//head/text()')匹配的原因。
python爬取换页_Python爬虫翻页只爬取了第一页内容？
2020-11-23 05:02

weixin_39938312的博客写这种类型的翻页代码要注意书写顺序, 首先写第一页的, 测试之后在最外面加个循环就好了.下面是细节问题:首先第一页和第二页的url格式不太一样, 第一反应应该是测试一下第一页能不能套用第二页的格式, 一般情况下,...
如何利用Python爬虫爬取网页中图片(成功实现自动翻页至最后一页)
2022-01-17 10:12

mhaa的博客网页图片的爬取
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月20日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

求每次只能爬取第一页的数据，如何爬取这种翻页的网页代码！

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新