乔大将军 2021-08-20 20:07 采纳率: 100%
浏览 333
已结题

求每次只能爬取第一页的数据,如何爬取这种翻页的网页代码!

最近遇到了项目遇到了这样的问题,如下所示爬虫爬取下一页的内容,求各位解决解决
img

  • 写回答

4条回答 默认 最新

  • CSDN专家-showbo 2021-08-20 20:46
    关注

    直接请求数据接口就行了,分页参数是pn,这修改就行,示例代码如下,有帮助麻烦点个采纳【本回答右上角】,谢谢~~有其他问题可以继续交流~

    http://3.push2.eastmoney.com/api/qt/clist/get?cb=jQuery1124032332843249790666_1629461999400&pn={}&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=2&invt=2&fid=f3&fs=m:1+t:2,m:1+t:23&fields=f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152&_=1629461999333
    
    

    img

    数据对照

    img

    import requests
    url="http://3.push2.eastmoney.com/api/qt/clist/get?pn={}&pz=20&po=1&np=1&ut=bd1d9ddb04089700cf9c27f6f7426281&fltt=2&invt=2&fid=f3&fs=m:1+t:2,m:1+t:23&fields=f1,f2,f3,f4,f5,f6,f7,f8,f9,f10,f12,f13,f14,f15,f16,f17,f18,f20,f21,f23,f24,f25,f22,f11,f62,f128,f136,f115,f152&_=1629461999333"
    headers={
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36" ,
        "Referer":"http://quote.eastmoney.com/center/gridlist.html"
    }
    for i in range(1,3):#采集前2页
        rurl=url.format(i)
        r=requests.get(rurl,headers=headers)
        data=r.json()
        for item in data['data']['diff']:
            print('代码:%s\t名称:%s\t最新价:%s\t涨跌幅:%s'%(item['f12'],item['f14'],item['f2'],item['f3']))
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 8月30日
  • 已采纳回答 8月22日
  • 创建了问题 8月20日

悬赏问题

  • ¥100 set_link_state
  • ¥15 虚幻5 UE美术毛发渲染
  • ¥15 CVRP 图论 物流运输优化
  • ¥15 Tableau online 嵌入ppt失败
  • ¥100 支付宝网页转账系统不识别账号
  • ¥15 基于单片机的靶位控制系统
  • ¥15 真我手机蓝牙传输进度消息被关闭了,怎么打开?(关键词-消息通知)
  • ¥15 装 pytorch 的时候出了好多问题,遇到这种情况怎么处理?
  • ¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
  • ¥15 手机接入宽带网线,如何释放宽带全部速度