爬虫爬取数量改变不了，如何解决？


import requests
import json
if __name__ == '__main__' :
    start_url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList'
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.99 Safari/537.36 Edg/97.0.1072.69'
    }
    ID_dic = []
    info1 = []
    for page in range(1,6):
        page = str(page)
        data = {
            'on': 'true',
            'page' : page,
            'pageSize' : '15',
            'productName' : '',
            'conditionType' : '1',
            'applyname' : '',
            'applysn' : ''
            }
        json_ids = requests.post(start_url, data=data, headers=headers).json()
    for dict in json_ids['list']:
        ID_dic.append(dict['ID'])
    #print(ID_dic)
    post_url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsById'
    for id in ID_dic:
        data = {
        'id' : id
        }

        info = requests.post(post_url,data=data,headers=headers).json()

        info1.append(info)
        #print(info1)
    with open('./药监局','w',encoding='utf-8') as f:
        f.write(json.dumps(info1,ensure_ascii=False))
        f.close()

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-天际的海浪 2022-01-23 21:41

关注

for dict in json_ids['list']: 要缩进增加一层放到 for page in range(1,6):循环里面

你题目的解答代码如下：

import requests
import json
if __name__ == '__main__' :
    start_url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsList'
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.99 Safari/537.36 Edg/97.0.1072.69'
    }
    ID_dic = []
    info1 = []
    for page in range(1,6):
        page = str(page)
        data = {
            'on': 'true',
            'page' : page,
            'pageSize' : '15',
            'productName' : '',
            'conditionType' : '1',
            'applyname' : '',
            'applysn' : ''
            }
        json_ids = requests.post(start_url, data=data, headers=headers).json()

        for dict in json_ids['list']: #缩进增加一层
            ID_dic.append(dict['ID'])

    print(ID_dic)
    post_url = 'http://scxk.nmpa.gov.cn:81/xk/itownet/portalAction.do?method=getXkzsById'
    for id in ID_dic:
        data = {
        'id' : id
        }

        info = requests.post(post_url,data=data,headers=headers).json()

        info1.append(info)
    # print(info1)
    with open('./药监局','w',encoding='utf-8') as f:
        f.write(json.dumps(info1,ensure_ascii=False))
        f.close()

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(1条)

报告相同问题？

关注问题

Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析
2023-09-26 12:04

jojo来根易安的博客本次程序只爬取了豆瓣top250电影的展示页面的数据，没有爬取电影详情页的数据。在前面我们已经获取了每一部电影详情页的链接links，如果想要爬取电影的详情页，可以通过for循环遍历列表links，对每一个详情页发起...
python爬虫爬取音乐-JS逆向爬虫
2023-12-21 18:48

二九筒的博客前言：爬虫作为新秀，入门门槛非常低，但是要想学好爬虫技术还是非常有难度，所以本文章主要讲解js逆向爬虫本次爬取的网站是某个音乐网站；主要通过接口的方式去获取相关数据，然后得到我们想要的东西；本次爬取的...
Python爬虫爬取图片
2021-05-02 22:34

W~J~L的博客 Python爬虫爬取网站指定图片（多个网站综合经验结论分享） ** 我想以这篇文章来记录自己学习过程以及经验感受，因为我也是个初学者。接下来我将分享几个我爬取过的图片网站，给大家们分享下自己的方法经验。嘿嘿！ ...
使用python爬虫爬取热门文章分析最新技术趋势
2024-10-29 17:57

I'mAlex的博客本文借助爬虫来分析哪些技术正在快速发展，哪些问题在开发者中引起广泛讨论，从而为学习和研究提供重要参考。
超强干货之---Python-数据爬取（爬虫）
2024-07-12 17:01

.房东的猫的博客定义：深度优先搜索是一种遍历或搜索树或图的算法，从起始节点开始，一直沿着一个分支走到底，再回溯到上一个节点继续搜索下一个分支，...在大规模数据爬取时，选择合适的存储方式取决于数据的规模、结构和访问需求。
【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。我们希望通过爬虫程序获取豆瓣电影的名称、评分和简介等信息，以便进行数据分析或制作推荐系统。
Python爬虫入门学习——网页批量爬取文本
2024-04-27 16:08

冉静学习开发的博客 *除了requests库的爬取内容，其次就是BeautifulSoup库的解析数据功能。BeautifulSoup库是BeautifulSoup4库（一般书写为bs4）中的子库。#html接上文中的已爬取得到的全部信息bes= BeautifulSoup(html,"lxml")#通过...
python爬虫自学习1+京东商品爬取实例
2021-11-19 18:15

也问吾心的博客最近突然觉得有必要学一下python，翻开大一的Python书发现忘的那是一干二净，想学一下爬虫，只好重头再来，找了个教程一看啥都看不懂，还是老老实实从零开始吧。安装第三方库爬虫有一个库叫 requests 说出来不怕...
python爬虫爬取图片速度提升
2022-11-04 22:22

写不出来就跑路的博客 Python爬虫提速
Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析_爬虫电影
2024-04-21 15:05

2401_84009698的博客 2.4 获取一个页面中所有电影的信息我们通过xpath已经获取了页面中一部电影的数据，想要获得页面中所有电影的数据就要扩大查找范围，即减少xpath表达式中的标签数量。前面说过，每个li标签下都是一部电影的信息，一...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月24日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月23日

爬虫爬取数量改变不了，如何解决？

2条回答 默认 最新

问题事件

2条回答默认最新