McaT怎么读 2022-06-21 17:10 采纳率: 91.7%
浏览 20

爬虫入门,程序一直报错

刚学爬虫,跟着b站的视频写的,但是一直报错,在网找了很久实在找不到原因

import json

import requests
if __name__=="__main__":
    url='http://scxk.nmpa.gov.cn:81/xk/itownet/portal/dzpz.jsp/'
    headers={
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.0.2242 SLBChan/103'
    }
    response_id = []  # 储存id
    response_info = []  # 储存信息

    for page in range(1,6):#爬取页码值1到5的数据
        #参数
        page=str(page)
        data={
            'on': 'true',
            'page': page,#动态化爬取页码
            'pageSize': '15',
            'productName':'',
            'conditionType': '1',
            'applyname':'',
            'applysn':''
        }
        #爬取一页中的所有信息
        response_json=requests.post(url=url,data=data,headers=headers).json()
        
        for dic in response_json['list']:#dic是个字典
            response_id.append(dic['ID'])

    #爬取所有id对应的信息并存入列表中
    url2='http://scxk.nmpa.gov.cn:81/xk/itownet/portal/dzpz.jsp?'
    for id in response_id:
        id_data={
            'ID':id
        }
        #发送请求
        response_detail = requests.post(url=url2, headers=headers, data=id_data).json()
        response_info.append(response_detail)
        

    #永久化存储
    fp=open('./makeupDetail.json','w',encoding='utf-8')
    json.dump(response_info,fp=fp,ensure_ascii=False)
    print('done!!!')


报错如下

img

  • 写回答

3条回答 默认 最新

  • z60015260 2022-06-21 17:17
    关注

    .json()方法报错, 改成.text ,然后去解析你要的数据试下

    img

    评论

报告相同问题?

问题事件

  • 创建了问题 6月21日

悬赏问题

  • ¥200 csgo2的viewmatrix值是否还有别的获取方式
  • ¥15 Stable Diffusion,用Ebsynth utility在视频选帧图重绘,第一步报错,蒙版和帧图没法生成,怎么处理啊
  • ¥15 请把下列每一行代码完整地读懂并注释出来
  • ¥15 pycharm运行main文件,显示没有conda环境
  • ¥15 易优eyoucms关于二级栏目调用的问题
  • ¥15 寻找公式识别开发,自动识别整页文档、图像公式的软件
  • ¥15 为什么eclipse不能再下载了?
  • ¥15 编辑cmake lists 明明写了project项目名,但是还是报错怎么回事
  • ¥15 关于#计算机视觉#的问题:求一份高质量桥梁多病害数据集
  • ¥15 特定网页无法访问,已排除网页问题