逍遥@明 2021-12-12 22:37 采纳率: 100%
浏览 88
已结题

请问这一行代码什么意思

问题遇到的现象和发生背景

Python爬虫系列(二)——Python爬虫批量下载百度图片

问题相关代码,请勿粘贴截图

list_image_link.append(jsonInfo['data'][index]['thumbURL'])

运行结果及报错内容

没搞懂这行代码什么意思,以及thumbURL是什么意思,中间的index是什么意思
望解答 谢谢

我的解答思路和尝试过的方法
我想要达到的结果
  • 写回答

2条回答 默认 最新

  • 纸照片 2021-12-12 23:06
    关注

    这个是我写的文章,这句程序之前是在百度上获取到了相关数据的json文件,名称为jsonInfo的变量就表示这个json格式的数据,json数据格式是“key-value”,也就是可以通过key去获取value。在jsonInfo中,要获取的数据保存在了key为“data”的数据中,jsonInfo['data']就表示取出key为“data”的数据,取到的数据是一个长度为30的一个数组,因此可以通过遍历将数组的每一项取出来,这个index就是就是取数组数据的下标索引。取到的每一项数据也遵循给json格式,关键的信息,就是目标图像的链接保存在key为“thumbURL”所对应的value中,类似于jsonInfo['data'],在jsonInfo['data'][index]后加上['thumbURL']就表示取出数组中每一项key为thumbURL的数据,也就是真实的图像链接。取出来之后,我再将每个链接保存在事先声明的数组里,等待后续使用。

    总结来说:

    1. 第一步,取到json数据,保存到jsonInfo中
    2. 第二步,观察发现,要找的数据保存在data中,jsonInfo['data']取出这一部分的数据,缩小了范围
    3. 第三步,发现取到的数据是一个数组,可以通过遍历取到每一项数据,jsonInfo['data'][index]
    4. 第四步,取到的每一项掺杂了无用的数据,真正有用的图像链接保存在thumbURL中,thumbURL是存在于json数据里面的一个key,通过jsonInfo['data']['thumbURL']取到每一个图像链接
    5. 第五步,将取到的图像链接保存到事先准备好的数组里,等待后续使用。

    你可以使用下面的代码输出一下。

    import requests  # 导入requests包
    import json
    
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&logid=6991546938775238432&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%90%91%E6%97%A5%E8%91%B5&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=&copyright=&word=%E5%90%91%E6%97%A5%E8%91%B5&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&fr=&expermode=&nojc=&pn=30&rn=30&gsm=1e&1635046467636='
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36 Edg/95.0.1020.30'}
    
    strhtml = requests.get(url, headers=headers)  # Get方式获取网页数据
    jsonInfo = json.loads(strhtml.text)
    for index in range(30):
        print(jsonInfo['data'][index]['thumbURL'])
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月22日
  • 已采纳回答 12月14日
  • 创建了问题 12月12日

悬赏问题

  • ¥15 找人不需要人工智能回答的gamit解算后做形变分析
  • ¥20 RL+GNN解决人员排班问题时梯度消失
  • ¥15 统计大规模图中的完全子图问题
  • ¥15 使用LM2596制作降压电路,一个能运行,一个不能
  • ¥60 要数控稳压电源测试数据
  • ¥15 能帮我写下这个编程吗
  • ¥15 ikuai客户端l2tp协议链接报终止15信号和无法将p.p.p6转换为我的l2tp线路
  • ¥15 phython读取excel表格报错 ^7个 SyntaxError: invalid syntax 语句报错
  • ¥20 @microsoft/fetch-event-source 流式响应问题
  • ¥15 ogg dd trandata 报错