逍遥@明 2021-12-12 22:37 采纳率: 100%
浏览 87
已结题

请问这一行代码什么意思

问题遇到的现象和发生背景

Python爬虫系列(二)——Python爬虫批量下载百度图片

问题相关代码,请勿粘贴截图

list_image_link.append(jsonInfo['data'][index]['thumbURL'])

运行结果及报错内容

没搞懂这行代码什么意思,以及thumbURL是什么意思,中间的index是什么意思
望解答 谢谢

我的解答思路和尝试过的方法
我想要达到的结果
  • 写回答

2条回答 默认 最新

  • 纸照片 2021-12-12 23:06
    关注

    这个是我写的文章,这句程序之前是在百度上获取到了相关数据的json文件,名称为jsonInfo的变量就表示这个json格式的数据,json数据格式是“key-value”,也就是可以通过key去获取value。在jsonInfo中,要获取的数据保存在了key为“data”的数据中,jsonInfo['data']就表示取出key为“data”的数据,取到的数据是一个长度为30的一个数组,因此可以通过遍历将数组的每一项取出来,这个index就是就是取数组数据的下标索引。取到的每一项数据也遵循给json格式,关键的信息,就是目标图像的链接保存在key为“thumbURL”所对应的value中,类似于jsonInfo['data'],在jsonInfo['data'][index]后加上['thumbURL']就表示取出数组中每一项key为thumbURL的数据,也就是真实的图像链接。取出来之后,我再将每个链接保存在事先声明的数组里,等待后续使用。

    总结来说:

    1. 第一步,取到json数据,保存到jsonInfo中
    2. 第二步,观察发现,要找的数据保存在data中,jsonInfo['data']取出这一部分的数据,缩小了范围
    3. 第三步,发现取到的数据是一个数组,可以通过遍历取到每一项数据,jsonInfo['data'][index]
    4. 第四步,取到的每一项掺杂了无用的数据,真正有用的图像链接保存在thumbURL中,thumbURL是存在于json数据里面的一个key,通过jsonInfo['data']['thumbURL']取到每一个图像链接
    5. 第五步,将取到的图像链接保存到事先准备好的数组里,等待后续使用。

    你可以使用下面的代码输出一下。

    import requests  # 导入requests包
    import json
    
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&logid=6991546938775238432&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%90%91%E6%97%A5%E8%91%B5&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=&copyright=&word=%E5%90%91%E6%97%A5%E8%91%B5&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&fr=&expermode=&nojc=&pn=30&rn=30&gsm=1e&1635046467636='
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36 Edg/95.0.1020.30'}
    
    strhtml = requests.get(url, headers=headers)  # Get方式获取网页数据
    jsonInfo = json.loads(strhtml.text)
    for index in range(30):
        print(jsonInfo['data'][index]['thumbURL'])
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月22日
  • 已采纳回答 12月14日
  • 创建了问题 12月12日

悬赏问题

  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效