weixin_38261783 2018-12-03 07:20 采纳率: 100%
浏览 1431
已采纳

python怎么爬取百度百科上canvas标签的图片

我想爬取该图片上的文字标签,我应该怎么做 图片说明

  • 写回答

3条回答 默认 最新

  • willpower2012 2018-12-03 08:23
    关注

    也就是爬取动态图片吧

    coding = utf-8

    import urllib.request
    import re
    import requests

    def getDatas(keyword,pages):
    params=[]
    for i in range(30,30*pages+30,30):
    params.append({
    'tn': 'resultjson_com',
    'ipn': 'rj',
    'ct': 201326592,
    'is': '',
    'fp': 'result',
    'queryWord': keyword,
    'cl': 2,
    'lm': -1,
    'ie': 'utf-8',
    'oe': 'utf-8',
    'adpicid': '',
    'st': -1,
    'z': '',
    'ic': 0,
    'word': keyword,
    's': '',
    'se': '',
    'tab': '',
    'width': '',
    'height': '',
    'face': 0,
    'istype': 2,
    'qc': '',
    'nc': 1,
    'fr': '',
    'pn': i,
    'rn': 30,
    'gsm': '1e',
    '1526377465547': ''
    })
    url = 'https://image.baidu.com/search/index'
    urls = []
    for i in params:
    urls.append(requests.get(url,params=i).json().get('data'))

    return urls
    

    def getImg(datalist,path):
    x=0
    for list in datalist:
    for i in list:
    if i.get('thumbURL') != None:
    print('正在下载:%s' % i.get('thumbURL'))
    urllib.request.urlretrieve(i.get('thumbURL'), path+'%d.jpg'%x)
    x += 1
    else:
    print('图片链接不存在')

    if name == '__main__':
    datalist=getDatas('高清电脑背景',1)
    getImg(datalist,'/home/cxiansheng/图片/')

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog