python怎么爬取百度百科上canvas标签的图片

我想爬取该图片上的文字标签，我应该怎么做

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
willpower2012 2018-12-03 08:23
关注
也就是爬取动态图片吧

coding = utf-8

import urllib.request
import re
import requests

def getDatas(keyword,pages):
params=[]
for i in range(30,30*pages+30,30):
params.append({
'tn': 'resultjson_com',
'ipn': 'rj',
'ct': 201326592,
'is': '',
'fp': 'result',
'queryWord': keyword,
'cl': 2,
'lm': -1,
'ie': 'utf-8',
'oe': 'utf-8',
'adpicid': '',
'st': -1,
'z': '',
'ic': 0,
'word': keyword,
's': '',
'se': '',
'tab': '',
'width': '',
'height': '',
'face': 0,
'istype': 2,
'qc': '',
'nc': 1,
'fr': '',
'pn': i,
'rn': 30,
'gsm': '1e',
'1526377465547': ''
})
url = 'https://image.baidu.com/search/index'
urls = []
for i in params:
urls.append(requests.get(url,params=i).json().get('data'))

return urls

def getImg(datalist,path):
x=0
for list in datalist:
for i in list:
if i.get('thumbURL') != None:
print('正在下载：%s' % i.get('thumbURL'))
urllib.request.urlretrieve(i.get('thumbURL'), path+'%d.jpg'%x)
x += 1
else:
print('图片链接不存在')

if name == '__main__':
datalist=getDatas('高清电脑背景',1)
getImg(datalist,'/home/cxiansheng/图片/')
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 3
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

盘点60个Python爬虫源码Python爱好者不容错过
2023-11-25 12:36

zy19830907的博客盘点60个Python爬虫源码Python爱好者不容错过
python网络爬虫之各种库的功能介绍及解析库、存储库
2019-04-28 22:33

妖气当然你的博客其中对于我们而言最重要的就是反爬了，下面为大家介绍python爬虫各种相关的库，以便大家详细了解爬虫的整体架构及思想1、常见库的基本介绍（1）请求库：实现http请求操作requests：阻塞式http请求库，发出一个请求...
Python3 爬虫--公司代理问题解决
2017-12-02 14:41

NeverSettle101的博客 "C:\Program Files (x86)\Anaconda3\python.exe" D:/Alvin/PersonalProjects/Python/Spider/WinterSmileSB101Blog/main.py <!doctype html> < html class = "theme-next mist use-motion" lang = "zh-Hans,...
沉淀，再出发：python爬虫的再次思考
2018-09-09 22:12

weixin_30562507的博客之前笔者就写过python爬虫的相关文档，不过当时因为知识所限，理解和掌握的东西都非常的少，并且使用更多的是python2.x的版本的功能，现在基本上都在向python3转移了，很多新的框架也不断的产生和使用，从一些新的...
爬虫教程（ 6 ） --- 爬虫进阶、扩展
2022-07-11 07:35

「已注销」的博客因为爬虫程序通常需要做的事情如下： 1)给定的种子 URLs，爬虫程序将所有种子 URL 页面爬取下来 2)爬虫程序解析爬取到的 URL 页面中的链接，将这些链接放入待爬取 URL 集合中 3)重复 1、2 步，直到达到指定条件才...
Selenium3+Python3+PhantomJS配置及测试解析
2017-10-04 21:57

sunchengquan的博客最近学习爬虫，遇到动态触发，异步加载，无法直接爬取数据，那么问题出现，解决的方法总是有的，需要用到两个工具：Selenium和PhantomJS。下面介绍其基本概念和配置过程概念Selenium（浏览器自动化测试框架）：是一...
2024-2025年计算机软件毕业设计大全：2000个精品毕设推荐✅
2024-10-28 13:49

码农飞哥的博客 1. Python基础专栏，基础知识一网打尽，9.9元买不了吃亏，买不了上当。 Python从入门到精通 2. 毕业设计专栏，毕业季咱们不慌忙，几千款毕业设计等你选。 ❤️ 3. Python爬虫专栏，系统性的学习爬虫的知识点。9.9元...
分享74个Python爬虫源码总有一个是你想要的
2023-12-27 13:24

灬沙海灬的博客分享74个Python爬虫源码总有一个是你想要的
python爬虫学习_junior
2022-08-11 22:24

浩淇害死猫的博客通过编写程序，模拟浏览器上网，然后让其去互联网上抓取数据的过程。-urllib模块（古老的网路请求模块，封装爬虫代码十分麻烦）-request模块（简洁、高效）requests模块：python中原生的一款基于网络请求的模块，...
爬虫与反爬虫技术分析
2020-02-27 11:28

yib0y的博客科普：什么是爬虫：百度百科：网络爬虫（又被称为网页蜘蛛，网络...百度百科：很多网站开始保护他们的数据，他们根据ip访问频率，浏览网页速度，账户登录，输入验证码，flash封装，ajax混淆，js加密，图片，cs...
没有解决我的问题, 去提问

python怎么爬取百度百科上canvas标签的图片

3条回答 默认 最新

coding = utf-8

3条回答默认最新