python 爬虫利用urllib.request.urlretrieve() 保存图片在本地，图片没有内容

我用Jupyter Notebook爬取了需要保存的图片的url，但是利用urllib.request.urlretrieve() 将图片保存到本地，图片没有内容，该url使用360浏览器打开也是没有内容的图片（和我保存在本地一样），但是用goole打开就是正常的图片。

相关代码
url='http://www.jj20.com/bz/zrfg/d...'
response=urllib.request.urlopen(url)
html=response.read().decode('gb2312')

soup=BeautifulSoup(html,'lxml')
data=soup.select('body > div.wzfz.top-main.fix > div > ul.pic2.vvi.fix')
data2=re.findall('src="(.+?)" width',str(data))
data2 #此处得到了图片链接的一个列表

x=0
for itemm in data2:
print(itemm)
urllib.request.urlretrieve(itemm,'C:\Users\Administrator\Desktop\pachong2\%s.jpg'%x)
x+=1 #通过链接保存图片到本地

代码完毕，运行不报错，但保存的图片却是加密图片，如下
我用360浏览器打开这些url也是显示这个，但是用goole打开就是正常的图片。如下：

我百度了好多相关内容，但和别人的出错结果都不一样，想知道这种情况是怎么回事，为什么360浏览器打开是这样的，还有就是要怎么才能通过goole浏览器把图片下载下来呢。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

lyhsdy 2018-12-21 07:13

关注

←如果以下回答对你有帮助，请点击右边的向上箭头及采纳下答案

因为网站做了反爬，无法直接打开图片连接，还有User-Agent的身份验证，所以加入请求头去下载就可以了


import requests

s=requests.session()
headers={
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'Accept-Encoding':'gzip, deflate',
'Accept-Language':'zh-CN,zh;q=0.9',
'Cache-Control':'max-age=0',
'Connection':'keep-alive',
'Host':'www.jj20.com',
'If-Modified-Since':'Fri, 21 Dec 2018 03:58:29 GMT',
'If-None-Match':'"cf51d66ee198d41:0"',
'Upgrade-Insecure-Requests':'1',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.15 Safari/537.36',
}
s.headers.update(headers)
url=r'http://img.jj20.com/up/allimg/1111/052QQ64447/1P52Q64447-1-lp.jpg'
html=s.get(url=url)
print(html.text)
with open('picture.jpg', 'wb') as file:
    file.write(html.content)

报告相同问题？

关注问题

python爬虫爬取图片下载本地 python 爬虫
2021-10-29 22:05

回答 2 已采纳文件路径不能有斜杠
Python-爬虫下载图片时报错 python
2017-08-17 03:32

回答 6 已采纳那就是代码的问题，错误提示并不一定是那一行出了问题，排查一下传递的参数或者设置
python入门爬虫，爬不出来图片。 python
2021-10-12 15:12

回答 2 已采纳在爬虫过程中，最好把请求头添加上 #!/usr/bin/env python # -*- coding:utf-8 -*- import re,requests from urllib.reques
python urlretrieve不能保存_python 爬虫利用urllib.request.urlretrieve() 保存图片在本地，图片没有内容...
2021-01-14 06:33

weixin_39849127的博客我用Jupyter Notebook爬取了需要保存的图片的url，但是利用urllib.request.urlretrieve() 将图片保存到本地，图片没有内容，该url使用360浏览器打开也是没有内容的图片(和我保存在本地一样)，但是用goole打开就是...
爬取解析下载页面图片报错不知道怎么解决啊 python 爬虫
2022-03-18 00:45

回答 2 已采纳看看这个 urlretrieve的用法_CSDN_Xying的博客-CSDN博客_urlretrieve什么意思 urlretrieve用作
python爬虫IndexError python
2022-06-29 12:15

回答 2 已采纳你这两个列表中的元素长度不一样，然后循环的时候超出src_list的值了
python 爬取图片存储到文件夹问题 python 爬虫
2022-02-14 17:09

回答 3 已采纳你的文件夹是由self.create_mkdir(self.filename_path + url_id) 这行代码生成的，所以文件夹的名字是url_id。你只需要多定义一个变量作为文件夹名字就可以了
【python中级】 urllib.request的urlretrieve方法根据图片url下载图片
2021-11-02 22:30

jn10010537的博客【python中级】 urllib.request的urlretrieve方法根据图片url下载图片1、背景2、代码 1、背景 python的requests包也可以请求url下载图片，详见博客：【python中级】 requests根据图片url下载图片 ...
module的对象没有len，如何解决？(语言-python) python 爬虫
2023-02-12 20:11

回答 3 已采纳第26行，BeautifulSoup第1个参数应该是个字符串类型，猜测你的本意应该是getImg()获取到的内容，但是现在传的是html，而这个html是import 导入进来的，应该是个模块吧，这个
用python爬虫始终报FileNotFoundErro: [Errno 2] No such file or directory python 有问必答爬虫
2023-01-06 15:38

回答 4 已采纳我是运行到这里出问题，url中包含中文urlretrieve出错了，要对中文进行编码改下面这里编码下url就正常了。 try: each_pic_url = e
在学python爬虫时遇到个问题，求解答 python 爬虫
2017-12-12 08:19

回答 9 已采纳 import urllib import urllib2 import re def craw(url, page): html1 = urllib2.Request(url)
关于urllib.request.urlretrieve卡死的问题（python爬虫）
2021-12-01 23:33

晨晓翔同学的博客今晚本来打算刷题的，但是舍友让我给他做一个爬虫（因为快要考试了嘛）。然后其他的爬文字的都还好，但是在爬图片的...最后查了一查，urllib.request.urlretrieve数据少还好数据多了就容易卡死。（但是之前爬的别的也
requests.exceptions.InvalidURL: Failed to parse: <Response [200]> python 有问必答爬虫
2021-08-26 09:47

回答 2 已采纳 url_get = requests.get(" http://music.163.com/song/media/outer/url?id%22
已解决urllib.request.urlretrieve下载文件报错403
2022-09-30 07:49

袁袁袁袁满的博客已解决（python使用urlopen/urlretrieve下载文件时出现403 forbidden）urllib.error.HTTPError: HTTP Error 403: Forbidden
使用python爬取图片（urllib.request.urlretrieve）
2023-09-18 19:19

新人不小白的博客用于解决爬百度图片被拒绝，但是又因为种种原因不能爬搜狗图片，还需要爬动态网页的图片的朋友们
没有解决我的问题, 去提问

悬赏问题

¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 对于相关问题的求解与代码
¥15 ubuntu子系统密码忘记
¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
¥15 保护模式-系统加载-段寄存器
¥15 电脑桌面设定一个区域禁止鼠标操作
¥15 求NPF226060磁芯的详细资料
¥15 使用R语言marginaleffects包进行边际效应图绘制

码龄粉丝数原力等级 --

python 爬虫利用urllib.request.urlretrieve() 保存图片在本地，图片没有内容

4条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

python 爬虫利用urllib.request.urlretrieve() 保存图片在本地，图片没有内容

4条回答 默认 最新

悬赏问题

4条回答默认最新