为什么python爬虫程序下载的图片不正确？

import re
import urllib.request

def open_url(url):

user_agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/17.17134'
headers={'User-Agent':user_agent,'Referer':'http://www.mmjpg.com/mm/1317'}
reg=urllib.request.Request(url,headers)
response=urllib.request.urlopen(url)
html=response.read()

 return html

def craw(url,page):
html=open_url(url)
html1=str(html)

pat1='<div class="content" id="content">.+?<div class="page" id="page">'

result1=re.compile(pat1).findall(html1)
result1=result1[0]

pat2='<div class="content" id="content"><a href=".*"><img src="(.+?.jpg)"'  

imagelist=re.compile(pat2).findall(result1)

  for each in imagelist:
            print(each)       #能够正确抓取图片地址
    imgname=each.split('/')[-1]
    fandler=open('D:/files/download/'+imgname,'wb')
    data=open_url(each)
    fandler.write(data)
    fandler.close()

for i in range(1,49):
url='http://www.mmjpg.com/mm/1317/'+str(i)
craw(url,i)

爬虫能够正确抓取图片的地址，但下载在电脑上的图片如下：

请教高手原因出在哪？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
lyhsdy 2018-10-10 03:45
关注
图片地址做了反爬，你直接复制图片地址在浏览器上打开就是你下载下来的图片，所以你需要在请求图片网址时，data=open_url(each) 你的headers错误了，应该是headers={'User-Agent':user_agent,'Referer':'http://www.mmjpg.com/mm/1317''+str(i)}

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么python爬虫的结果存储不到MySQL中？ mysql python
2022-06-21 19:56

回答 2 已采纳可能你根本没爬取到
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
python爬虫爬取网页为什么获得的不是正常网页数据 python 爬虫
2022-05-12 14:48

回答 2 已采纳这代码里面好多错误，你是怎么运行成功的？
Python爬虫实战（五）：根据关键字爬取某度图片批量下载到本地（附上完整源码）
2023-08-21 08:00

袁袁袁袁满的博客 Python爬虫实战（五）：根据关键字爬取某度图片批量下载到本地（附上完整源码）
话说python爬虫初中高级要会啥? python
2022-09-01 13:31

回答 1 已采纳初级爬虫工程师： Web前端的知识：HTML, CSS, JavaScript, DOM, DHTML, Ajax, jQuery,json等；正则表达式，能提取正常一般网页中想要的信息，比如某些特殊
Python爬虫下载图片 python
2021-04-01 22:12

回答 2 已采纳
关于python爬虫的问题，如何解决？ python 爬虫
2022-09-24 14:13

回答 1 已采纳可以看下python参考手册中的 python- 接下来？
python爬虫入门教程：爬取网页图片
2022-04-05 15:25

plexming的博客而用python做爬虫也十分简单方便，下面通过一个简单的小爬虫程序来看一看写爬虫的基本过程：准备工作语言：python IDE：pycharm 首先是要用到的库，因为是刚入门最简单的程序，我们主要就用到下面这两： ...
Python爬虫可以用IDLE编写吗？ python
2021-08-09 21:50

回答 4 已采纳学习爬虫用IDLE是可以的，一般IDLE可以满足初学者的使用需求。最近我也在学爬虫，写了一些实例，可以来看看我的专栏： https://blog.csdn.net/weixin_52132159/
Python 爬虫豆瓣250为什么抓取不到英文电影名？ python 有问必答
2021-06-04 08:30

回答 4 已采纳你选的是第一个span标签。 each.a.span.next_sibling.text
我的python爬虫的循环遍历为什么报错？ python 爬虫
2023-01-17 13:25

回答 5 已采纳你把res打印出来看下。应该是request.get方法没有获取到数据，或者获取的数据格式和你想要的不一致，所以报错了。如果是获取的数据不对，检查下您的请求参数是否正确。
Python爬虫实战之爬取网站全部图片
2020-02-27 14:38

可以直接下载整站的图片代码中使用多线程进行批量下载代码中相关的内容已经加了注释下载的同学应该可以自行修改里面的代码了
python爬虫请求数据加密怎么破解？？？ python
2021-03-04 22:33

回答 3 已采纳页面地址 http://tool.liumingye.cn/music/?page=searchPage 脚本里有个encode函数，是这么加密的。如果要爬取的话用selenium比较适
要学会Python爬虫都需要什么基础呢？
2021-09-27 10:39

程序员的小傲娇的博客提到Python自然就会想到爬虫，很多同学学习Python的目的也是为了使用爬虫，那么你知道想要学会Python爬虫都需要什么基础吗？下面小千就来告诉你。学Python爬虫需要掌握的基础 1.Python基础知识、web前端基础知识 ...
python爬虫爬取网页图片
2022-12-22 18:05

chenruhan_QAQ_的博客 python爬虫爬取网页上的图片
没有解决我的问题, 去提问

悬赏问题

¥15 逻辑谓词和消解原理的运用
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败