python爬虫爬取图片和图片的标题保存时出现IOError

import urllib
import urllib2
import re
import os

#爬取索引页面源代码
siteURL='https://www.warningsignsdirect.co.uk/index.php?cPath=518'
request=urllib2.Request(siteURL)
response=urllib2.urlopen(request)
page=response.read().decode('utf-8')
print u"已爬取索引页面源代码"

os.chdir("C:\Users\hey_fall\Desktop")

#抓取页面中指定的图片
pattern=re.compile('

.*?

',re.S)
content=re.findall(pattern,page)
patternImg=re.compile('<img src="(.*?)"',re.S)
images=re.findall(patternImg,str(content))
print u"已爬取该网页图片"

#抓取图片的说明文本
patternIntroductions=re.compile('title="(.*?)"',re.S)
Introductions=re.findall(patternIntroductions,str(content))

#去除匹配字符中的转义字符
number=0
for introduction in Introductions:
Introductions[number]=str(introduction).replace('\','')
number+=1
print u"已爬取图片的说明文本"

#抓取说明文本的标题
patternTitle=re.compile('

(.*?) ')
Title=re.findall(patternTitle,page)
print u"已爬取文本标题"

#创建文件夹
path=os.getcwd()
title=Title[0]
new_path=os.path.join(path,title)
if not os.path.isdir(new_path):
os.makedirs(new_path)
os.chdir(new_path)
print u"已创建文件夹",new_path

#保存图片的说明文本
IntroductionName=Title[0]+".txt"
f=open(IntroductionName,'w+')
for introduction in Introductions:
f.write(introduction+'\n')
f.close()
print u"图片的说明文本已保存到",new_path

#保存抓取到的图片
number=0
for imageURL in images:
filename=Introductions[number]+'.jpg'
url='https://www.warningsignsdirect.co.uk'+'/'+imageURL
urllib.urlretrieve(url,filename)
number+=1
print u"图片已保存到",new_path
print u"该网页内容爬取完毕"

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2017-06-17 15:45
关注
文件名里是否有特殊字符，是否有文件写入的权限

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python下载图片出现IOError python
2015-09-02 14:18

回答 1 已采纳你的文件名中怎么能有星号，文件名不能有星号问号冒号这些字符
如何用Python 3遍历循环下载CSV文件中内容链接的图片？ python 爬虫
2018-11-07 15:02

回答 2 已采纳把 i=1放在for link in links:的上面如果不放for循环上面，i每次循环都被初始化为 1 了，i = i+1虽然加了1,但是下一次循环，i又被初始化为1了。这样不管下载多少张
在学python爬虫时遇到个问题，求解答 python 爬虫
2017-12-12 08:19

回答 9 已采纳 import urllib import urllib2 import re def craw(url, page): html1 = urllib2.Request(url)
python爬取百度贴吧图片库_Python爬虫爬取百度贴吧的图片
2020-12-04 22:34

weixin_39916360的博客根据输入的贴吧地址，爬取想要该贴吧的图片，保存到本地文件夹，仅供参考：#!/usr/bin/python#_*_coding:utf-8_*_import urllibimport urllib2import reimport osimport sysreload(sys)sys.setdefaultencoding("utf-...
python用openpyxl保存excel时出现OSError: [Errno 9] Bad file descriptor，如何解决？ python
2022-08-11 21:07

回答 2 已采纳代码本身测试：这个代码在本地新建环境下使用是正常的错误解析： OSError: [Errno 9] Bad file descriptor Bad file descriptor 错误的文件描述符
python class和try-exception问题 python 有问必答
2022-06-25 16:27

回答 2 已采纳 raise是抛出异常的意思 except IOError as e: print("I/O error occurred: ", strerror(e.errno)) except BadL
pythonlinecache方法报错 python
2022-08-04 16:46

回答 1 已采纳 linecache.getline('v.txt', 1)这样呢
用python爬虫爬取无水印图片_用Python爬虫爬取的图片怎么知道图片有没有水印()...
2020-12-03 21:44

weixin_39899776的博客 python图片爬虫怎么运行不出来，大婶们帮着看看#参考一下吧#/usr/bin/envpython#-*-coding:utf-8-*-#bycarlin.wangimporturllibimporturllib2importtimeimportosimportrandomfrombs4importBeautifulSoupdefget_Html...
python实现关键词共现矩阵，出现Traceback (most recent call last)怎么解决 python 有问必答知识图谱
2021-11-18 11:47

回答 2 已采纳路径不对
python 文件读取运用问题 python 有问必答
2022-06-24 22:55

回答 3 已采纳将字符全部转换为大写或者小写 “”“ 这是一段读取文件，统计文件中相同字母出现的频率的代码，然后在屏幕输出，虽然能统计相同字符的出现频率，但大写和小写系统还是认为是2个字母，谁能指点一下，还有最好
python文件操作题 python 有问必答
2021-05-30 22:44

回答 2 已采纳主要涉及文件存取和字符串、字典、列表处理等，参考如下代码： try: f=open('stud.csv','r',encoding='utf-8') except IOError:
用Python爬虫爬取自己要的文章
2020-11-16 15:50

随遇啊的博客用Python爬虫爬取自己要的文章在CSDN上有很多精彩的技术博客文章，我们可以把它爬取下来，保存在本地磁盘，可以很方便以后阅读和学习，现在我们就用python编写一段爬虫代码，来实现这个目的。我们想要做的事情：...
python读取文件换行的问题 python 有问必答
2022-06-24 12:35

回答 2 已采纳文件中的换行符\n
python爬虫爬取微信_Python爬虫爬取微信小程序
2020-11-24 10:33

weixin_39530960的博客之前打算做个微信小程序的社区，所以写了爬虫去爬取微信小程序，后面发现做微信小程序没有前途，就把原来的项目废弃了做了现在的网站观点,不过代码放着也是放着，还不如公开让大家用，所以我把代码贴出来，有需要的...
python爬去知乎动态内容_通过Python爬虫爬取知乎某个问题下的图片
2020-11-26 05:37

weixin_39883256的博客该爬虫主要是通过requests来实现的，该模块完全可以很好的代替urllib和urllib2，而且功能更强大，详细可以看这里。同时也用到了pillow模块中的image对象，实现环境是Python2，不过在Python3上只需很小的改动就可以...
Python 爬虫爬取图片(未分页)
2017-09-03 23:08

OnTheWay_Seeking的博客 IOError : print "File %s download failed......." % url.split( '/' )[- 1 ] download_count = download_count - 1 print "Download complete! %i files download successfully" % download_count ...
python爬虫爬取京东商品信息
2024-04-21 14:10

2401_83641098的博客文件路径为：” + file_url) except IOError: print(“文件保存失败！”) def get_html(url): 模拟浏览器访问 headers = { ‘User-Agent’: 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ’ 'AppleWebKit/537.36 ...
python爬取图片的库_[python学习] 简单爬取图片站点图库中图片
2020-12-18 02:18

weixin_39644611的博客 # coding=utf-8# 声明编码方式默认编码方式ASCII 參考https://www.python.org/dev/peps/pep-0263/import urllibimport timeimport reimport os'''Python下载游迅网图片 BY:Eastmount''''''************************...
[python爬虫] 爬取图片无法打开或已损坏的简单探讨
2015-12-07 06:25

Eastmount的博客本文主要针对Python使用urlretrieve或urlopen下载百度、搜狗、googto（谷歌镜像）等图片时，出现"无法打开图片或已损坏"的问题，作者对它进行简单的探讨。同时，作者将进一步帮你巩固Selenium自动化操作和urllib库等...
python爬虫爬取京东商品信息(1)
2024-04-21 14:09

班力勤的博客文件路径为：” + file_url) except IOError: print(“文件保存失败！”) def get_html(url): 模拟浏览器访问 headers = { ‘User-Agent’: 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ’ 'AppleWebKit/537.36 ...
没有解决我的问题, 去提问

悬赏问题

¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用

python爬虫爬取图片和图片的标题保存时出现IOError

2条回答 默认 最新

悬赏问题

2条回答默认最新