python爬虫爬取图片和图片的标题保存时出现IOError

import urllib
import urllib2
import re
import os

#爬取索引页面源代码
siteURL='https://www.warningsignsdirect.co.uk/index.php?cPath=518'
request=urllib2.Request(siteURL)
response=urllib2.urlopen(request)
page=response.read().decode('utf-8')
print u"已爬取索引页面源代码"

os.chdir("C:\Users\hey_fall\Desktop")

#抓取页面中指定的图片
pattern=re.compile('

.*?

',re.S)
content=re.findall(pattern,page)
patternImg=re.compile('<img src="(.*?)"',re.S)
images=re.findall(patternImg,str(content))
print u"已爬取该网页图片"

#抓取图片的说明文本
patternIntroductions=re.compile('title="(.*?)"',re.S)
Introductions=re.findall(patternIntroductions,str(content))

#去除匹配字符中的转义字符
number=0
for introduction in Introductions:
Introductions[number]=str(introduction).replace('\','')
number+=1
print u"已爬取图片的说明文本"

#抓取说明文本的标题
patternTitle=re.compile('

(.*?) ')
Title=re.findall(patternTitle,page)
print u"已爬取文本标题"

#创建文件夹
path=os.getcwd()
title=Title[0]
new_path=os.path.join(path,title)
if not os.path.isdir(new_path):
os.makedirs(new_path)
os.chdir(new_path)
print u"已创建文件夹",new_path

#保存图片的说明文本
IntroductionName=Title[0]+".txt"
f=open(IntroductionName,'w+')
for introduction in Introductions:
f.write(introduction+'\n')
f.close()
print u"图片的说明文本已保存到",new_path

#保存抓取到的图片
number=0
for imageURL in images:
filename=Introductions[number]+'.jpg'
url='https://www.warningsignsdirect.co.uk'+'/'+imageURL
urllib.urlretrieve(url,filename)
number+=1
print u"图片已保存到",new_path
print u"该网页内容爬取完毕"

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2017-06-17 15:45
关注
文件名里是否有特殊字符，是否有文件写入的权限

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python下载图片出现IOError python
2015-09-02 14:18

回答 1 已采纳你的文件名中怎么能有星号，文件名不能有星号问号冒号这些字符
如何用Python 3遍历循环下载CSV文件中内容链接的图片？ python 爬虫
2018-11-07 15:02

回答 2 已采纳把 i=1放在for link in links:的上面如果不放for循环上面，i每次循环都被初始化为 1 了，i = i+1虽然加了1,但是下一次循环，i又被初始化为1了。这样不管下载多少张
在学python爬虫时遇到个问题，求解答 python 爬虫
2017-12-12 08:19

回答 9 已采纳 import urllib import urllib2 import re def craw(url, page): html1 = urllib2.Request(url)
python爬取百度贴吧图片库_Python爬虫爬取百度贴吧的图片
2020-12-04 22:34

weixin_39916360的博客根据输入的贴吧地址，爬取想要该贴吧的图片，保存到本地文件夹，仅供参考：#!/usr/bin/python#_*_coding:utf-8_*_import urllibimport urllib2import reimport osimport sysreload(sys)sys.setdefaultencoding("utf-...
python用openpyxl保存excel时出现OSError: [Errno 9] Bad file descriptor，如何解决？ python
2022-08-11 21:07

回答 2 已采纳代码本身测试：这个代码在本地新建环境下使用是正常的错误解析： OSError: [Errno 9] Bad file descriptor Bad file descriptor 错误的文件描述符
python class和try-exception问题 python 有问必答
2022-06-25 16:27

回答 2 已采纳 raise是抛出异常的意思 except IOError as e: print("I/O error occurred: ", strerror(e.errno)) except BadL
pythonlinecache方法报错 python
2022-08-04 16:46

回答 1 已采纳 linecache.getline('v.txt', 1)这样呢
用python爬虫爬取无水印图片_用Python爬虫爬取的图片怎么知道图片有没有水印()...
2020-12-03 21:44

weixin_39899776的博客 python图片爬虫怎么运行不出来，大婶们帮着看看#参考一下吧#/usr/bin/envpython#-*-coding:utf-8-*-#bycarlin.wangimporturllibimporturllib2importtimeimportosimportrandomfrombs4importBeautifulSoupdefget_Html...
python实现关键词共现矩阵，出现Traceback (most recent call last)怎么解决 python 有问必答知识图谱
2021-11-18 11:47

回答 2 已采纳路径不对
python 文件读取运用问题 python 有问必答
2022-06-24 22:55

回答 3 已采纳将字符全部转换为大写或者小写 “”“ 这是一段读取文件，统计文件中相同字母出现的频率的代码，然后在屏幕输出，虽然能统计相同字符的出现频率，但大写和小写系统还是认为是2个字母，谁能指点一下，还有最好
python文件操作题 python 有问必答
2021-05-30 22:44

回答 2 已采纳主要涉及文件存取和字符串、字典、列表处理等，参考如下代码： try: f=open('stud.csv','r',encoding='utf-8') except IOError:
用Python爬虫爬取自己要的文章
2020-11-16 15:50

随遇啊的博客用Python爬虫爬取自己要的文章在CSDN上有很多精彩的技术博客文章，我们可以把它爬取下来，保存在本地磁盘，可以很方便以后阅读和学习，现在我们就用python编写一段爬虫代码，来实现这个目的。我们想要做的事情：...
python读取文件换行的问题 python 有问必答
2022-06-24 12:35

回答 2 已采纳文件中的换行符\n
python爬虫爬取微信_Python爬虫爬取微信小程序
2020-11-24 10:33

weixin_39530960的博客之前打算做个微信小程序的社区，所以写了爬虫去爬取微信小程序，后面发现做微信小程序没有前途，就把原来的项目废弃了做了现在的网站观点,不过代码放着也是放着，还不如公开让大家用，所以我把代码贴出来，有需要的...
python爬去知乎动态内容_通过Python爬虫爬取知乎某个问题下的图片
2020-11-26 05:37

weixin_39883256的博客该爬虫主要是通过requests来实现的，该模块完全可以很好的代替urllib和urllib2，而且功能更强大，详细可以看这里。同时也用到了pillow模块中的image对象，实现环境是Python2，不过在Python3上只需很小的改动就可以...
Python 爬虫爬取图片(未分页)
2017-09-03 23:08

OnTheWay_Seeking的博客 IOError : print "File %s download failed......." % url.split( '/' )[- 1 ] download_count = download_count - 1 print "Download complete! %i files download successfully" % download_count ...
python爬取图片的库_[python学习] 简单爬取图片站点图库中图片
2020-12-18 02:18

weixin_39644611的博客 # coding=utf-8# 声明编码方式默认编码方式ASCII 參考https://www.python.org/dev/peps/pep-0263/import urllibimport timeimport reimport os'''Python下载游迅网图片 BY:Eastmount''''''************************...
[python爬虫] 爬取图片无法打开或已损坏的简单探讨
2015-12-07 06:25

Eastmount的博客本文主要针对Python使用urlretrieve或urlopen下载百度、搜狗、googto（谷歌镜像）等图片时，出现"无法打开图片或已损坏"的问题，作者对它进行简单的探讨。同时，作者将进一步帮你巩固Selenium自动化操作和urllib库等...
Python爬虫爬取肯德基官网餐厅信息，2021年10月20日可用
2021-10-24 10:01

在努力着呢的博客本次爬虫打算按城市来爬取肯德基门店信息并进行持久化存储。首先打开网页Web开发者工具，查看一些必要的信息，可以得到的信息有： 1.在搜索框输入信息，回车后网址没变而页面有变化，说明这是一个ajax请求； 2.在该...
【Python】------ Python批量爬取某网站图片代码展示
2021-05-10 17:28

皮皮冰要做大神的博客一， Python批量爬取某网站图片代码展示简洁清晰： 1.使用技术包：requests,urllib,BeautifulSoup等； 1.效果展示： import os import re import requests import json from lxml import etree import ...
没有解决我的问题, 去提问

悬赏问题

¥50 求图像处理的matlab方案
¥50 winform中使用edge的Kiosk模式
¥15 关于#python#的问题：功能监听网页
¥15 怎么让wx群机器人发送音乐
¥15 fesafe材料库问题
¥35 beats蓝牙耳机怎么查看日志
¥15 Fluent齿轮搅油
¥15 八爪鱼爬数据为什么自己停了
¥15 交替优化波束形成和ris反射角使保密速率最大化
¥15 树莓派与pix飞控通信

python爬虫爬取图片和图片的标题保存时出现IOError

2条回答 默认 最新

悬赏问题

2条回答默认最新