python 爬虫出现IOError错误

-- coding:utf-8 --

#! /usr/bin/env python
import urllib
import urllib2
import re

page = 1
url = 'http://www.qiushibaike.com/hot/page/' + str(page)
user_agent = 'Mozilla/4.0(compatible;MSIE 5.5;Windows NT)'
headers = {'User-Agent':user_agent}

try:
request = urllib2.Request(url,headers = headers)
response = urllib2.urlopen(request)
content = response.read().decode('utf-8','ignore')
pattern = re.compile(r'

?<img.?>.*?.*?.*?(.*?)', re.S)
items = re.findall(pattern,content)
for item in items:
print item[0],item[1]

except urllib2.URLError, e:
if hasattr(e,"code"):
print e.code
if hasattr(e,"reason"):
print e.reason


```这是出现错误的信息，在powershell中设置chcp 65001就会出现IOError错误，设置成chcp 437或者936就会出现下面的乱码，请问是什么原因？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
会编程的大白熊 2016-05-07 06:04
关注
首先将文件设置为utfu0

print是否打印出信息取决于终端编码，可以将print需要打印的信息先转换为unicode编码，然后再转换为终端对应的编码
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

超级简单的音乐python爬虫
2025-11-28 23:04

qin_jianglong的博客三步搞定，超级简单的音乐python爬虫
python编程：网络爬虫
2025-06-24 20:05

倔强老吕的博客 Python 是编写网络爬虫的流行语言，因为它有丰富的库和框架支持。
Python网络爬虫入门篇
2024-07-15 15:46

独角兽哆啦A梦的博客 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析“标签树”等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序...
文本内容获取-python爬虫
2022-07-13 17:04

fo安方的博客本文通过python工具，对网页信息进行爬取下载python工具下载安装：库安装：方法1：使用requests库 1、代码解析如下：2、应用案例输入如下结果： 3、故障收集故障1：报如下error 解决办法：将.py名字修改成不以...
Python 爬虫实战：爬取金融数据助力投资决策
2025-02-09 00:07

西攻城狮北的博客通过本文的学习，你已经掌握了如何使用 Python 爬虫技术爬取金融数据，并进行数据清洗和分析。爬取金融数据可以为投资决策提供有力的数据支持，帮助你更好地把握市场动态。希望这些技巧能够帮助你在金融数据分析和...
【Python爬虫实战】SSL证书、超时处理、自动重试与代理的最佳实践
2024-10-08 14:30

易辰君的博客 Python 的 requests 模块因其简单易用、功能强大而广受欢迎，能够帮助开发者轻松发起各种网络请求并处理响应。然而，在实际应用中，开发者经常需要处理 SSL 证书验证、请求超时、自动重试以及会话管理等复杂的场景。...
Python 爬虫案例
2022-10-19 07:37

wespten的博客大数据采集：通过爬虫获取特定行业（如汽车行业）股票的基本信息，并获取单只股票的历史行情数据。大数据存储：根据自定义的时间间隔定时获取涨幅前60名股票的实时行情数据，并存储在数据库中。大数据分析：计算股票...
python爬虫贴吧_Python爬虫——抓取贴吧帖子
2020-11-21 02:40

weixin_39834788的博客对珊瑚老哥保证了自己会尽量补档动画MTV吧的资源，有空应该研究下爬虫了。不要在意头图，我不会假借各位对某个动漫的爱好然后坑人的。无论是电磁炮吧主那种拿电磁铁糊弄人的奸商，还是逸站靠小林做幌子卖收费破烂乐...
Python 爬虫实战：百度图片搜索结果解析（接口逆向 + 图片去重下载）
2025-06-24 14:27

西攻城狮北的博客利用 Python 爬虫技术，可以实现对百度图片搜索结果的批量抓取，这对于图片数据采集、图像识别训练、特定主题图片研究等场景具有重要意义。本文将深入探讨如何通过 Python 爬虫实现百度图片搜索结果的解析与下载，...
python爬虫实训心得_记录一次用Python写爬虫的心得
2020-11-24 06:10

weixin_39938165的博客现在网络爬虫有很多方式可以写，比如Node.js或者Go, 甚至PHP都行，我之所以选择Python的原因是因为教程多...前前后后弄了一个星期，看书+写代码，我写出了一个基本能用的python爬虫小代码，github地址：https://git...
python爬虫，实战篇，爬取4k图片
2024-11-20 07:00

尘佑不尘的博客 path}") except requests.RequestException as e: print(f"Error downloading image from {image_url}: {e}") except IOError as e: print(f"Error saving image: {e}") # 4. 主函数 def main(): url = '...
Python爬虫神器pyppeteer
2020-07-30 15:42

XerCis的博客 Puppeteer 是 Google 基于 Node.js 开发的工具，调用 Chrome 的 API，通过 JavaScript 代码来操纵 Chrome 完成一些操作，用于网络爬虫、Web 程序自动测试等。pyppeteer 是非官方 Python 版本的 Puppeteer 库。
python爬虫超时重试_python爬虫多次请求超时的几种重试方法(6种)
2020-12-28 21:24

夏天的柯比的博客来看看获取代理的应用(仅仅是为了测试retrying模块) 到此这篇关于python爬虫多次请求超时的几种重试方法的文章就介绍到这了,更多相关python爬虫多次请求超时内容请搜索脚本之家以前的文章或继续浏览下面的相关文章...
Python网络爬虫入门
2021-12-12 08:40

学习&实践爱好者的博客 Python网络爬虫入门网络爬虫（web crawler），也叫网络蜘蛛(Web Spider)、网络机器人（Internet Bot）。简单地说，抓取万维网（World Wide Web）上所需要的数据的程序就叫网络爬虫。网络爬虫常见分类：通用...
python爬虫程序说明_Python 网络爬虫程序详解
2020-11-24 09:36

weixin_39603995的博客 /usr/bin/python #调用pythonfrom sys import argv #导入sys是导入python解释器和他环境相关的参数from os import makedirs,unlink,sep　#os主要提供对系统路径，文件重命名和删除文件所需的函数#makedirs是创建递归...
python爬虫编程100例_python核心编程中网络爬虫的例子
2020-11-20 19:06

weixin_39737317的博客 1 #!/usr/bin/env python23 import cStringIO #4 import formatter #5 from htmllib import HTMLParser #We use various classes in these modules for parsing HTML...
python爬虫爬取京东商品信息(1)
2024-04-21 14:09

班力勤的博客文件路径为：” + file_url) except IOError: print(“文件保存失败！”) def get_html(url): 模拟浏览器访问 headers = { ‘User-Agent’: 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ’ 'AppleWebKit/537.36 ...
使用 Python 爬虫批量下载百度图片的详细教程
2024-10-13 18:19

非著名架构师的博客通过 Python 爬虫技术，我们可以自动化地从百度图片中批量下载所需的图片。本教程将详细介绍如何使用 Python 爬虫来实现百度图片的批量下载，包括必要的环境配置、代码实现及相关注意事项。环境配置在开始之前，...
怎么测试python爬虫数据_Python爬虫技术--基础篇--错误，调试和测试（上）
2020-12-30 16:20

Nowfitness阳阳的博客 1.错误处理在程序运行的过程中，如果发生了错误，可以事先约定返回一个错误代码，这样，就可以知道是否有错，以及出错的原因。在操作系统提供的调用中，返回错误码非常常见。比如打开文件的函数open()，成功时返回...
没有解决我的问题, 去提问

python 爬虫 出现IOError错误

-*- coding:utf-8 -*-

1条回答 默认 最新

python 爬虫出现IOError错误

-- coding:utf-8 --

1条回答默认最新