python 3 报错 urllib.error.URLError: <urlopen error unknown url type: "http>

尝试爬取新浪首页新闻到本地程序报错
源码为:
import urllib.request,re
url="https://www.sina.com.cn/"
req=urllib.request.Request(url)
req.add_header("User-Agent","马赛克")
pat1='.*?'
data1=urllib.request.urlopen(req).read().decode("UTF-8","ignore")
allink=re.compile(pat1).findall(data1)
for i in range(0,len(allink)):
thislink=allink[i]
pat2=''
req2=urllib.request.Request(url)
req2.add_header("User-Agent","Mozilla/5.0 (Macintosh; Intel Mac OS X 10.11; rv:65.0) Gecko/20100101 Firefox/65.0")
thispage=urllib.request.urlopen(req2).read().decode("UTF-8","ignore")
isframe=re.compile(pat2).findall(thispage)
if len(isframe)==0:
urllib.request.urlretrieve(thislink,"data/"+str(i)+".html")
else:
flink=isframe[0]
urllib.request.urlretrieve(flink,"data/"+str(i)+".html")
报错信息:
Traceback (most recent call last):
File "/Users/tanzhouyan/Desktop/python/新闻爬虫.py", line 73, in
urllib.request.urlretrieve(thislink,"data/"+str(i)+".html")
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 247, in urlretrieve
with contextlib.closing(urlopen(url, data)) as fp:
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 222, in urlopen
return opener.open(url, data, timeout)
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 525, in open
response = self._open(req, data)
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 548, in _open
'unknown_open', req)
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 503, in _call_chain
result = func(*args)
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/urllib/request.py", line 1387, in unknown_open
raise URLError('unknown url type: %s' % type)
urllib.error.URLError:

在网上一直没有找到解决方法,谢谢大家~

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
好想长大 2019-02-20 14:06
关注
先装openssl：sudo yum install openssl-devel
再重装python
然后重试

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

requests.exceptions.InvalidURL: Failed to parse: <Response [200]> python 有问必答爬虫
2021-08-26 09:47

回答 2 已采纳 url_get = requests.get(" http://music.163.com/song/media/outer/url?id%22
这个错误该如何解决urllib.error.HTTPError: HTTP Error 404: Not Found python
2021-12-11 16:30

回答 1 已采纳如果链接是正常的，那试着加上 header ，模拟下正常的浏览器。
HTTPError(req.full_url, code, msg, hdrs, fp) urllib.error.HTTPError: HTTP Error 404: Not Found python 有问必答
2021-11-19 02:26

回答 2 已采纳我这边实际测试了下，代码基本没有问题，你自己捕捉下异常，看看哪个url报的404 for index,image_url in enumerate(url_list):
成功解决urllib.error.URLError: ＜urlopen error [Errno 11001] getaddrinfo failed＞
2022-07-12 23:16

一个处女座的程序猿的博客成功解决urllib.error.URLError: 目录解决问题解决思路解决方法raise URLError(err) urllib.error.URLError: 网址错误，网址有问题！如果网址确定没错，并且当前上网也没问题，那么，很可能是网址单双引号导致的bug...
python报错：requests.exceptions.ConnectionError: ('Connection aborted.', OSError("(10060, 'WSAETIMEDOUT')")) python 开发语言
2020-03-02 19:59

回答 2 已采纳 10060 WSAETIMEDOUT 是请求超时了，请确认 res = requests.get(url) 这一句请求的地址是否拼接正确，如果是正确的，那就设置超时时间大一点吧。
爬虫报错Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x000002B5F5BC3C10> json python 爬虫
2022-02-25 14:06

回答 1 已采纳感觉是网址问题，所以报ConnectionError，这网址我浏览器上不去
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
【Pytorch】下载CIFAR10数据集报错： urllib.error.URLError: ＜urlopen error name: https＞
2023-08-03 19:22

NeilNiu的博客在使用Pytorch 下载CIFAR10的时候，遇到一个报错，可能是网络特别慢导致的，一般情况下都会遇到这个报错。解压后，放到对应的目录文件中，再次运行代码就成功了。1、到官网直接下载这个压缩包，解压。
requests.exceptions.ConnectionError: ('Connection aborted.', OSError(0, 'Error')) python
2020-08-04 16:39

回答 3 已采纳可能的原因：网络不好，超时断开，或者对方服务器有限制爬虫，你慢一点爬，过一会重试，换一个ip
ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。 python
2021-12-18 11:53

回答 2 已采纳所有方式通通试一遍，把所有特征弄点，重点关注： User Agent（目测已做）Referer（目测已做）HostCookieIPHTTP协议版本（注：某些网站为了伪装，只有HTTP2可以访问）注：可
urllib2.HTTPError 407 Proxy Authentication python
2015-12-18 07:47

回答 2 已采纳这种方式可行，亲测可用，直接将用户名密码放入urllib2.ProxyHandler中不可行。 def url_build_proxy_opener(proxy_info): 　　passmg
python解决urllib发送请求报错：urllib.error.URLError: ＜urlopen error [SSL: CERTIFICATE_VERIFY_FAILED].....＞
2021-10-31 09:42

呆萌的代Ma的博客完整报错是：urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:xxx)> 解决方法在使用urllib.request.Request(url)前，添加代码： import ssl ssl...
python爬虫使用json()方法将response结果转化为JSON格式时报错 json python 爬虫
2022-02-11 13:01

回答 4 已采纳网站设计了相应的反扒策略，需要把Cookie添加到headers中，这种问题一般从headers入手，有的限制User-Agent必须有，有的限制Cookie headers = { 'Cooki
raise URLError(err) urllib.error.URLError: ＜urlopen error [Errno 0] Error＞
2023-03-30 19:10

dzwann的博客这个错误通常表示在使用 Python 的urlib。2. URL地址错误：请确保您提供的 URL地。3. sSL证书问题：如果您正在连接到一。需要 SSL 证书的网站，而您的计算机上。4. 服务器问题：有时候，目标服务器可能。1.网络连接...
在使用 torchvision.datasets.CIFAR10下载数据集时出现以下报错urllib.error.URLError: ＜urlopen error [SSL: CERTIFICATE_
2023-11-14 19:02

weixin_44622720的博客运行后有如下报错经过查阅资料找到如下解决方法：解决方法数据集下载成功，如下图所示：数据下载中：数据下载成功：成功下载并解压其它下载数据集的方法：在运行台中找到数据集下载的连接：在迅雷等浏览器...
没有解决我的问题, 去提问

悬赏问题

¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 lammps拉伸应力应变曲线分析
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试，帮帮忙吧
¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建