python3爬虫遇到报错 “urlopen error no host given”

程序是爬百度图片搜索范冰冰的所有图片。Notepad已经选择了UTF8编码，URL地址也没有回车分行。
直接上代码如下：
import urllib.request
import re
import sys
import os
import urllib
import ssl
#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码

def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
return html.decode('utf-8')

def getImg(html):
imglist = re.findall('"ObjURL":"(.*?)",', html, re.S)#表示在整个网页中过滤出所有图片的地址，放在imglist中
x = 0
path = 'D:\test'

# 将图片保存到D:\test文件夹中，如果没有test文件夹则创建
if not os.path.isdir(path):

os.makedirs(path)

paths = path+'\' #保存在test路径下

for imgurl in imglist:  
    urllib.request.urlretrieve(imgurl,'D:\\test\\%s.jpg' % x)  #打开imglist中保存的图片网址，并下载图片保存在本地，format格式化字符串 
    x = x + 1  
return imglist

url="http://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=%E8%8C%83%E5%86%B0%E5%86%B0"
html=getHtml(url)
print (getImg(html)) #从网页源代码中分析并下载保存图片

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-11-04 15:47
关注
看下这个：https://segmentfault.com/q/1010000011103319

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用爬虫爬取了4条数据以后报urlopen error no host given mysql python 有问必答
2021-05-21 13:59

回答 4 已采纳别人做了防盗处理，被检测ip，换一个地址或用热点联网试试
python爬虫报错 python 有问必答
2022-04-02 00:07

回答 7 已采纳 user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)' # 使用请求头进行伪装 self.headers={'User-Agent': use
基础爬虫不报错也不下数据 python
2022-07-15 23:48

回答 4 已采纳帮你改好了 ```python import urllib.parse import urllib.request def requert_get(page): first_url
PYTHON 3 爬虫出现<urlopen error no host given> 问题
2016-09-20 17:33

正版RX-0的博客 python3爬虫手把手教 python官方手册
python爬虫学习中遇到的问题 python 爬虫
2023-02-14 11:17

回答 4 已采纳该回答引用ChatGPT根据错误信息，这个问题可能是由于连接超时或网络连接不可用导致的。因此，建议您检查以下几个方面：确保您的网络连接正常并且能够访问请求的地址。确保请求的地址正确且存在，尝试在浏览
python爬图片，代码没报错但是没有结果 python
2022-06-29 05:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
python3.10爬虫爬图片，显示访问超时 python 爬虫
2021-12-26 23:32

回答 1 已采纳 1.请求头里面换user-agent2.使用动态ip这个是我都爬虫专栏，我会不定期更新https://blog.csdn.net/qq_62932195/category_11495999.html?
open python error_python爬虫爬图，报错<urlopen error no hsot given>.
2020-12-06 12:01

weixin_39533307的博客 ......改进了代码.写入了try.虽然还是会报错........./usr/bin/python# -*- coding:utf-8 -*-import urllibimport requestsimport refrom bs4 import BeautifulSoupimport csvimport socketsocket.setdefaul...
python初级爬虫爬不出来 python 爬虫
2022-08-30 16:48

回答 3 已采纳因为你要找的内容根本就没在这个url下，他是通过ajax加载的，如图：打开浏览器，重新抓包找到正确的url再请求就行了改成这样： import requests import json hea
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
Python爬虫运行直接进程已结束 python 爬虫
2022-08-29 21:22

回答 1 已采纳 if __name__ == '__main__': main写成mian了
python 爬虫图片打不开_python爬虫抓取图片终端报错 <urlopen error no hsot given> 是什么原因？...
2021-02-09 12:57

教室君的博客 python利用urllib爬虫，图片获取二十几张后就报错python版本3.6 windows系统下运行urllib.error.URLError:代码如下：#!/usr/bin/python# -*- coding:utf-8 -*-import urllibimport requestsimport refrom bs4 import...
python爬虫的时候想提取URL但是提取不全 python 爬虫
2022-09-19 00:24

回答 3 已采纳是被你的过滤条件过滤了吧，检查一下过滤条件： import bs4 as bs import urllib.request source = urllib.request.urlopen("https
Python爬虫
2021-09-30 12:41

_森罗万象的博客 Python爬虫
《Python基础教程》内容总览篇
2023-08-26 07:45

爱编程的喵喵的博客大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后...个人精心开设的《Python基础课程》专栏订阅量接近900，帮助不少同学解决了Bug。
python 网络爬虫
2023-06-11 09:53

圆弧YH的博客爬虫基本操作 requests-请求是否成功积累程序-爬虫 -requests-请求是否成功. import requests response=requests.get("https://www.pku.edu.cn") print(response.status_code)#用来检查请求是否正确响应，如果...
Python爬虫学习中遇到的问题
2018-02-15 14:31

轻倾子衿的博客请教一个问题，爬虫链接是一个下载地址，在浏览器中进入之后会自动...urlopen error no host given>，主机未回应，请问这该怎么做才能把表格下载下来？相关链接：1. http://www.moe.gov.cn/srcsite/A03/mo...
Python爬虫从小白到高手各种最新案例！ Urllib Xpath JsonPath BeautifulSoup
2023-06-23 13:53

软工菜鸡的博客本教程适合想掌握爬虫技术的学习者，以企业主流版本Python 3.7来讲解，内容包括：Python基础、Urllib、解析（xpath、jsonpath、beautiful）、requests、selenium、Scrapy框架等。针对零基础的同学可以从头学起，有...
python爬虫内置库之urllib.request
2019-05-18 16:51

生命在于休息的博客 urllib.request模块定义了适用于在各种复杂情况下打开 URL (主要为 HTTP) 的函数和类 -...urllib.request.urlopen（url，data = None，[timeout，]*，cafile = None，capath = None，cadefault = False，context = N...
urllib.error.URLError 提示错误解决方法和爬虫基本知识
2022-08-22 16:25

KENYCHEN奉孝的博客 urllib.error.URLError 提示错误解决方法和爬虫基本知识
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

python3爬虫遇到报错 “urlopen error no host given”

3条回答 默认 最新

悬赏问题

3条回答默认最新