新人求指点：为什么爬不到图片，那里出问题了

import os
import urllib.request
import requests
from fake_useragent import UserAgent
from bs4 import BeautifulSoup
ua = UserAgent()

download_path = './电影总览'
if not os.path.exists(download_path):
#创建文件夹
os.makedirs(download_path)


def download_picture(url):
headers = {'User-Agent' :
'Mozilla/5.0 (Windows NT 10.0; Win64 x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}


r = requests.get(url, headers = headers)
soup = BeautifulSoup(r.text, 'lxml')
content = soup.find('div', class_ = 'article')
images = content.find_all('img')

picture_http_list = [image['src'] for image in images]
picture_name_list = [image['alt'] for image in images]

for picture_name, picture_http in zip (picture_name_list, picture_http_list):
html = requests.get(picture_http)
with open(f'{download_path}/{picture_name}.jpg','wb') as f:
f.write(html.content)

def main():
start_urls = ["https://movie.douban.com/tag/#/"]

for url in start_urls:
download_picture(url)

main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
芫尘梦 2021-01-22 11:35
关注
使用request.urlretrieve(picture_http, '{download_path}/{picture_name}.jpg')试试

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么python找不到excel（入门问题） python
2022-05-20 06:44

回答 2 已采纳同意一楼，一个是路径的问题，要么把文件放到python运行空间路径下，可以直接写文件名字（相对路径）；要么就要写全文件的绝对路径。再一个，文件的名称和路径下尽量不要出现中文，要不然报错都没处找。
xpath爬取图片，得不到src ，python求解决 python 有问必答爬虫
2022-01-27 12:25

回答 4 已采纳图片是js解析出来的，xpath无效，数据在js变量里面，正则提取下数据用json.loads加载获取代码如下 import requests import re import json def
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
为什么我们用python工作不多_人人学 Python，为什么拿高薪的那么少？
2020-12-02 13:09

weixin_39877805的博客 Python语言相关的岗位非常多，有运维，有自动化测试，有后端开发，有机器学习，人工智能，python无所不能。市场上需要的Python人员非常多，而且按照现在的势头，以后会需要更多的Python开发人员，理由是以后每个人...
关于python爬虫利用正则表达式爬取不到内容的问题 python 数据挖掘机器学习正则表达式
2019-10-18 08:20

回答 3 已采纳爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种： ``` from lxml import etree # 解析页面的模块 html = etree.HTML
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
通过python爬虫，爬取到的图片无法打开，请问要怎么办？ pycharm python
2021-08-11 23:59

回答 2 已采纳你是真的秀，没有请求图片地址获得数据肯定打不开啊，你写入的是列表的的文本的二进制，并不是图片的。应该在图片链接后面再请求一次图片网址，然后写入获得的响应数据的二进制内容，望采纳哈
16-python爬虫之Requests库爬取海量图片_python爬虫图片etree
2024-04-26 17:08

2401_84616191的博客在python内置模块的基础上进行了高度的封装从而使得python进行网络请求时，变得人性化，使用Requests可以轻而易举的完成浏览器可有的任何操作。。requests会自动实现持久连接keep-alive开源地址：...
python tkinter中text插入图片显示不出来为什么 python 有问必答
2021-07-05 01:31

回答 2 已采纳目前您题目中所提出的问题是不要把 PhotoImage(file="D:/测试用图/a0.gif") 创建的图片对象只用函数内的局部变量存放。因为函数执行完，局部变量会被系统清除，连带着图片对象也会一
python读取文件夹内文件显示找不到的问题 python
2022-04-26 10:15

回答 8 已采纳 ##这样呢with open('/Users/chendingyu/Desktop/20220411/510880.dat','rb') as fo: #读入 data=fo.read()
为什么爬取到的内容和网页上的不一样呢？求解决方法 python 爬虫
2022-05-12 17:10

回答 2 已采纳因为他是异步加载的。解决方法：1、一般爬取到的内容和网页上的不一样，可能是请求异常或者是异步加载导致的，需要去定位数据来源。2、打开控制台全局搜索151.4，发现没结果，那么继续搜索1514，发现有
18个网站的Python爬虫登录示例开源项目推荐_python爬虫登录实例
2024-04-20 21:48

夏侯学Android的博客技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、...
python导入numpy报错，找不到指定程序，求解答 python 有问必答
2021-08-13 20:26

回答 3 已采纳 numpy包报错，可能是版本不匹配或版本较低，建议升级一下numpy，或者安装numpy+mkl，从这里下载对应版本本地安装： https://www
Python爬虫基础爬取网页访问网页_python 爬虫网站
2024-04-26 15:08

web开发一号的博客 > ** 技术互助**：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。 > ** 面试题库**：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。 > ** 知识体系**：含编程语言、算法、...
01-为什么要学爬虫-python小白爬虫入门教程_为什么要学爬虫python
2024-04-26 15:55

2401_84569545的博客技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、...
没有解决我的问题, 去提问

悬赏问题

¥15 程序不包含适用于入口点的静态Main方法
¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记

新人求指点：为什么爬不到图片，那里出问题了

3条回答 默认 最新

悬赏问题

3条回答默认最新