用Requests库采集图片

需求：利用Requests库采集图片，图片地址如下
https://www.qqtn.com/tp/wmtp 1.html

要求：
1.采集10页的图片（包含该图片的详情页图片）并进行保存

详情页图片：就是网址第一张照片里面的div里面的div

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2024-05-27 17:28
关注
以下内容由CHATGPT及阿里嘎多学长共同生成、有用望采纳：

要使用Python的Requests库来采集网页中的图片，你可以按照以下步骤进行：

发送HTTP请求：使用Requests库获取网页内容。
解析网页：使用BeautifulSoup库解析网页，提取图片URL。
下载图片：对于每个图片URL，发送HTTP请求下载图片。
保存图片：将下载的图片保存到本地。

以下是一个基本的代码实现示例：

import requests from bs4 import BeautifulSoup import os # 创建保存图片的目录 if not os.path.exists('downloaded_images'): os.makedirs('downloaded_images') def download_image(image_url, folder): response = requests.get(image_url) if response.status_code == 200: with open(os.path.join(folder, image_url.split('/')[-1]), 'wb') as f: f.write(response.content) def scrape_images_from_page(url): response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') images = soup.find_all('img') for img in images: img_url = img.get('src') if img_url: download_image(img_url, 'downloaded_images') def scrape_images_from_site(base_url, num_pages): for i in range(1, num_pages + 1): page_url = f"{base_url}.html" # 假设URL格式是base_url加上页码 scrape_images_from_page(page_url) # 采集10页图片 base_url = 'https://www.qqtn.com/tp/wmtp' scrape_images_from_site(base_url, 10) # 采集详情页图片 # 假设详情页URL可以通过某种方式获得，这里以base_url为例 details_page_url = 'https://www.qqtn.com/tp/wmtp1.html' scrape_images_from_page(details_page_url)

请注意，这个代码只是一个示例，实际使用时需要根据网页的具体结构调整解析规则。另外，由于网页结构可能随时变化，代码可能需要定期更新以适应这些变化。

参考资料：

Requests库官方文档：http://docs.python-requests.org/
BeautifulSoup库官方文档：https://www.crummy.com/software/BeautifulSoup/bs4/doc/

注意事项：

在进行网页爬取时，请确保遵守目标网站的robots.txt文件规定，尊重网站的爬虫政策。
确保你的行为符合当地法律法规，不要进行非法的数据采集。
考虑到网站的负载，合理控制请求频率，避免对网站服务器造成过大压力。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python的requests库问题 python
2021-06-15 09:55

回答 3 已采纳看一下这个博文：报错的原因：这个其实跟选用的python版本的关系不大，主要原因是因为每次使用 pip install 命令下载插件的时候，下载的都是最新的版本，比如下载requests插件
python中的requests库如何使用 python 有问必答
2021-06-18 22:16

回答 2 已采纳 Python3中request库的使用（爬虫基础）：https://blog.csdn.net/baidu_41871794/article/details/83904024 request库基于u
怎么才能成功安装requests库？ python
2022-07-13 16:57

回答 5 已采纳你看下你 pip list能不能用
A股数据库,使用flask后端，采集数据并存入数据库，以及API.zip
2024-01-04 02:43

数据采集可能使用Python的requests库来发送HTTP请求，BeautifulSoup或lxml进行HTML解析，以及pandas库进行数据清洗和处理。 3. **数据库存储**：采集到的数据需要存储以便后续分析和查询。常见的数据库选择有MySQL...
python requests 库请求报错 python
2021-04-21 22:16

回答 1 已采纳 import requests # 请求数据 url = 'https://gate.lagou.com/v1/neirong/kaiwu/getCourseLessons?courseId=668
用requests获取到的图片的问题 python
2023-02-15 11:16

回答 4 已采纳以下答案引用自GPT-3大模型,请合理使用：，谢谢！我想可能是因为需要先进行图片格式的转换才能够正确地被识别。如果是网站上直接下载的图片，通常只要用open()和Image.open()就可以实
python安装requests库失败 python
2021-08-26 09:59

回答 3 已采纳 pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple
Python网页处理与爬虫实战：使用Requests库进行网页数据抓取
2024-05-31 09:00

Srlua小谢的博客 request 库支持非常丰富的链接访问功能，包括：国际域名和 URL 获取、HTTP 长连接和连接缓存、HTTP 会话和Cookie 保持、浏览器使用风格的SSL 验证、基本的摘要认证、有效的键值对Cookie 记录、自动解压缩、自动...
mac os下python3的requests库的安装问题
2017-05-07 06:13

回答 2 已采纳问题在查看官网说明时已经得到解决 pip install requests 是安装的Python2 版本要安装Python3版本的requests库要使用 pip3 install request
pycharm运行requests库时出现错误 pycharm python 有问必答
2022-02-08 17:23

回答 3 已采纳可以远程看看看吗
requests库post请求获取响应结果 python
2022-08-18 23:37

回答 5 已采纳你题目的解答代码如下： #!/usr/bin/env python3 # -*- coding: utf-8 -*- import json import requests url = 'https:
【Python使用requests 库获取网页内容进行分析处理】
2024-08-29 11:00

Uncle 城的博客综上所述，requests 库通过其丰富的功能和灵活的设置，能够有效地获取和处理各种网页数据，为网络数据采集和分析提供了强大的支持。但在使用过程中，要遵循法律法规和网站的使用规则，确保数据获取的合法性和道德性...
关于python的requests库问题 python
2021-02-09 17:04

回答 1 已采纳有的时候编译器就是会报一些奇奇怪怪的错误。 requests库的__init__.py里没有导入adapters，所以在直接导入requests后使用requests.adapters会被pych
Python用requests库采集充电桩LBS位置经纬度信息
2023-11-08 11:36

q56731523的博客这是一个使用Python的requests库来爬取网页内容的示例。首先，我们需要导入requests库。然后，我们需要定义一个函数来处理请求。在这个函数中，我们需要设置爬虫IP服务器的URL和端口号，然后使用requests.get来获取...
Python库 | adslproxy-0.6.4.tar.gz
2022-02-28 17:19

6. **使用代理**：将获取并验证过的代理传递给请求库（如requests），设置代理设置进行网络请求。 7. **管理代理**：定期调用库提供的管理方法，如`proxy.update()`更新代理池，`proxy.remove_invalid()`移除无效...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月27日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

用Requests库采集图片

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新