python抓取图片无法正常显示

# —*- codeing = utf-8 -*-
# @Time : 2021/3/2 21:39
# @File :04自制.py
# @Software : PyCharm
import os
import requests
import re

if __name__ == "__main__" :
    # 创建一个文件夹，予以保存图片
    if not os.path.exists('./122'):
        os.mkdir('./123')
    # 1、指定url
    url = 'https://www.qiushibaike.com/imgrank/'
    # UA伪装：将user-Agent封装到一个字典中
    headers = {
        'user-agent' :'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81 '
    }
    # 对指定uil发起请求
    # 对整张页面进行爬取
    page_text = requests.get(url=url, headers=headers).text
    # 利用聚焦爬虫对所有图片进行爬取
    ex = '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
    imj_src_list = re.findall(ex, page_text, re.S)
    # print(imj_src_list)
    for src in imj_src_list :
        # 拼接出一个完整的图片url
        src = 'https' + src
        # 请求到图片二进制数据
        img_data = requests.get(url=url, headers=headers).content
        # 上传图片名称
        img_name = src.split('/')[-1]
        # 图片储存路径
        imgPath = './123/' + img_name
        with open(imgPath, "wb") as fp :
            fp.write(img_data)
            print(img_data, '下载成功！！！')

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

ProfSnail 2021-03-06 19:32

关注

import os
import requests
import re
import time
import random
 
if __name__ == "__main__" :
    # 创建一个文件夹，予以保存图片
    if not os.path.exists('./123'):
        os.mkdir('./123')
    # 1、指定url
    url = 'https://www.qiushibaike.com/imgrank/'
    # UA伪装：将user-Agent封装到一个字典中
    headers = {
        'user-agent' :'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81 '
    }
    user_agent_list = ["Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36",
                    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
                    "Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/61.0",
                    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36",
                    "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36",
                    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36",
                    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)",
                    "Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.5; en-US; rv:1.9.2.15) Gecko/20110303 Firefox/3.6.15",
                    ]
    # 对指定uil发起请求
    # 对整张页面进行爬取
    page_text = requests.get(url=url, headers=headers).text
    # 利用聚焦爬虫对所有图片进行爬取
    ex = '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
    imj_src_list = re.findall(ex, page_text, re.S)
    # print(imj_src_list)
    retryLimit = 5
    for src in imj_src_list :
        # 拼接出一个完整的图片url
        src = 'http:' + src
        # 请求到图片二进制数据
        flag = True
        retryTime = 0
        while flag:
            try:
                headers['User-Agent'] = random.choice(user_agent_list)
                img_data = requests.get(url=src, headers=headers).content
                # 上传图片名称
                img_name = src.split('/')[-1]
                # 图片储存路径
                imgPath = './123/' + img_name
                with open(imgPath, "wb") as fp :
                    fp.write(img_data)
                    print(src)
                    print(imgPath, '下载成功！！！')
                flag = False
            except:
                print("访问被拒绝，尝试等待后重连")
                time.sleep(5)
            retryTime += 1
            if retryTime >= retryLimit:
                print(src)
                print(imgPath, "下载失败")
                break

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

python 爬虫入门五、抓取图片、视频
2024-10-24 14:51

i道i的博客图片、音频、视频抓取。m3u8，AES，tqdm进度条
python网络爬虫抓取图片
2015-02-05 10:42

利用python抓取网络图片的步骤： 1.根据给定的网址获取网页源代码 2.利用正则表达式把源代码中的图片地址过滤出来 3.根据过滤出来的图片地址下载网络图片
python爬虫抓取网页图片教程
2023-12-02 14:54

肥仔全栈开发的博客或者，如果你想爬取的是特定格式的图片（例如JPEG或PNG），你可能需要使用更复杂的逻辑来过滤和下载这些图片。最后，在使用爬虫时，一定要遵守网站的robots.txt文件和其他相关规定，以合法和负责任地使用爬虫。在...
python爬虫抓取页面图片
2018-07-30 19:04

python爬虫抓取页面图片python爬虫抓取页面图片python爬虫抓取页面图片
python 抓取一个网站所有图片并保存
2017-07-27 14:04

python 抓取一个网站所有图片并保存
Python应用开发——爬取网页图片
2022-09-06 19:00

柒壹漆的博客当我们需要从网页上面下载很多图片的时候，一个一个手动保存实在是太累人了。那么有没有批量下载的办法呢？答案是有的，Python爬虫就可以完美的做到这一点，而且作为一个Python的初学者，我可以很负责任的告诉你，...
Python3爬虫抓取百度图片中的图片
2017-08-07 21:58

Python3爬虫抓取百度图片中的图片，可根据需求输入关键字、图片数量
网络爬虫实战——使用Python抓取网页数据
2025-08-10 18:29

鸽芷咕的博客随着数据驱动时代的到来，网络爬虫技术已成为获取网页数据的重要工具。无论是爬取新闻文章、商品信息还是股票数据，...本文将从零开始，带你了解如何使用Python实现网页数据的抓取，通过实际例子深入爬虫核心概念。
使用Python抓取抖音直播间数据的简易指南
2024-03-23 00:54

一键难忘的博客在这个数字化时代，直播已经成为了人们获取信息、娱乐和社交的重要方式之一。抖音作为全球知名的短视频平台，其...本文将介绍如何使用Python编写代码来抓取抖音直播间的数据，以及如何解析这些数据并进行进一步的分析。
使用 Python 进行网页抓取
2022-12-30 21:24

鲸落✗的博客我们将重点介绍为什么您应该使用 Python 进行网页抓取，并为您提供有关如何完成它的快速教程，包括使用哪些Python 开发工具。因此，下一步是部署抓取程序，将信息复制到您请求的数据库中。要获得您希望抓取为Python...
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

python抓取图片无法正常显示

1条回答默认最新

码龄粉丝数原力等级 --

python抓取图片无法正常显示

1条回答 默认 最新

1条回答默认最新