python抓取图片无法正常显示

# —*- codeing = utf-8 -*-
# @Time : 2021/3/2 21:39
# @File :04自制.py
# @Software : PyCharm
import os
import requests
import re

if __name__ == "__main__" :
    # 创建一个文件夹，予以保存图片
    if not os.path.exists('./122'):
        os.mkdir('./123')
    # 1、指定url
    url = 'https://www.qiushibaike.com/imgrank/'
    # UA伪装：将user-Agent封装到一个字典中
    headers = {
        'user-agent' :'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81 '
    }
    # 对指定uil发起请求
    # 对整张页面进行爬取
    page_text = requests.get(url=url, headers=headers).text
    # 利用聚焦爬虫对所有图片进行爬取
    ex = '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
    imj_src_list = re.findall(ex, page_text, re.S)
    # print(imj_src_list)
    for src in imj_src_list :
        # 拼接出一个完整的图片url
        src = 'https' + src
        # 请求到图片二进制数据
        img_data = requests.get(url=url, headers=headers).content
        # 上传图片名称
        img_name = src.split('/')[-1]
        # 图片储存路径
        imgPath = './123/' + img_name
        with open(imgPath, "wb") as fp :
            fp.write(img_data)
            print(img_data, '下载成功！！！')

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

ProfSnail 2021-03-06 19:32

关注

import os
import requests
import re
import time
import random
 
if __name__ == "__main__" :
    # 创建一个文件夹，予以保存图片
    if not os.path.exists('./123'):
        os.mkdir('./123')
    # 1、指定url
    url = 'https://www.qiushibaike.com/imgrank/'
    # UA伪装：将user-Agent封装到一个字典中
    headers = {
        'user-agent' :'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/88.0.4324.182 Safari/537.36 Edg/88.0.705.81 '
    }
    user_agent_list = ["Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36",
                    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
                    "Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/61.0",
                    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36",
                    "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36",
                    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36",
                    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)",
                    "Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.5; en-US; rv:1.9.2.15) Gecko/20110303 Firefox/3.6.15",
                    ]
    # 对指定uil发起请求
    # 对整张页面进行爬取
    page_text = requests.get(url=url, headers=headers).text
    # 利用聚焦爬虫对所有图片进行爬取
    ex = '<div class="thumb">.*?<img src="(.*?)" alt.*?</div>'
    imj_src_list = re.findall(ex, page_text, re.S)
    # print(imj_src_list)
    retryLimit = 5
    for src in imj_src_list :
        # 拼接出一个完整的图片url
        src = 'http:' + src
        # 请求到图片二进制数据
        flag = True
        retryTime = 0
        while flag:
            try:
                headers['User-Agent'] = random.choice(user_agent_list)
                img_data = requests.get(url=src, headers=headers).content
                # 上传图片名称
                img_name = src.split('/')[-1]
                # 图片储存路径
                imgPath = './123/' + img_name
                with open(imgPath, "wb") as fp :
                    fp.write(img_data)
                    print(src)
                    print(imgPath, '下载成功！！！')
                flag = False
            except:
                print("访问被拒绝，尝试等待后重连")
                time.sleep(5)
            retryTime += 1
            if retryTime >= retryLimit:
                print(src)
                print(imgPath, "下载失败")
                break

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

python抓取图片无法正常显示 python
2021-03-06 19:08

回答 1 已采纳 import os import requests import re import time import random if __name__ == "__main__" : # 创
python抓取405错误 python 有问必答爬虫
2022-01-07 16:37

回答 2 已采纳建议使用requests,添加参数headers,cookies，params,这样试一下。
pycharm爬取的网络图片无法显示 python 有问必答
2021-07-25 15:07

回答 1 已采纳问题主要出现在img_data=requests.get(url=url,headers=headers).content,在这句里，请求的网址是imgrank页面地址，而不是图片的网址，解析获取不到
python抓取网页中链接的静态图片
2020-09-20 20:19

主要为大家详细介绍了python抓取网页中链接的静态图片，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
python爬虫网页标签个别无法读取 python 开发语言有问必答爬虫
2022-04-05 22:09

回答 3 已采纳因为个别标签字典中没有bond_nm和bond_nm_tip键 data2 = data_get['bond_nm'] data5 = data_get['bond_nm_tip']
Python获取摄像头图片问题 opencv python
2022-11-18 12:59

回答 2 已采纳感觉可以初始化两个cap执行 camera0 cap0= cv2.VideoCapture(0) camera1 cap1= cv2.VideoCapture(1)
python 如何抓取网页地址保存为图片？ python
2021-11-09 13:05

回答 1 已采纳 PIL ,或者pyautogui
python抓取网页中图片并保存到本地
2020-09-21 19:17

本篇文章给大家介绍python抓取网页中图片并保存到本地，对python抓取网页图片相关知识感兴趣的朋友一起学习吧
一个Python抓取网页数据的问题 python 有问必答
2021-04-21 08:19

回答 7 已采纳这个长的字符串, 前面后面各加一个[ ], 就成了'[[],[]]'' 这种格式, 可以用eval()再转换一下, 就成了[[],[]] 可以生成数组或者dataframe,dataframe可转成
Python爬虫requests.get方法无法显示div中折叠内容 https python 有问必答爬虫
2021-11-27 19:16

回答 2 已采纳该页面数据是动态加载的，需要用此链接用post请求去获取https://www.xuetangx.com/api/v1/lms/get_product_list/?page=1
python抓取网页，网页源码无法解码 python
2015-11-01 11:55

回答 2 已采纳 python3 +. 需要安装urllib3. 你也可以试试，直接转换成gb2312.下面的代码亲测可用。 ``` http = urllib3.PoolManager() r=
ZQ.rar_python_抓取_抓取图片
2022-09-23 01:49

用python进行网站图片的抓取
python爬虫爬取到的内容无法输出到txt文档中 python
2022-08-12 12:20

回答 3 已采纳不如换用requests库和bs4库吧。 from bs4 import BeautifulSoup as bs import requests as r url = 'https://fanqie
python 抓取一个网站所有图片并保存
2019-04-23 09:24

python 抓取一个网站所有图片并保存。 python 抓取一个网站所有图片并保存 python 爬虫
Python 抓取图片下载地址
2017-05-15 19:45

Python 抓取图片Python 抓取图片Python 抓取图片Python 抓取图片Python 抓取图片Python 抓取图片
没有解决我的问题, 去提问

悬赏问题

¥15 Attention is all you need 的代码运行
¥15 一个服务器已经有一个系统了如果用usb再装一个系统，原来的系统会被覆盖掉吗
¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时，终端显示出了sequence handled的进度条，但是并不出结果就自动终止回到命令提示行了是怎么回事：
¥15 前置放大电路与功率放大电路相连放大倍数出现问题
¥30 关于<main>标签页面跳转的问题
¥80 部署运行web自动化项目
¥15 腾讯云如何建立同一个项目中物模型之间的联系
¥30 VMware 云桌面水印如何添加
¥15 用ns3仿真出5G核心网网元
¥15 matlab答疑关于海上风电的爬坡事件检测

码龄粉丝数原力等级 --

python抓取图片无法正常显示

1条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

python抓取图片无法正常显示

1条回答 默认 最新

悬赏问题

1条回答默认最新