Python爬取的图片为什么看不了是什么原因

Python爬取的图片为什么看不了是什么原因，有知道的可以解答一下吗？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

ChatGPTᴼᴾᴱᴺᴬᴵ 2023-12-09 21:39

关注

所有内容均由人工智能模型输出，其内容的准确性和完整性无法保证，不代表我的态度或观点。
（讯飞星火专栏，V3.0版本，2023.10.24）

该回答引用讯飞星火认知大模型，仅提供参考，不保证完全正确
Python爬取的图片为什么看不了的原因可能有以下几点：

图片的URL不正确或失效。请检查图片的URL是否正确，以及是否已经过期。
图片的编码格式不正确。请尝试使用其他编码格式（如UTF-8）进行解码。
图片文件损坏。可能是由于网络问题或其他原因导致图片文件损坏。
图片保存路径不正确。请确保图片保存路径正确，并且具有写入权限。
代码中存在错误。请仔细检查代码中是否存在语法错误、逻辑错误或其他问题。

针对您提供的代码，我发现了以下问题：

在get_alldata函数中，soup = BeautifulSoup(text, features: 'html.parser')这一行缺少了逗号分隔参数。应该修改为soup = BeautifulSoup(text, 'html.parser')。
在savepath函数中，with open('国漫图片\\'+title1+'.jpg',mode='wb')as fp:这一行中的反斜杠应该改为正斜杠，即/。

修改后的代码如下：

import re
import requests
from bs4 import BeautifulSoup
import random

if __name__ == "__main__":
    head1 = {
        'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Mobi'}
    head2 = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WoW64; Trident/7.0; rv:11.0) like Gecko'}
    headers = (head1, head2)
    head = random.choice(headers)
    baseurl = 'https://pic.netbian.com/index.html'
    html_url = get_data(baseurl)
    get_alldata(html_url)

def get_data(html_url):
    """获取网页源代码"""
    for i in range(1, 2):
        respon = requests.get(url=html_url, headers=head)
        # 解码
        respon.encoding = 'gbk'
        text = respon.text
        return text

def get_alldata(text):
    soup = BeautifulSoup(text, 'html.parser')
    all_li = soup.find('ul', class_="clearfix")
    all_li = str(all_li)
    # 找到所有li标签
    all_data = re.findall('<li><a href="(?P<link>.*?)".*?title="(?P<title>.*?)">', all_li)
    for item in all_data:
        link = item[0]
        title = item[1]
        # 拼接最新的url地址获取高清图片
        new_url = 'https://pic.netbian.com/' + link
        # 所有高清图片的连接
        req = requests.get(url=new_url, headers=head)
        req.encoding = 'gbk'
        all_html = req.text
        soup2 = BeautifulSoup(all_html, 'html.parser')
        result = soup2.find_all('div', class_="view")  # 获取图片所在位置
        result = str(result)
        all_Jpg = re.findall('(.*?)"', result)
        for it in all_Jpg:
            all_Hdjpg = it[0]
            title1 = it[1]
            savepath(all_Hdjpg, title1)
            # 保存图片

def savepath(all_Hdjpg, title1):
    # 拼接一下高清图片jpg地址
    all_ling = 'https://pic.netbian.com/' + all_Hdjpg
    img_res = requests.get(url=all_ling, headers=head)
    with open('/国漫图片/' + title1 + '.jpg', mode='wb') as fp:  # 以二进制写入图片
        print('正在保存：', title1)
        fp.write(img_res.content)

请注意，这段代码可能仍然无法正常工作，因为网站结构可能会发生变化。建议您根据实际情况进行调整。

报告相同问题？

关注问题

Python爬取网站图片
2025-04-02 11:27

Python作为一门强大的编程语言，在网络爬虫领域具有广泛的应用。特别是当涉及到爬取网站上的图片资源时，Python提供了多种库和工具，使得这一过程变得更加高效和便捷。网络爬虫的基本原理是通过模拟人类用户的行为...
Python网页图片爬取
2025-12-30 10:47

Python网页图片爬取技术是利用Python编程语言进行网络资源自动化采集的一项技术。通过掌握相关技术和库的使用，我们可以高效地从互联网上获取所需的图片资源，但同时也需要关注版权、法律法规以及技术实现中的各种...
基于Python编程语言的水文数据爬取设计源码
2024-10-01 07:42

本项目所涉及的“基于Python编程语言的水文数据爬取设计源码”提供了一个高效且专业的解决方案，帮助相关人员快速、准确地收集和整理水文数据。项目源码由80个文件构成，其中包含大量的数据文件和配置文件，主要...
Python源码-python爬取图片源代码.zip
2025-05-25 20:11

因此，掌握如何使用编程语言从网络上抓取图片，对于数据科学家、人工智能研究者以及从事数据分析的专业人士来说，是一项基础且至关重要的技能。本压缩包中的文件——“python爬取图片源代码”，便是为了满足这一...
python实现爬取网络图片爬虫
2025-05-20 23:29

而Python作为一种简洁易读、功能强大的编程语言，因其丰富的库支持，特别适合用来实现网络爬虫。因此，学习如何使用Python来实现一个能够爬取网络图片的爬虫，对于数据分析师、网站管理员以及对网络数据感兴趣的...
Python爬取图片三种方法[项目源码]
2025-11-17 07:26

本文将详细介绍使用Python爬取图片的三种方法，并通过具体的案例来展示每种方法的应用和实践。首先，正则表达式是一种简单却强大的文本处理工具，它通过定义特定的字符序列模式来匹配字符串中的特定内容。在爬取...
利用Python爬取网页图片
2024-12-06 15:28

Python_trys的博客 Python 的 requests提取该组件，进而获取img的src然后使用 urllib.request.urlretrieve逐个下载图片，从而达到批量获取资料的目的，思路好了，下面应该告诉程序要爬取的url为http://pic.sogou.com/pics/recommend?
Python爬取知乎图片代码实现解析
2020-09-18 16:02

根据给定的文件信息，以下是关于Python爬取知乎图片代码实现解析的知识点： 1. Python爬虫基础：在学习爬虫技术时，首先需要了解Python编程语言基础，包括函数定义、循环语句、条件判断等。因为爬虫的编写涉及到对...
用python爬取网页并导出为word文档.docx
2020-05-06 14:58

在Python编程中，爬虫是一种常见的技术，用于自动获取网页内容。MongoDB作为一个非关系型数据库，因其灵活性和高性能在Web应用数据存储方面扮演着重要角色。本篇内容将介绍如何利用Python爬虫抓取网页内容，并将其...
mzitu_win_爬虫python_爬虫_python爬取图片_mzitu图片_python爬虫_
2021-10-04 07:26

3. **python爬取图片**：在Python中，爬取图片通常涉及到`requests`库的`get`方法获取网页资源，然后通过`Content-Type`判断是否为图片，再利用`save`方法保存到本地。有时还需要处理URL编码问题，以及可能出现的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 12月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月9日

Python爬取的图片为什么看不了是什么原因

4条回答 默认 最新

问题事件

4条回答默认最新