爬取指定类型图片.求解！！

运行这个代码只能爬取关于猫猫类型的图片，只能存在创建好的猫猫文件中。如何做到输入一个指定类型，爬取后保存在指定文件夹中


import requests
import sys
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.63 Safari/537.36 Edg/102.0.1245."
}


def loadImg(index, maxnum=200):
    loadnum = 0
    while loadnum < maxnum:
        url = "https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=0%2C0&"\
              "fp=detail&logid=11962624943566928039&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=0&lpn=0&st=-1&word="+index+"&z=0&ic=0&hd=undefined&latest=undefined&copyright=undefined&s=undefined&se=&tab=0&width=&height=&face=undefined&istype=2&qc=&nc=&fr=&simics=&srctype=&bdtype=0&rpstart=0&rpnum=0&cs=3464307413%2C312436372" \
              "&catename=&nojc=undefined&album_id=&album_tab=&cardserver=&tabname=&pn=" + str(loadnum) + "&rn=30&gsm=4&1638875927992="

        response = requests.get(url, headers=headers, timeout=3)
        # 请求状态
        if response.status_code == 200:
            print("请求成功！")
        ##json文件-data-【0-30】-hoverurl
        for i in range(30):
            ImgUrl = response.json()['data'][i]["hoverURL"]
            Img = requests.get(url=ImgUrl, headers=headers)
            name = loadnum + i
            # 进度显示
            print(name)
            ##二进制保存图片
            with open(save_path + index + str(name) + ".jpg", "wb") as f:
                f.write(Img.content)
        loadnum += 30


# 同类别多索引
label1 = str(input("输入指定的类型:"))
a1 = list(label1)
labels = ["鲨鱼", "猫猫", "小狗", "人像"]
ls = str(labels)
index = {"鲨鱼": ['虎鲨', '鼠鲨', '鲨鱼', '食人鲨', '鲨', '巨鲨'],
         "猫猫": ['金渐层', '橘猫', '英短', '波斯猫', '狸花猫'],
         "小狗": ['萨摩', '拉布拉多', '柯基', '金毛', '秋田犬'],
         "人像": ['合影', '自拍', '明星', '歌手', '美女', ]
        }
for lz in label1:
    if lz in ls:
        #labels = ["鲨鱼", "猫猫", "小狗", "人像"]
        '''index = {"鲨鱼": ['虎鲨', '鼠鲨', '鲨鱼', '食人鲨', '鲨', '巨鲨'],
                "猫猫": ['金渐层', '橘猫', '英短', '波斯猫', '狸花猫'],
                "小狗": ['萨摩', '拉布拉多', '柯基', '金毛', '秋田犬'],
                "人像": ['合影', '自拍', '明星', '歌手', '美女', '帅哥']
                }'''
        need_num = [1000]  # 需要的图片数量
        print()
    else:
        print("指定的类型不存在")
        sys.exit()
for num in range(1, len(ls)):
    # 需要提前创建label文件夹
    times = need_num[0] // 200 + 1
    save_path = r"C:\Users\God\A\pachong\\" + a1[0] + "\\"
    for i in range(times):
        loadImg(index[labels[num]][i])

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
法学僧转行程序猿 2022-06-11 10:09
关注
1、为什么只能爬到猫猫类的？
这个跟你输入label1 = str(input("输入指定的类型:"))这句有关，虽然你后边a1 = list(label1)给它定义成列表，但转成列表后就不是你想要的意思，如图：

也就是说。不论你输入多少东西，当你后来从列表取得时候，第一个和第二个永远是猫（也就是前400张图片永远是猫），修改的方法就是把你这个index字典嵌套列表删了，要什么搜什么，直接放进url里边
另外，input("输入指定的类型:")本身就是就是字符串类型了，不知道你再给它外边套个str()是要干什么？

2、为什么全都保存在了猫猫的文件夹里？
如第一问所讲，因为你每次列表里的第一个都是“猫”，所以a1 = list(label1)→a1[0]这个文件夹永远是猫（看问题1的图）→就导致save_path = r"C:\Users\God\A\pachong\" + a1[0] + "\"一直在猫这个文件夹
当第一问按照我的思路解决后，第二问自然就不存在了

3、作为一个经常爬图片视频的老色批，我不建议你从百度爬图片，百度出来的图片质量太差，各大壁纸网站它不香？
感觉我说的有道理欢迎联系

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

精选的 Java 编程语言的优秀框架、库和软件列表 .zip
2024-11-25 05:10

编译器计算机视觉配置约束满足问题求解器CSV数据结构数据库日期和时间依赖注入发展分布式应用程序分布式事务分配文档处理金融的形式化验证函数式编程游戏开发地理空间图形用户界面高性能HTTP 客户端超媒体类型集成...
aiXcoder XL来了！一键生成代码真的强！！
2022-07-04 14:00

轮子厂长的博客当你新接触一门语言时，是否体会过无从下手、想找大佬带飞却无处求助的崩溃？当你想实现一个功能时，是否曾反复抓着日渐稀疏的头发，想在深夜里买醉？当你面临甲方不断变更的需求时，是否还盯着两三函数几行代码不愿...
自然语言处理 NLP 从入门到精通
2025-01-13 09:38

莲华君的博客这本书的结构从基础的自然语言处理概念到复杂的深度学习模型，再到工程化实现和实际案例，逐步引导读者掌握NLP的核心技术，并能够在实际工作中应用。每一章都注重实际操作，结合具体的编程实例与项目，实现理论与...
自然语言00
2023-10-20 18:02

m0_63076514的博客 2、编程语言？计算机程序设计语言 3、自然语言处理（NLP）主要探讨问题：如何让计算机理解人类语言（Natural Language Understanding，NLU）如何让计算机自动“生成”语言（ Natural Language Generation，NLG...
自然语言处理3（NLP）—— 机器学习
2024-03-27 01:35

思诺学长-刘竞泽的博客 1. 自然语言处理在机器学习领域的主要任务自然语言处理（NLP）在机器学习领域中扮演着至关重要的角色，旨在使计算机能够理解、解释和生成人类语言。以下是NLP在机器学习领域中的主要任务及其分类方法： 1.1 按照...
数据爬取期末复习
2023-06-19 14:39

m0_65279769的博客 r=Thread(target=reading) 如果为DataFrame对象指定了索引，则不能对该对象进行切片操作，因为其默认的整数索引不存在了。（错）执行如下代码后的输出结果是（）。 from numpy import array, arange, hstack, ...
好学编程：值得推荐的100个Python练手项目
2024-08-05 17:25

IT好学编程的博客【代码】好学编程：值得推荐的100个Python练手项目。
python语言程序的特点_《Python语言程序设计》 —1.1.3　Python的特点及应用领域...
2020-11-23 14:19

weixin_39805387的博客 1.1.3　Python的特点及应用领域学习一门编程语言，应该了解其特点及适用领域。Python语言的特点及应用领域如下。1. 特点（1）优点简单易学：在开发者社群流行着一句玩笑—“人生苦短，我用Python。”这句话实际上...
OpenCV-Python投影透视变换函数getPerspectiveTransform及warpPerspective详解
2021-02-26 23:30

LaoYuanPython的博客且每个点与src的对应点对应 solveMethod：矩阵分解方法，传递给cv2.solve(DecompTypes) 求解线性方程组或解决最小二乘问题，默认值为None，表示使用DECOMP_LU。 solveMethod对应取值及含义如下：注：矩阵分解，...
大厂 Go 工程师面试题集锦.docx
2021-09-29 09:04

- **知识点**：了解Go语言中Struct类型的比较规则。 - **解释**：在Go中，Struct类型不能直接进行比较，因为它们可能包含指针或不可比较类型（如切片）。若需比较两个Struct是否相等，通常需要自定义比较逻辑。 4...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 6月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 6月10日
展开全部

爬取指定类型图片.求解！！

4条回答 默认 最新

问题事件

4条回答默认最新