python 爬取图片存储到文件夹问题

问题遇到的现象和发生背景

我想抓取一部漫画，离线观看，
要求：
每一章节创建单独一个文件存放，文件夹按照第一章第二章第三章顺序存储
抓取的图片按照，网页上的顺序保存，为0 1 2 3

目前没有报错，图片顺序存储已经完成
但是目录只能按照，抓取到的章节id存储
试想在创建文件夹的时候定义个变量去计数，但是，创建完一个之后就不创建了

问题相关代码，请勿粘贴截图

  # 保存图片
  def save_img(self, url, name):
        opener = urllib.request.build_opener()
        opener.addheaders = [('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.82 Safari/537.36')]
        urllib.request.install_opener(opener)
        urllib.request.urlretrieve(url, name)

    # 这个函数创建文件夹
    def create_mkdir(self, filename_path):
        path = filename_path.strip()
        isExists = os.path.exists(filename_path)
        if not isExists:
            print('创建名字叫做', filename_path, '的文件夹')
            os.makedirs(path)
            print('创建成功！')
        else:
            print(path, '文件夹已经存在了，不再创建')

    def get_book_url(self):
        soup_book_list = self.get_soup(self.url)
        for new in soup_book_list.select('.view-win-list'):
            if len(new.select('a')) > 0:
                url_list = new.findAll('a')
                for j in url_list:
                    url = self.Hurl + j['href']
                    url_id = url.split('/')[-1]
                    book_url = 'https://www.*****.top/chapter/'+url_id
                    self.create_mkdir(self.filename_path + url_id)
                    soup_img = self.get_soup(book_url)
                    x = 0
                    for img_list in soup_img.select('.comicpage'):
                        img = img_list.findAll('img')
                        for i in img:
                            img_url = i['data-original']
                            print(img_url)
                            self.save_img(img_url, self.filename_path + url_id + '/%s.jpg' % x)
                            x += 1
                            # 输出下载第几张
                            print('正在下载第%d张' % x)

运行结果及报错内容

无

我的解答思路和尝试过的方法

我想要达到的结果

文件夹，抓取的图片按照顺序命名
文件夹命名为：第一章第二章第三章
图片命名为：0 1 2 3

问下个各位要怎么解决，文件夹顺序存储的问题

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

莱宝是菜宝 2022-02-14 19:58

关注

你的文件夹是由self.create_mkdir(self.filename_path + url_id) 这行代码生成的，所以文件夹的名字是url_id。你只需要多定义一个变量作为文件夹名字就可以了，代码如下：

def get_book_url(self):
        file_id = 1    # 定义新的变量
        soup_book_list = self.get_soup(self.url)
        for new in soup_book_list.select('.view-win-list'):
            if len(new.select('a')) > 0:
                url_list = new.findAll('a')
                for j in url_list:
                    url = self.Hurl + j['href']
                    url_id = url.split('/')[-1]
                    book_url = 'https://www.*****.top/chapter/'+url_id
                    self.create_mkdir(self.filename_path + "第{}章".format(file_id))   # 修改了这一行
                    file_id += 1 
                    soup_img = self.get_soup(book_url)
                    x = 0
                    for img_list in soup_img.select('.comicpage'):
                        img = img_list.findAll('img')
                        for i in img:
                            img_url = i['data-original']
                            print(img_url)
                            self.save_img(img_url, self.filename_path + url_id + '/%s.jpg' % x)
                            x += 1
                            # 输出下载第几张
                            print('正在下载第%d张' % x)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

python 爬取图片存储到文件夹问题 python 爬虫
2022-02-14 17:09

回答 3 已采纳你的文件夹是由self.create_mkdir(self.filename_path + url_id) 这行代码生成的，所以文件夹的名字是url_id。你只需要多定义一个变量作为文件夹名字就可以了
python 批量爬取图片并保存到本地文件夹中不成功 python 有问必答
2021-06-29 15:43

回答 2 已采纳你的temp只是一个字符串，应该是一个url，你还没发送请求，用requests发送一下请求
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
python如何爬取图片到指定文件夹论文_基于Python的图片爬虫程序设计
2020-12-06 00:50

weixin_39943586的博客基于Requests-BeautifulSoup技术构建图片爬虫实现网页图片爬取，详细阐述了百度贴吧美图吧图片爬虫程序的采集、解析、爬取和存储过程，实验结果证明基于Python的Requests-BeautifulSoup技术可快速构建图片爬...
Python爬取图片问题 python
2021-04-07 06:15

回答 2 已采纳题主存在问题是：保存图片路径是写死的，循环中会一直覆盖写入"python爬虫图片实验2.jpg"这张图片，所以最后只能得到一张图片修改：保存图片路径需要改一下，让每一次循环时，图片写入不
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
Python爬取存储出错 python 学习方法改行学IT
2022-10-18 00:23

回答 1 已采纳是encoding，你拼错了，有帮助的话采纳一下哦！
python如何爬取图片到指定文件夹_Python使用xpath实现图片爬取
2020-11-25 04:58

weixin_39892481的博客高性能异步爬虫目的：在爬虫中使用异步实现高性能的数据爬取操作异步爬虫的方式：- 多线程、多进程（不建议）：好处：可以为相关阻塞的操作单独开启多线程或进程，阻塞操作就可以异步执行;弊端：无法无限制的开启多...
python爬取图片报错TypeError python 爬虫
2022-12-29 23:52

回答 1 已采纳你这是没有爬到，数据为空的才报的错。可以使用异常处理try一下，再处理为空的情况
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
python 爬虫爬取图片问题 python 有问必答爬虫
2022-06-06 20:12

回答 4 已采纳你题目的解答代码如下： #coding=gbk import requests from io import BytesIO from PIL import Image from selenium
python爬取图片并创建文件夹保存
2020-04-20 22:58

k5003的博客 “images/”+kpartname) if not os.path.isdir(new_path): os.makedirs(new_path) print(“创建文件夹：”+new_path) #下载图片 def downLoadImg(url,new_path): path=sys.path[0] kpath = os.path.join(path, ...
python爬取二手房信息的问题 python
2023-03-26 10:47

回答 3 已采纳根据您提供的代码和报错信息，问题出现在 title=li.xpath('./div/div[2]/div[1]/div/a/text()')[0] 这一行，数组越界了。这可能是由于某些 li 标签没有
python爬取网站图片并保存到文件夹下（re和beautiful）
2021-11-15 10:38

exemplify的博客 ||由于这种网站是第一层放着只是放着单个链接(不太清楚的图片链接)然后打开获取其中单个稍微清楚的链接，这个链接也是不清楚的图片的链接，从这个网也源代码取大图的链接 ps：最好写一个time.sleep(3)来更改访问...
Python爬取图片 天气预报
2022-01-26 22:17

在这个主题中，“Python爬取图片 天气预报”涉及到利用Python编写爬虫程序来抓取网络上的天气预报图片。这样的任务通常用于自动收集天气信息，构建个人化的天气预报系统，或者进行数据分析。以下是一些关于这个话题...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 2月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月14日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵