怎么实现一个页面爬取多张图片？

假设这是我爬取的页面：http://www.rosiyy.com/xiaoyan/rosi1559.html
图片说明
但是要爬取的页面有多个图片，求大神有什么思路？

以下是我的全部代码

 # coding:utf-8
import requests
from lxml import html
import os
import time
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

def getPage(pageNum):
    baseUrl = 'http://www.rosiyy.com/tag/%E8%82%89%E4%B8%9D-5.html'.format(pageNum)
    selector = html.fromstring(requests.get(baseUrl).content)
    urls = []
    for i in selector.xpath('//div[@class="photo"]/a/@href'):
        urls.append(i)
    return urls

def getPiclink(url):
    sel = html.fromstring(requests.get(url).content)
    total = sel.xpath('//div[@class="archives_page_bar"]/a[last()-1]/text()')[0]
    title = sel.xpath('//h2/text()')[0]
    jpgList = []
    for i in range(int(total)):
        link = '{}/{}'.format(url,i+1)
        s = html.fromstring(requests.get(link).content)
        jpg = s.xpath('//div[@class="post postimg"]/p/a/img/@src')[0]
        jpgList.append(jpg)
    return title, jpgList

def downloadPic((title, piclist)):
    k = 1
    count = len(piclist)
    dirName = u"【%sP】 %s" %(str(count), title)
    os.mkdir(dirName)
    for i in piclist:
        filename = '%s/%s/%s.jpg' %(os.path.abspath('.'), dirName, k)
        print u'Download：%s 第%s张' %(dirName, k)
        with open(filename, "wb") as jpg: 
            jpg.write(requests.get(i).content)
            time.sleep(0.5)
        k += 1


if __name__ == '__main__':   
    pageNum = input(u'page:')
    for link in getPage(pageNum):
        downloadPic(getPiclink(link))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2017-06-03 15:57
关注
https://www.oschina.net/code/snippet_2888856_58816

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python：如何爬取到该数据？ python
2020-09-07 10:20

回答 2 已采纳首先 f12 抓包，看看 ajax 的 json 请求的实际地址是什么，然后用 r = requests.get(request_url) obj = r.json() print(obj.学
python爬取网页表格一行内存在多个文件 python 有问必答
2022-01-27 15:14

回答 3 已采纳直接请求数据接口获取数据接口，不需要用selenium采集，代码如下 import requests import time headers = { 'user-Agent':'Mozilla/5.
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
python爬虫爬取多个页面_python网络爬虫之使用scrapy自动爬取多个网页
2020-11-24 10:20

weixin_39542742的博客如果我们想爬取多个网页。比如网上的小说该如何如何操作呢。比如下面的这样的结构。是小说的第一篇。可以点击返回目录还是下一页对应的网页代码：我们再看进入后面章节的网页，可以看到增加了上一页对应的网页代码：...
Python 爬虫爬取页面pagetext不完整是静态页面 python 有问必答爬虫
2021-10-21 15:16

回答 1 已采纳该页面信息通过用户选择选项，js动态渲染加载数据的，比如在选项框中输入name,在XHR中就可以看到name的动态加载链接，对其进行请求可获取相关信息的json数据信息。
如何用python实现一个简单的抠图功能？ python 有问必答
2021-09-04 10:37

回答 3 已采纳以下面这三幅图为例，将第一张图像中的黄色区域（假定R和G通道大于160，B通道小于160），粘贴到第二张图像中，得到第三张图像。 >>> import numpy as np
微博热搜是爬取不了吗？ python 爬虫
2021-09-26 17:31

回答 1 已采纳你调试看下返回的html，内容不对，自然xpath获取不到东西了
python爬取多张图片_python3 requests库实现多图片爬取教程
2020-12-06 02:34

weixin_39752215的博客其实爬取图片和你下载图片是一个样子的，都是操作链接，也就是url，所以当我们确定要爬取的东西后就要开始寻找url了，所以先打开百度图片搜一下然后使用浏览器F12进入开发者模式，或者右键检查元素注意看xhr，点开...
如何爬取pdf文档呢？ python 数据挖掘爬虫
2022-03-15 17:59

回答 1 已采纳神仙来了也不行
通过python爬虫，爬取到的图片无法打开，请问要怎么办？ pycharm python
2021-08-11 23:59

回答 2 已采纳你是真的秀，没有请求图片地址获得数据肯定打不开啊，你写入的是列表的的文本的二进制，并不是图片的。应该在图片链接后面再请求一次图片网址，然后写入获得的响应数据的二进制内容，望采纳哈
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
Python爬虫实现爬取京东手机页面的图片(实例代码)
2020-09-21 00:52

下面小编就为大家分享一篇Python爬虫实现爬取京东手机页面的图片实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python爬取多页数据_python爬虫如何实现爬取同一个网站的多页数据
2021-02-04 05:45

天天测评的博客本文小编带领大家通过python爬虫获取获取总页数并更改url的方法，实现爬取同一个网站的多页数据。一、爬虫的目的从网上获取对你有需要的数据二、爬虫过程1、获取url(网址)。2、发出请求，获得响应。3、提取数据。4、...
python爬取多页数据_python爬虫实现爬取同一个网站的多页数据代码实例
2021-02-04 05:45

正直的养猫人的博客本篇文章小编给大家分享一下python爬虫实现爬取同一个网站的多页数据代码实例，文章代码介绍的很详细，小编觉得挺不错的，现在分享给大家供大家参考，有需要的小伙伴们可以来看看。一、爬虫的目的从网上获取对你有...
没有解决我的问题, 去提问

悬赏问题

¥50 随机森林与房贷信用风险模型
¥50 buildozer打包kivy app失败
¥30 在vs2022里运行python代码
¥15 不同尺寸货物如何寻找合适的包装箱型谱
¥15 求解 yolo算法问题
¥15 虚拟机打包apk出现错误
¥15 用visual studi code完成html页面
¥15 聚类分析或者python进行数据分析
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备

怎么实现一个页面爬取多张图片？

1条回答 默认 最新

悬赏问题

1条回答默认最新