python爬虫IndexError

问题遇到的现象和发生背景

第一行起始行是17 ，也就是从导入包开始为第一行

问题相关代码，请勿粘贴截图

import urllib.request
from lxml import etree

def create_request(page):
    if (page == 1):
        url = 'https://sc.chinaz.com/tupian/qinglvtupian.html'
    else:
        url = 'https://sc.chinaz.com/tupian/qinglvtupian_' + str(page) + '.html'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.5060.53 Safari/537.36 Edg/103.0.1264.37'
    }
    request = urllib.request.Request(url, headers=headers)
    return request

def get_content(request):
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    return content

def down_load(content):
    tree = etree.HTML(content)

    name_list = tree.xpath('//div[@id="container"]//a/img/@alt')

    # 一般网页的图片都会进行懒加载
    src_list = tree.xpath('//div[@id="container"]//a/img/@src2')

    for i in range(len(name_list)):
        name = name_list[i]
        src = src_list[i]
        url = 'https:' + src

        urllib.request.urlretrieve(url = url,filename='./loveImg' + name + '.jpg')


if __name__ == '__main__':
    start_page = int(input('请输入开始页码：'))
    end_page = int(input('请输入结束页码：'))

    for page in range(start_page,end_page+1):
        # (1)请求对象定制
        request = create_request(page)
        # (2)获取网页源码
        content = get_content(request)
        # (3)下载图片
        down_load(content)

运行结果及报错内容

请输入开始页码：1
请输入结束页码：5
Traceback (most recent call last):
  File "D:/big data/python/workpython/072_解析_站长素材.py", line 62, in <module>
    down_load(content)
  File "D:/big data/python/workpython/072_解析_站长素材.py", line 46, in down_load
    src = src_list[i]
IndexError: list index out of range

Process finished with exit code 1

我的解答思路和尝试过的方法

我想要达到的结果

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
二九筒 2022-06-29 14:17
关注
你这两个列表中的元素长度不一样，然后循环的时候超出src_list的值了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。我们希望通过爬虫程序获取豆瓣电影的名称、评分和简介等信息，以便进行数据分析或制作推荐系统。
Python爬虫实战入门：豆瓣电影Top250(保你会，不会来打我)
2024-03-15 07:49

爱喝兽奶的荒天帝的博客 i https://pypi.tuna.tsinghua.edu.cn/simple lxml 简介 requests模块 requests 是 Python 编程语言中一个常用的第三方库，它可以帮助我们向 HTTP 服务器发送各种类型的请求，并处理响应。向 Web 服务器发送 GET、...
Python网络爬虫入门篇
2024-07-15 15:46

独角兽哆啦A梦的博客 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析“标签树”等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序...
Python 爬虫面试题
2022-01-11 10:16

蒙宁飞的博客 Python 爬虫面试题
Python爬虫实战：阳光高考数据抓取
2025-09-07 15:06

程序员论周的博客本文详细介绍使用Python和Pyppeteer爬取阳光高考网站的高校基本信息与招生简章，实现异步抓取、多进程优化、断点续抓和增量爬虫。项目将数据存储到MySQL数据库，并生成PDF文件，适合爬虫开发者和数据采集爱好者参考...
18、数据科学进阶：从网络爬虫到编程语言应用
2025-11-26 06:16

t1u2v的博客本文深入探讨了数据科学的进阶路径，从基础网络爬虫实践到掌握多种编程语言的应用。文章对比了MATLAB与Python在注释、索引、循环、数据类型等方面的差异，总结了初学者常见的12类编码错误及其解决方案，并通过...
【Python】解决Python报错：IndexError: pop from empty list
2024-05-30 19:15

I'mAlex的博客解决Python报错：IndexError: pop from empty list
Python网络爬虫简单入门
2022-01-23 15:42

阿言教编程的博客 Python爬虫基本流程 a. 发送请求使用http库向目标站点发起请求，即发送一个Request，Request包含：请求头、请求体等。 Request模块缺陷：不能执行JS 和CSS 代码。 b. 获取响应内容如果requests的内容存在于目标...
Python爬虫入门教程03：二手房数据爬取
2021-01-23 21:40

嗨学编程的博客 Python爬虫入门教程01：豆瓣Top电影爬取 Python爬虫入门教程02：小说爬取 PS：如有需要 Python学习资料以及解答的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入基本开发环境 ...
Python网络爬虫入门篇！（超详细）
2024-09-14 17:35

可达鸭丫的博客 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析“标签树”等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序...
Python基础&爬虫基础知识
2024-05-30 16:37

进击的六角龙的博客 Python：基础&爬虫 Python爬虫学习（网络爬虫（又称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有...
Python爬虫入门篇！
2024-09-05 17:17

东眠的鱼的博客 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析“标签树”等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序...
Python网络爬虫技术解析：从基础实现到反爬应对
2025-05-12 15:40

小张在编程的博客网络爬虫是一种通过自动化程序模拟浏览器行为，从网页中提取结构化数据的技术，广泛应用于数据监测、竞品分析等领域。其核心流程包括请求、解析和存储，关键技术涉及HTTP协议、页面解析与数据提取。工程实践中，爬虫...
最全python爬虫面试笔试题及答案汇总，三万多字，持续更新，适合新手，应届生
2019-07-03 17:22

逸少凌仙的博客一些经典的Python爬虫和网络编程面试题... 1 1、动态加载又对及时性要求很高怎么处理？... 1 2、分布式爬虫主要解决什么问题？... 1 3、什么是 URL？... 1 4、python 爬虫有哪些常用技术？... 1 5、简单说一下...
Python爬虫和数据可视化
2021-04-21 15:51

中國颜值的半壁江山的博客 print("出错了,位置错误:",e) else: print("一切正常") finally: print("不管有没有错误都执行") 五、Python爬虫 1、任务介绍爬取豆瓣电影Top10的基本信息，包括电影的名称、豆瓣评分、评价数、电影概况、电影链接...
00_Python核心编程
2024-06-25 17:05

刘德华海淀分华的博客 Python核心语法人生苦短，你会用python么？
【Python】网络编程
2025-04-03 15:10

白冥_曜家的的博客 Unix 域机制标准库 - pickle 传输一般对象存储一般对象标准库 - json 更适合跨语言的数据交换格式 JSON 格式序列化与反序列化读取与存储模块化编程 from-import 语句包标准库 - http.client REST 架构 ...
Python 爬虫学习入门阶段小结（心得+python爬虫遇到的所有错误集合）
2018-09-09 20:45

一颗橡树的博客 bilibili嵩天教授网课 + 个人练习 — 《python网络爬虫从入门到实践》，前后一共1个半月左右中间出现的无数次问题找度娘解决了，自学确实比较艰辛，因为一个问题经常想一两天都解决不了。再来谈谈我看过的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 6月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 6月29日

python爬虫IndexError

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

2条回答 默认 最新

问题事件

2条回答默认最新