爬取小说时超出索引范围

问题遇到的现象和发生背景

本人出于兴趣开始了python的相关学习，在跟着网课学习爬虫的过程遇到了一些问题

问题相关代码，请勿粘贴截图

def get_text(url):...if
    r = requests.get(url)
    r.encoding = 'utf-8'
    contents_All = etree.HTML(r.text)
    contents_title = contents_All.xpath('//*[@id="wrapper"]/div[4]/div[1]/div[2]/h1/text()')
    contents_word = contents_All.xpath('//*[@id="content"]/text()')
    with open(path + contents_title[0]+'.txt', "w", encoding="utf-8") as f:
        f.write(contents_word)
    print(contents_title[0], "下载成功")
    time.sleep(2)

if __name__ == '__main__':
    for url in contents_list:
        get_text(url)

运行结果及报错内容

结果：

Traceback (most recent call last):
  File "D:\pythonProject\爬虫\爬取小说\xpath.py", line 50, in <module>
    get_text(url)
  File "D:\pythonProject\爬虫\爬取小说\xpath.py", line 42, in get_text
    with open(path + contents_title[0]+'.txt', "w", encoding="utf-8") as f:
IndexError: list index out of range

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

陈年椰子 2022-01-24 15:00

关注

应该是 contents_title 没匹配上
检查下你的xpath

def get_text(url):...if
    r = requests.get(url)
    r.encoding = 'utf-8'
    contents_All = etree.HTML(r.text)
    contents_title = contents_All.xpath('//*[@id="wrapper"]/div[4]/div[1]/div[2]/h1/text()')
    if len(contents_title)==1: 
        contents_word = contents_All.xpath('//*[@id="content"]/text()')
        with open(path + contents_title[0]+'.txt', "w", encoding="utf-8") as f:
            f.write(contents_word)
        print(contents_title[0], "下载成功")
    else:
        print("没找到标题，下载失败")
    time.sleep(2)

报告相同问题？

关注问题

当爬取网页没有局部数据导致超出索引 python 爬虫
2022-04-27 11:41

回答 3 已采纳可以试着捕获IndexError，在date_list.append(date[i]),抛出异常date_list.append(None)
刚看书学了python的爬虫，在爬取网页的时候遇到了“超出索引范围的问题”，该怎么解决 list python
2021-01-11 10:40

回答 3 已采纳有输出，就是你后面使用的时候索引超出改列表上限了
Python列表索引超出范围该怎么办 python
2023-01-02 09:43

回答 1 已采纳可以使用 try-except 语句来处理这种情况。如下代码： try: lat = result_df.loc[result_df.index == 22271]['SLat'].tolis
python爬虫索引超出范围_python爬虫（一）入门常见错误集合
2021-01-14 00:56

张献忠的博客 indexerror: list index out of range索引错误：列表超出索引范围（检查列表是否为空） 5. typeerror: must be str, not int类型错误：数据不是正确的数据类型，比如字符串和数字直接拼接（检查数据类型） 6. ...
python while循环中，列表报错超出索引范围 python
2021-09-25 16:17

回答 2 已采纳测试程序运行正常，没有出现索引越界问题啊，输出了第一次找到了55.
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
列表超出索引范围怎么解决 python 有问必答
2021-06-09 11:05

回答 4 已采纳问题出在allUniv这个嵌套列表中，在对soup进行解析表格时有空行，导致allUniv中的第一个列表的值为None，所以在使用索引时会报越界错误。从allUniv的下标1开始取数就能解决问题，函数
python爬取别人qq空间相册_Python_小林的爬取QQ空间相册图片链接程序
2020-11-20 21:01

weixin_39899244的博客设置准备登录的QQ号码【与Cookies对应】设置将准备的爬取对象QQ号码设置好抓取的cookies设置好time_sleep的时间【安全性考虑[过快会导致远程主机中断连接，然后出些奇怪的异常。]】在新的脚本里，你将通过Input输入...
杨辉三角形，最后语句超出索引范围 python
2022-11-25 12:35

回答 3 已采纳 y取值最大值为长度减去1，那么y+1就等于a的长度，作为下标就越界了。因为下标范围是0-长度减去1
python列表超出范围 python
2022-07-10 21:56

回答 4 已采纳 b里只有一个1，也就是只有b[0]，值为1，根本没有b[m]这种东西如果你只需要一个变量，那么把括号去了，直接b+=1如果你确实需要一个list，那么初始化的时候应该b=[1 for x in ran
python列表索引范围 list python
2022-07-01 07:53

回答 4 已采纳 0 ~ len(ls)-1
python返回索引值_python取索引值
2020-11-29 14:11

weixin_39617215的博客数据的一些细微区别num = num1 = num # 输出：10 type:intnum2 = num# 输出： type:list总结：分片包括起始索引对应的元素，但不包括终止索引对应的元素，索引为正值时可以发生越界但只会取到最后一个元素。...
matlab 索引超出数组范围 matlab
2018-09-10 14:11

回答 2 已采纳 vol0是32001*1的cell数组，列数为1，即col = 1，那么，j 从3开始肯定就会超出列长，程序运行到 for j = 3:col 就报错了另外，为什么用 vol0{i}{j} 索引？这个
使用python爬取豆瓣电影top250的数据
2023-11-07 14:00

提醒一下哟的博客本篇文章主要讲解如何爬取豆瓣电影top250中的数据。爬取豆瓣top250比较适合初学者用于练习和熟悉爬虫技能知识的简单实战项目，通过这个项目，可以让小白对爬虫有一个初步认识和了解。那么就让我们开始吧！爬虫...
python爬取今日头条街拍_python小白爬取分析今日头条街拍美图中获取Json数据列表超出范围问题...
2020-12-05 21:03

weixin_39883433的博客 [Python] 纯文本查看复制代码import jsonimport reimport requestsfrom requests.exceptions import RequestExceptionfrom urllib.parse import urlencodefrom bs4 import BeautifulSoupdef get_page_index(offset,...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月24日

悬赏问题

¥15 使用C#，asp.net读取Excel文件并保存到Oracle数据库
¥15 C# datagridview 单元格显示进度及值
¥15 thinkphp6配合social login单点登录问题
¥15 HFSS 中的 H 场图与 MATLAB 中绘制的 B1 场部分对应不上
¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配

爬取小说时超出索引范围

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新