为什么出现list index out of range

想要爬取164页每页10条新闻，并把爬取到的信息存到exel文档。
一开始没补充getdata方法中的内容，只打印datalist可以输出

问题相关代码

from bs4 import BeautifulSoup #网页解析,获取数据
import urllib.request,urllib.error
import  re
import xlwt

def main():
    baseurl="https://www.dailynews.lk/search/node/China%20%20COVID-19?page=0"
    datalist=getData(baseurl)
    savepath="BBC中国疫情.xls"
    saveData(datalist,savepath)
    #askURL("https://www.dailynews.lk/search/node/China%20%20COVID-19?page=")
    getData()

#新闻详情链接的规则
findLink=re.compile(r'<a href="(.*?)">')#创建正则表达式对象，表示规则（字符串的模式）r表示忽视特殊符号
#新闻时间
findDate=re.compile(r'<p class="search-info"><span about="/users/.*" class="username" datatype="" property="foaf:name" typeof="sioc:UserAccount" xml:lang="">.*</span> - (.*?) - .*</p>')

#爬取网页
def getData(baseurl):
    datalist=[]
    for i in range(0,164):
        url=baseurl+str(i*10)
        html=askURL(url)#保存获取的网页源码
        #逐一解析
        soup=BeautifulSoup(html,"html.parser")
        for item in soup.find_all("li",class_="search-result"): #查找符合要求的字符串，形成列表
            #print(item)
            data=[]#保存一条新闻的信息
            item= str(item)
            #获取新闻详情链接
            link=re.findall(findLink,item)[0]
            data.append(link)
            #新闻日期
            date=re.findall(findDate,item)[0]
            date=re.sub('-',' ',date) #替换“-”
            data.append(date)

            datalist.append(data) #把信息放入datalist

    return datalist



#得到指定url的网页内容
def askURL(url):
    #模拟头部信息
    head={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.46"}
    #用户代理（告诉浏览器可以接受什么水平的文件内容）

    request=urllib.request.Request(url,headers=head)
    html=""
    try:
        respose=urllib.request.urlopen(request)
        html=respose.read().decode("utf-8")
        #print(html)
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)
    return html



#保存数据
def saveData(datalist,savepath):
    news = xlwt.Workbook(encoding="utf-8")  # 创建book对象
    sheet = news.add_sheet('BBC中国疫情')  # 创建工作表
    col = ("新闻详情链接", "新闻发布日期")
    for i in range(0, 2):
        sheet.write(0, i, col[i])  # 列名
    for i in range(0, 1640):
        print("第%d条" % i)
        data = datalist[i]
        for j in range(0, 2):
            sheet.write(i + 1, j, data[j])
    news.save(savepath)  # save
    


if __name__ == '__main__':
    main()

运行结果及报错内容

结果没有exel文档生成

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
～白+黑 Python领域新星创作者 2022-04-06 18:39
关注
for i in range(0, 1640):越界了for i in range(len(datalist))吧
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

图表画不出来，出现list index out of range python
2022-06-09 16:12

回答 1 已采纳因为正则式没有找到内容。你的正则式里必须要匹配小数点，但是如果播放量没有小数点，就找不到了，自然也就报错了 b= re.findall(r'\d+[.]\d+',t['播放量'])[0]
出现list index out of range错误如何解决？ python
2019-10-31 09:34

回答 2 已采纳 L1 数组值先打印一下，直接用L1[1],L1[2] 下标 1、2 超长说明 L1 的长度可能不是3.
运行出现list index out of range 怎么办 python
2022-10-24 09:37

回答 4 已采纳你的程序是怎么运行的？看你的程序，正常运行的样子应该是：python xxx.py 数字，如： > python test.py 123 看你的报错，是不是没有给出数字参数。望采纳。
YOLOv7 训练报错 IndexError: list index out of range
2022-07-18 13:53

Mr Dinosaur的博客解决YOLOv7中的报错：IndexError : list index out of range
index error：list index out of range的原因 python
2021-11-16 16:16

回答 2 已采纳 new列表就一个元素 []，空列表中怎么索引？
这里为什么会list index out of range？？😭😭 python
2022-04-25 15:06

回答 2 已采纳数组越界了，比如a=[1,2,3] ，如果取a[5]就越界错误了for k in range(1,len(a)+1)改成for k in range(1,len(a))即可望采纳！谢谢
xlrd模块取单元格值的时候报错“list index out of range” python
2022-07-26 18:19

回答 1 已采纳是不是有合并的行，合并的行也算行
SambertHifigan模型训练训练出错-list index out of range
2024-01-15 14:51

runing_an_min的博客模型的地址是 SambertHifigan个性化语音合成-中文-预训练-16k 错误描述如上图，在运行训练命令（train.py）的时候，会出现这个错误，错误解决上面这个错误并不是train.py的问题，是上一步骤 auto_label.py的问题...
python IndexError: list index out of range python 有问必答
2021-06-01 23:24

回答 4 已采纳代码没问题，应该是你输入格式不对，要分三行输入，每行三个数 split()默认是用空格分割字符串的每行三个数之间要加了一个空格。不是逗号。
python爬取中出现IndexError: list index out of range的错误 python
2021-03-20 21:22

回答 1 已采纳只能证明一个问题，就是re.findall(findLink,item)这个for循环中，肯定至少有一个取到的是空列表[]
python提示list index out of range python
2022-04-19 15:47

回答 2 已采纳 p[i] = 1这块就应该出问题了，你的p是一个空的list 啊
list index out of range：在TensorFlow设置GPU运行时报错
2022-05-10 12:00

大雾的小屋的博客在设置TensorFlow设置GPU运行时报错：`list index out of range`。遇到此类问题比较多的主要是使用的TensorFlow2.X以上版本的项目。我们需要将系统环境设置为CPU进行运行。
IndexError: list index out of range list python
2021-08-27 14:31

回答 3 已采纳你查下 from sklearn.svm import SVC svclf = SVC(kernel = 'linear') svclf.fit(x_train,y_train) preds = sv
MindSpore数据集加载-【IndexError: list index out of range】错误
2023-02-20 17:03

skytier的博客外部可以直接使用index来进行数据的访问，外部不需要对其进行修改（如：每个迭代开始前的复位操作），而用代码第35行户另外自定义了__index，需要用户在每个迭代前进行复位操作，来保证不出现数组越界访问。...
python index out of range_list index out of range
2020-11-29 05:09

weixin_39620001的博客 username=input('请输入您的注册用户名：')password=input('请输入您的注册密码：')with open('list_of_info',mode='w',encoding='utf-8') as f:f.write('{}\n{}'.format(username,password))print('...of_info',mo...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月6日
展开全部

悬赏问题

¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错
¥15 这个主板怎么能扩出一两个sata口
¥15 不是，这到底错哪儿了😭
¥15 2020长安杯与连接网探
¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么

为什么出现list index out of range

问题相关代码

运行结果及报错内容

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新