为什么出现list index out of range

想要爬取164页每页10条新闻，并把爬取到的信息存到exel文档。
一开始没补充getdata方法中的内容，只打印datalist可以输出

问题相关代码

from bs4 import BeautifulSoup #网页解析,获取数据
import urllib.request,urllib.error
import  re
import xlwt

def main():
    baseurl="https://www.dailynews.lk/search/node/China%20%20COVID-19?page=0"
    datalist=getData(baseurl)
    savepath="BBC中国疫情.xls"
    saveData(datalist,savepath)
    #askURL("https://www.dailynews.lk/search/node/China%20%20COVID-19?page=")
    getData()

#新闻详情链接的规则
findLink=re.compile(r'<a href="(.*?)">')#创建正则表达式对象，表示规则（字符串的模式）r表示忽视特殊符号
#新闻时间
findDate=re.compile(r'<p class="search-info"><span about="/users/.*" class="username" datatype="" property="foaf:name" typeof="sioc:UserAccount" xml:lang="">.*</span> - (.*?) - .*</p>')

#爬取网页
def getData(baseurl):
    datalist=[]
    for i in range(0,164):
        url=baseurl+str(i*10)
        html=askURL(url)#保存获取的网页源码
        #逐一解析
        soup=BeautifulSoup(html,"html.parser")
        for item in soup.find_all("li",class_="search-result"): #查找符合要求的字符串，形成列表
            #print(item)
            data=[]#保存一条新闻的信息
            item= str(item)
            #获取新闻详情链接
            link=re.findall(findLink,item)[0]
            data.append(link)
            #新闻日期
            date=re.findall(findDate,item)[0]
            date=re.sub('-',' ',date) #替换“-”
            data.append(date)

            datalist.append(data) #把信息放入datalist

    return datalist



#得到指定url的网页内容
def askURL(url):
    #模拟头部信息
    head={"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.46"}
    #用户代理（告诉浏览器可以接受什么水平的文件内容）

    request=urllib.request.Request(url,headers=head)
    html=""
    try:
        respose=urllib.request.urlopen(request)
        html=respose.read().decode("utf-8")
        #print(html)
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)
    return html



#保存数据
def saveData(datalist,savepath):
    news = xlwt.Workbook(encoding="utf-8")  # 创建book对象
    sheet = news.add_sheet('BBC中国疫情')  # 创建工作表
    col = ("新闻详情链接", "新闻发布日期")
    for i in range(0, 2):
        sheet.write(0, i, col[i])  # 列名
    for i in range(0, 1640):
        print("第%d条" % i)
        data = datalist[i]
        for j in range(0, 2):
            sheet.write(i + 1, j, data[j])
    news.save(savepath)  # save
    


if __name__ == '__main__':
    main()

运行结果及报错内容

结果没有exel文档生成

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
～白+黑新星创作者: python技术领域 2022-04-06 18:39
关注
for i in range(0, 1640):越界了for i in range(len(datalist))吧
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

IndexError: list index out of range
2024-07-27 15:00

Yan-英杰的博客 IndexError: list index out of range
【Python】成功解决IndexError: list index out of range
2024-03-10 10:19

高斯小哥的博客【Python】告别“IndexError: list index out of range” 你是否曾被Python中的“IndexError: list index out of range”错误困扰？别担心，本文为你揭秘其背后原因，并提供三种高效解决方案：检查索引值、使用循环...
【Python】已解决：IndexError: list index out of range
2024-06-30 19:31

屿小夏的博客在Python编程中，IndexError: list index out of range 是一个常见的错误。通过遵循上述注意事项和示例代码，读者可以轻松理解并解决IndexError: list index out of range错误，提高代码的健壮性和可靠性。然而，...
【Python】成功解决Python报错：IndexError: list index out of range
2024-05-30 10:07

I'mAlex的博客成功解决Python报错：IndexError: list index out of range。`IndexError: list index out of range` 错误表明，Python解释器在尝试访问列表中不存在的索引时遇到了问题。换句话说，代码中试图访问的索引超出了列表...
【Python报错已解决】IndexError: list index out of range
2024-09-24 13:49

鸽芷咕的博客然而，当我们尝试访问列表中不存在的索引时，就会遇到`IndexError: list index out of range`。这个错误表明我们尝试访问列表中的一个索引，但该索引超出了列表的范围。本文将探讨这个错误的原因，并给出几种可能的...
【python报错已解决】`IndexError: list index out of range`
2024-08-14 08:18

鸽芷咕的博客 `IndexError: list index out of range`这个报错通常发生在尝试访问一个列表中不存在的索引时。比如，如果你有一个长度为5的列表，却尝试访问索引为5的元素，就会抛出这个异常。
YOLOv7 训练报错 IndexError: list index out of range
2022-07-18 13:53

Mr Dinosaur的博客解决YOLOv7中的报错：IndexError : list index out of range
IndexError: list index out of range—列表索引超出范围的完美解决方法
2024-08-22 08:00

默语佬的博客即列表索引超出范围的问题。这种错误在处理列表或数组时经常发生，尤其是在你尝试访问列表中不存在的元素时。...由于列表的索引是从0开始的，所以my_list[5]超出了列表的最大索引（4），因此会引发IndexError。
SambertHifigan模型训练训练出错-list index out of range
2024-01-15 14:51

runing_an_min的博客模型的地址是 SambertHifigan个性化语音合成-中文-预训练-16k 错误描述如上图，在运行训练命令（train.py）的时候，会出现这个错误，错误解决上面这个错误并不是train.py的问题，是上一步骤 auto_label.py的问题...
lora微调dbgpt-hub，报list index out of range的错
2023-09-04 01:17

kzog的博客改lora.sh文件，里的model_path配置，为自己的模型文件。model需要用 qwen baichuan llma2。2. bitsandbytes不支持GPU了。安装window的 bitsandbytes。注意一下是绝对路径还是相对路径。使用nvcc -V查看。1.找不到...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 4月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月6日
展开全部

为什么出现list index out of range

问题相关代码

运行结果及报错内容

1条回答 默认 最新

问题事件

1条回答默认最新