爬取网页内容，显示错误: IndexError: list index out of range

用requests库和bs4库爬取并解析网页内容
显示错误为: IndexError: list index out of range
代码如下:

(url链接因版权问题就没有上传)

import requests

from bs4 import BeautifulSoup

import bs4


def getHTMLText(url):
    """获得url链接对应的html文本"""
    try:
        kv = {"user-agent":"Mozilla/5.0"}
        print("*")
        r = requests.get(url, headers=kv)
        #timeout 超时异常
        print("*")
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""
    #return ""

def fillUnivList(ulist, html):
    """获得并解析html文本，存储到一个列表中"""
    soup = BeautifulSoup(html, "html.parser")
    #uvs = soup.find("body")#返回一个字符串类型
    #s = soup.find("body")
    #print(s[:100])
    #l = soup.find_all("th")
    #print(l[:2])
    for tr in soup.find("th").children:
        #.children()方法以列表形式返回标签的所有子标签
        if isinstance(tr, bs4.element.Tag):
            #确保tr为标签类型
            tds = tr.find_all("td")
           # print("403")
            ulist.append([tds[0].string, tds[1].string, tds[2].string])
        else:
            print("403")
    #pass

def printUnivList(ulist, num):
    """表示将ulist的信息打印出来
       num表示打印元素的个数
    """
    print("{:<10}{:<10}{:<10}".format("排名","学校名称","总分"))
    for i in range(num):
        one_dim = ulist[i]
        print("{:<10}{:<10}{:<10}".format(one_dim[0],one_dim[1],one_dim[2]))
        

def main():
    uinfo = []
    url = "https://www.shanghairanking.cn/rankings/bcur/202211"#软科链接
    text = getHTMLText(url)
    #print(text[0])
    #print("403")
    fillUnivList(uinfo, text)
    #print("403")
    n = input("the number of Univ\n")
    #n为字符串类型
    printUnivList(uinfo, eval(n))
main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-天际的海浪 2022-05-06 22:35
关注
list index out of range是列表下标越界了
看看出错的是那一行.输出下这一行中访问了下标元素的列表，看看是不是空列表[]。
如果你错误没有显示,一直没有内容，是连input("the nummber of Univ")的输出也没有吗?
是不是文件修改后没有保存,执行的文件不是你编辑的文件
可能是代码中有语法错误,把你最新的完整代码用代码段</>的文本形式发一下，我调试下看看，你发图片我们没办法调试和修改。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

爬取网页内容，显示错误: IndexError: list index out of range python 有问必答
2022-05-06 20:44

回答 4 已采纳 list index out of range是列表下标越界了看看出错的是那一行.输出下这一行中访问了下标元素的列表，看看是不是空列表[]。如果你错误没有显示,一直没有内容，是连input("the
python爬取证监会行政监管措施遭遇 IndexError: list index out of range python 有问必答爬虫
2022-01-25 13:06

回答 3 已采纳 http://www.csrc.gov.cn/searchList/58959eb1bd68458088cac63f46a5fa40?_isAgg=true&_isJson=true&_pageSiz
python爬取中出现IndexError: list index out of range的错误 python
2021-03-20 21:22

回答 1 已采纳只能证明一个问题，就是re.findall(findLink,item)这个for循环中，肯定至少有一个取到的是空列表[]
python报错：IndexError: list assignment index out of range
2023-02-27 00:23

frankyaixu的博客索引错误：列表分配索引超出范围 IndexError: list assignment index out of range
python运行问题IndexError: tuple index out of range python 有问必答
2022-03-18 17:09

回答 3 已采纳 data1.append((start_num[i], end_num[i], data[i][75]))中data[i][75]是取每行的第76个字段, 你数据库中有76个字段吗没有就是tuple
#python#抛错：IndexError: list index out of range python
2021-11-14 21:24

回答 2 已采纳行吧我已经弃坑了
python IndexError: list index out of range python 有问必答
2021-06-01 23:24

回答 4 已采纳代码没问题，应该是你输入格式不对，要分三行输入，每行三个数 split()默认是用空格分割字符串的每行三个数之间要加了一个空格。不是逗号。
Python报错及解决：IndexError: list index out of range
2023-02-20 13:18

Freyaah的博客 Python报错及解决：IndexError: list index out of range
爬虫学习时错误IndexError: list index out of range（列表索引超出范围） python 有问必答
2021-10-01 17:23

回答 1 已采纳去掉break。。要不for下面的append不生效。。而且item是node，需要转为字符串，取消注释item = str(item) 改完上面2步骤后可以了，正常采集有帮助麻烦点个采纳【本回
爬虫时显示报错：IndexError: list index out of range python 爬虫
2022-11-19 19:13

回答 2 已采纳这一行：for tr in soup.find('body').children: 中的 'body' 改为 'tbody'.
报错：sys.argv[1] IndexError: list index out of range？ python 人工智能机器学习深度学习
2019-05-26 18:57

回答 1 已采纳你运行的时候有没有带上参数，并且这个参数应该是你的文件夹的路径
python IndexError: list assignment index out of range
2022-10-06 00:00

一只菜得不行的鸟的博客 python报错：IndexError: list assignment index out of range。
python list IndexError: pop index out of range python
2022-10-25 17:05

回答 8 已采纳报错的原因是pop(alist[i+1])里alist[i+1]为4，但是pop(4)没有这个索引。抛开这个错误不谈，逻辑好像也有点问题，即使能交换位置，也会陷入死循环，你再检查一下？
python中报错：IndexError: list assignment index out of range
2020-09-21 19:28

Robin_思源的博客在使用空数组赋值时遇到了：IndexError: list assignment index out of range ** 解决方法如下：需要在赋值前先扩展空间，可以用那个较长的变量去扩展，如 write_table = [] write_table = [0]*len(key_col) write...
python爬虫“indexerror: list index out of range”错误及其解决办法
2023-06-08 07:00

木木em哈哈的博客 python列表为空的原因导致索引错误，继而导致找不到索引不要图省事，至少在报错的时候最好用最基础的方法试一遍。
python: IndexError: list assignment index out of range
2019-02-18 13:30

INNER PEACE M的博客 python处理数组的时候，报错：IndexError: list assignment index out of range 有两种原因：定义的数组边界过小，真的是出界了；定义的空数组按照下标赋值就会报错； s = list() s[0] = 0 # IndexError: list ...
python list assignment index_Python_报错：IndexError: list assignment index out of range
2021-03-05 11:32

烛煌的博客报错：IndexError: list assignment index out of range原因：split()写法转成列表就会认作一个整体,结果会是一个整体(示例：['gg111ggggggg222'])，不是预期结果上源码：def func(n,target_str):with open("1003....
报错：IndexError: list index out of range
2022-11-25 19:52

RaptorWE的博客一般是指最大下标超出索引范围循环时定义列表长度-1 （5个元素只循环了4个下标，此时即便下面代码下标+1 列表中也可容纳） len(list2)-1 为防止索引超出边界时使用 list2=[1,2,3,4,5] for i in range(len(list2)-...
【Python爬虫】报错解决：IndexError: list index out of range
2021-12-12 14:54

mafumafu2018的博客 00.背景在爬取某招聘网站的时候，试图用request获得url的文本，然后用正则表达式匹配相关信息，但是！人家变成动态页面，无法再用普通的静态页面的方法去获取。 01.报错问题 ...IndexError: list ind...
IndexError: list index out of range 错误原理及解决方法（python）
2020-09-14 15:44

于科技人文间徘徊的博客 list index out of range 解决思路发现问题当我在写文章金融数据分析（一）python预热中的项目二：计算手机销量年增长率的时候，出现过如下报错： ...IndexError: list index out of range 查找原因经过
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 5月6日
展开全部

悬赏问题

¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 关于大棚监测的pcb板设计
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器
¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)

爬取网页内容，显示错误: IndexError: list index out of range

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新