索引超出范围，教程代码正确的


import requests
import re
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl.styles import Alignment #文字对齐方式


def top250():
    wb = Workbook() #得到一个全新的workbook
    ws=wb['Sheet'] #通过sheet名字获取到sheet
    num=0
    num1=0
    lst=[]
    name_lst=[]
    dy_lst=[]
    zy_lst=[]
    time_lst=[]
    country_lst = []
    leixing_lst = []
    pj_lst = []
    people_lst = []
    quote_lst = []
    headers = {
        "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36 Edg/81.0.416.68",
    }
    while num <= 225:
        url='https://movie.douban.com/top250?start='+str(num)+'&filter='
        with requests.get(url=url,headers=headers) as r:  #分段下载
            if r.status_code==200:
                r.encoding=r.apparent_encoding #编码
                soup=BeautifulSoup(r.text,'html.parser') #解析方法
                ol=soup.find('ol')
                li=ol.find_all('li')
                for i in li:
                    name=i.find('span').text
                    p = i.find('p')
                    p = str(p).split('<br/>', 1)
                    fst = p[0].split('>', 1)[1]
                    sec = p[1].split('<', 1)[0]
                    daoyan = fst.split('主', 1)[0]
                    daoyan = daoyan.replace('导演:', '')
                    daoyan = daoyan.replace('\xa0', '')
                    daoyan = daoyan.replace('\n ', '')
                    try:
                        zhuyan=fst.split('主演:',1)[1]
                    except:
                        zhuyan=''
                    time=sec.split('/',2)[0]
                    time=time.replace('\xa0','')
                    time = time.replace('\n ', '')
                    time=re.findall(r'\d{4}',time)[-1]
                    country=sec.split('\xa0/\xa0',2)[1]
                    country=country.replace('/xa0','')
                    type=sec.split('\xa0/\xa0',2)[2]
                    type=type.replace('\xa0','')
                    type = type.replace('\n', '')
                    star=i.find('div',attrs={'class': "star"})
                    span=star.find_all('span')
                    pingjia=span[1].text
                    people=span[3].text.split('评价',1)[0]
                    try:
                        quote=i.find('p',attrs={'class': "quote"}).text
                        quote=quote.replace('\n','')
                    except:
                        quote=''
                        name_lst.append(name)
                        dy_lst.append(daoyan)
                        zy_lst.append(zhuyan)
                        time_lst.append(time)
                        country_lst.append(country)
                        leixing_lst.append(type)
                        pj_lst.append(pingjia)
                        people_lst.append(people)
                        quote_lst.append(quote)
                num1+=1
                print('第{}页爬取完毕！'.format(num1))
                if num==225:

                    print('爬取结束，开始写入excel。。。')
                    paiming = list(range(1, 251))
                    lst.append(paiming)
                    lst.append(name_lst)
                    lst.append(dy_lst)
                    lst.append(zy_lst)
                    lst.append(time_lst)
                    lst.append(country_lst)
                    lst.append(leixing_lst)
                    lst.append(pj_lst)
                    lst.append(people_lst)
                    lst.append(quote_lst)
                    head=['排名', '电影名称', '导演', '主演', '年份', '地区', '类型', '评分', '评价人数', '一句简介']
                    ws.append(head)
                    for i in range(len(lst[0])):

                        for j in range(len(lst[0])):
                            ws.cell(j + 2, i + 1).value = lst[i][j]
                    print('写入excel完成！')
                    for cell in ws['1']:
                        cell.alignment=Alignment(horizontal='center',vertical='center') #横向居中，纵向居中
                    for cell in ws['A']:
                        cell.alignment = Alignment(horizontal='center', vertical='center')
                    for cell in ws['B']:
                        cell.alignment = Alignment(horizontal='center', vertical='center')
                    for cell in ws['E']:
                        cell.alignment = Alignment(horizontal='center', vertical='center')
                    for cell in ws['H']:
                        cell.alignment = Alignment(horizontal='center', vertical='center')
                    for cell in ws['I']:
                        cell.alignment = Alignment(horizontal='center', vertical='center')

                    ws.column_dimensions['B'].width=25
                    ws.column_dimensions['I'].width = 13
                    wb.save('豆瓣电影top250.xlsx')
                num+=25
            else:
                print('失败！')

if __name__=='__main__':
    print('开始爬取！')
    top250()

请问这个怎么调试啊，请你们上传下调试截图

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
快乐小土狗 2022-07-20 22:28
关注
你的变量i值

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

索引超出范围，教程代码正确的 python 问答团队
2022-07-20 21:39

回答 1 已采纳你的变量i值
我在运行以下代码时出现索引超出范围错误
2018-01-06 14:25

回答 4 已采纳 copy_numbers is of size 0, just as you initialized it. If I add the following before your first f
matlab 索引超出数组范围 matlab
2018-09-10 14:11

回答 2 已采纳 vol0是32001*1的cell数组，列数为1，即col = 1，那么，j 从3开始肯定就会超出列长，程序运行到 for j = 3:col 就报错了另外，为什么用 vol0{i}{j} 索引？这个
C++教程(最全)
2020-03-04 15:21

嗨，人的博客 C++ 是区分大小写的编程语言。 4 数据类型 4.1基本数据类型七种基本的C++数据类型：bool、char、int、float、double、void、wchar_t 类型修饰符：signed、unsigned、short、long 注：一些基本类型可以使用一个或多...
Python列表索引超出范围该怎么办 python
2023-01-02 09:43

回答 1 已采纳可以使用 try-except 语句来处理这种情况。如下代码： try: lat = result_df.loc[result_df.index == 22271]['SLat'].tolis
golang：如何处理索引超出范围错误？
2016-05-12 18:52

回答 1 已采纳 Your problem relies in this line: if len(os.Args) == 0 You are checking for the first argument
indexerror:列表索引超出范围 python 爬虫
2022-03-12 20:47

回答 1 已采纳说明你的re.findall返回的是个空列表,并没有匹配到值
Python tkinter(GUI编程)模块最完整教程（上）
2022-07-13 17:38

Python-ZZY的博客 tkinter是一个GUI开发模块，初使用Tcl语言编写，可以在大部分操作系统上运行。tkinter非常的简单而且好用。tkinter模块时自带的Python模块，如果在安装Python的时候勾选了Tk/Tcl这个选项，那么使用tkinter不会有任何...
超出索引范围是为什么 matlab
2022-07-18 22:16

回答 3 已采纳第325行加一句 disp(i) %或直接敲个i disp(j) %或直接敲个j打印查看j当前值如果j超出19999，即使是20000也是超出范围，dqx是10行19999列，同理如果i＞10也是
紧急：运行时错误：索引超出范围
2016-05-22 02:11

回答 1 已采纳 [...]int{1,2,3} is not a slice. It is an array of capacity 3. See "golang-101-hacks: Array" If yo
尝试写入文件时索引超出范围
2018-02-14 04:22

回答 1 已采纳 The problem seems to be coming from these two lines inside your ingest function: n := strings.Tri
【Go语言入门教程】Go语言基本语法
2022-02-08 19:23

小熊coder的博客文章目录Go语言变量的声明（使用var关键字）标准格式批量格式简短格式Go语言变量的初始化回顾C语言变量初始化的标准格式编译器推导类型的格式短变量声明并初始化Go语言多个变量同时赋值Go语言匿名变量（没有名字的...
System.ArgumentOutOfRangeException:“索引超出范围。必须为非负值并小于集合大小。 c# 有问必答
2021-10-26 10:01

回答 3 已采纳客户端没有发送文件，如表单少了**enctype="multipart/form-data"**这属性，这样文件不会发送到服务器端，Files集合没有文件导致出错。服务器端最好判断下有文件后再获取
13 万字 C 语言从入门到精通保姆级教程2021 年版
2021-06-07 13:15

扣叮侠的博客 13 万字C语言保姆级教程，从入门到精通。
编程（代码、软件）规范（适用嵌入式、单片机、上位机等）
2022-05-18 23:21

匠在江湖的博客本编程规范是个人工作十几年来，近些年形成较为稳定的版本，已被工作的公司采纳为公司编程规范！本规范主要借鉴了一些大公司（华为，百度，腾讯，阿里巴巴，谷歌，苹果，微软，ARM，ST.....）的编程规范和风格，吸收...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月20日
展开全部

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

索引超出范围，教程代码正确的

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新