关于#python#的问题，请各位专家解答！


from bs4 import BeautifulSoup  # 网页分析，获取数据
import re  # 正则表达式，进行文字匹配
import urllib.request, urllib.error  # 制定URL,获取网页数据
import xlwt  # 进行excel操作
import sqlite3  # 进行SQLite数据库操作


def main():
    baseurl = "https://movie.douban.com/top250?start="
    # 1.爬取网页
    datalist = getData(baseurl)
    # 2.解析数据

    savepath = ".\\豆瓣电影top250.xls"  # 保存路径
    # 3.保存数据
    # saveData(savepath)

    # askURL("https://movie.douban.com/top250?start=")


# 影片详情链接的规则
findLink = re.compile(r'')  # 创建正则表达式对象，表示规则（字符串的模式）r：忽略特殊符号，如/，//
# 影片图片规则
findImgSrc = re.compile(r'<img.*src="(.*?)"', re.S)
# 影片片名
findTitle = re.compile(r'(.*?)')
# 影片评分
findRating = re.compile(r'(.*)')
# 评价人数
findJudge = re.compile(r'(/d*)人评价')
# 概况
findInq = re.compile(r'(.*)')
# 影片相关内容
findBD = re.compile(r'(.*?)
', re.S)


# 1.爬取网页
def getData(baseurl):
    datalist = []
    for i in range(0, 10):  # 调用获取页面信息的函数，10次
        url = baseurl + str(i * 25)
        html = askURL(url)  # 保存获取的网页源码
        # 2.逐一解析数据
        soup = BeautifulSoup(html, 'html.parser')
        for item in soup.find_all('div', class_="item"):
            # print(item)
            data = []  # 保存一部电影的所有信息
            item = str(item)
            
            # 获取影片详情链接
            link = re.findall(findLink, item)[0]
            data.append(link)
            # print(link)  #测试

            ImgSrc = re.findall(findImgSrc, item)[0]
            data.append(ImgSrc)

            Titles = re.findall(findTitle, item)
            if (len(Titles) == 2):
                ctitle = Titles[0]
                data.append(ctitle)
                otitle = Titles[1].replace('/', '')
                data.append(otitle)@@
            else:
                data.append(Titles[0])
                data.append(' ')

            rating = re.findall(findRating, item)[0]
            data.append(rating)


           ** Judge = re.findall(findJudge, item)[0]**
            data.append(Judge)

            inq = re.findall(findInq, item)
            data.append(inq)
            if len(inq) != 0:
                inq = inq[0].replace('。', '')
                data.append(inq)
            else:
                data.append(' ')

            BD = re.findall(findBD, item)[0]
            BD = re.sub('<br(\s+)?/>(\s+)?', " ", BD)
            BD = re.sub('/', ' ', BD)
            data.append(BD.strip())

错误：

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
allyfireshen 2023-03-01 23:01
关注
应该是Judge = re.findall(findJudge, item)[0]中正则匹配re.findall(findJudge, item)结果是空列表，用[0]读取的时候提示索引越界了。可修改如下：

Judge = re.findall(findJudge, item) if len(Judge) > 0: data.append(Judge[0])
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

关于#python#的问题，请各位专家解答！ python 有问必答
2023-04-17 23:48

回答 3 已采纳把代码复制贴出来，截图怎么调试你的代码。
一万字一篇文20分钟学会C语言和Python，十四年编程经验老鸟传授经验之道
2021-04-14 01:08

1_bit的博客昨天在直播中有粉丝问我如何快速的对编程语言入门，我想这个问题是有必要让大家知道的，相必也有很多新手对于如何快速完成编程语言的入门学习很感兴趣，本篇文将会使用 C 语言以及 Python 为例，做出对比，让大家对...
《Python全栈系列教程》目录
2022-05-12 09:30

孤寒者的博客《Python全栈基础教程》目录导读：一、Python基础部分；二、Python常用模块部分；三、Python实战部分；四、Python习题部分。
2021年十大热门编程语言
2021-05-17 01:27

前端瓶子君的博客点击上方前端瓶子君，关注公众号回复算法，加入前端编程面试算法每日一题群来源：bigo大魔王https://juejin.cn/post/6932278515714752525前言编程已成...
2024年Python最全这十个Python常用库，学习Python的你必须要知道！
2024-05-01 04:46

2401_84563465的博客这些工具的用途非常广泛，简化了从文件系统访问、数据库编程、云服务到构建轻量级web应用程序、创建gui、图像...有些库是众所周知的，有些则不太为人所知，但是所有这些Python库都应该在各位的工具箱中占有一席之地。
豆瓣工程师为你解答关于 Python3 编程方面的问题
2016-10-12 07:51

weixin_34366546的博客 2019独角兽企业重金招聘Python工程师标准>>> ...
《Python3网络爬虫开发实战（第二版）》上市了！！！！
2021-11-29 12:00

风度78的博客 “阅读本文大概需要 5 分钟。”告诉大家一个好消息：我的好朋友崔庆才老师的《Python3网络爬虫开发实战（第二版）》现在正式上市了！！！！没错，就是这本：就是那个《Python3网络...
Go专栏“改善Go语言编程质量的50个有效实践”上线了
2020-09-09 08:30

Tony Bai的博客断断续续写了一年多的Go专栏：《改善Go语言编程质量的50个有效实践》今天终于正式上线了！- https://www.imooc.com/read/87慕课专栏：《改善Go语言编程质量的...
《Python3网络爬虫开发实战（第二版）》今天正式上市了！！！！
2021-11-26 12:32

VIP_CQCRE的博客 “ 阅读本文大概需要 5 分钟。 ”大家好！我是崔庆才。今天告诉大家一个好消息：《Python3网络爬虫开发实战（第二版）》今天正式上市了！！！！没错，就是这本：2018 年 5 月我的《...
python编程软件怎么下载
2024-06-25 17:21

obvo0607111的博客刚开始接触编程语言的时候，我也在困扰这个问题，Java和Python该如何选择呢？到底哪个才是最适合我的？后来经过长时间的深入了解，终于有了一个比较客观的认识，今天就聊一聊这个话题，如果你也有这方面的困扰，不妨...
5本豆瓣高分Python技术书籍
2024-04-23 17:39

七七Seven～的博客分别是：《Python学习手册》，豆瓣8.2分《Python编程，从入门到实践》，豆瓣9.3分《Python Cookbook》，豆瓣9.2分《流畅的Python》，豆瓣9.4分《Python标准库》，豆瓣8.4分这五本书，有三个共同特质，首先都是Python...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 3月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月1日

悬赏问题

¥15 latex投稿显示click download
¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？

关于#python#的问题，请各位专家解答！

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新