使用正则表达式匹配豆瓣电影top250电影信息

部分源码如下

<ol class="grid_view">
        <li>
            <div class="item">
                <div class="pic">
                    <em class="">1</em>
                    <a href="https://movie.douban.com/subject/1292052/">
                        <img width="100" alt="肖申克的救赎" src="https://img2.doubanio.com/view/photo/s_ratio_poster/public/p480747492.webp" class="">
                    </a>
                </div>
                <div class="info">
                    <div class="hd">
                        <a href="https://movie.douban.com/subject/1292052/" class="">
                            <span class="title">肖申克的救赎</span>
                                    <span class="title">&nbsp;/&nbsp;The Shawshank Redemption</span>
                                <span class="other">&nbsp;/&nbsp;月黑高飞(港)  /  刺激1995(台)</span>
                        </a>


                            <span class="playable">[可播放]</span>
                    </div>
                    <div class="bd">
                        <p class="">
                            导演: 弗兰克·德拉邦特 Frank Darabont&nbsp;&nbsp;&nbsp;主演: 蒂姆·罗宾斯 Tim Robbins /...<br>
                            1994&nbsp;/&nbsp;美国&nbsp;/&nbsp;犯罪 剧情
                        </p>                        
                        <div class="star">
                                <span class="rating5-t"></span>
                                <span class="rating_num"property="v:average">9.7</span>
                                <span property="v:best" content="10.0"></span>
                                <span>2424702人评价</span>
                        </div>
                            <p class="quote">
                                <span class="inq">希望让人自由。</span>
                            </p>
                    </div>
                </div>
            </div>
        </li>

目标是使用re库编写一个能够匹配一个电影的名称，年份，评分的正则表达式，我将上面的代码保存为文件后，编写的程序如下

# coding:utf-8
import re
text=open('肖申克的救赎.html','r')
content=text.read()
print(len(content))
mode=re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<name>.*?)</span>.*?<p class="">.*?'
                r'<br>.*?(?P<year>/d+)&nbsp.*?<span class="rating_num" property="v:average">(?P<score>/s/S)</span>',re.S)

result=re.search(mode,content)
print(result.group('name'))
text.close()

但是运行结果是

请问问题在哪？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
李筱宝 2021-10-09 17:31
关注
result 是 nil 啊

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python利用re正则表达式抓取豆瓣电影Top250排行榜
2021-11-01 21:02

Wispertise的博客 Python利用re正则表达式抓取豆瓣电影Top250排行榜利用request和re来抓取电影排行榜的电影名称，电影年份，电影评分以及评价人数并写为.csv格式文件先来介绍一下re模块中的几个简单常用的方法 re模块几个简单...
Python中的正则表达式的使用—提取豆瓣电影信息
2023-09-28 10:00

code_lover_forever的博客正则表达式在文本处理，数据分析相关领域非常实用，掌握好它能帮助你节省大量重复的工作，本文帮助大家总结了正则表达式的概念和正则表达式在python中的应用~
使用Python_requests库和正则表达式技术实现豆瓣TOP250电影数据爬取_包含新建文件存储数据_下载电影封面图片_详细代码注释解析_正则表达式匹配规则详解_适合Pyth.zip
2025-08-05 12:39

本篇文档详细介绍了如何利用Python编程语言中的requests库和正则表达式技术，成功爬取豆瓣电影TOP250的数据。这个项目不仅涉及到网络请求的发送和接收，还包括数据的解析、存储和图片的下载等多个方面，是学习网络...
python使用正则表达式暴力爬取豆瓣电影top250并将爬取内容保存为本地CSV文件——从浏览器获取headers头信息
2021-09-10 21:21

词一丶的博客记录一下学习爬虫的代码案例代码出处 ...#拿到页面源代码 requests #通过re来提取想要的有效信息 re ...url = "https://movie.douban.com/top250" headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64.
利用Requests库和正则表达式爬取豆瓣影评Top250
2018-10-20 11:19

qq_38243583的博客本文章是利用python3.6和Requests库（需自行安装，cmd里运行pip install requests)以及正则表达式（其实利用正则表达式是比较麻烦的一种方式，但是正则表达式在很多语言都有应用，练习一下也是有好处的...
Python爬虫入门——2. 4 利用正则表达式爬取豆瓣电影 Top 250
2018-11-11 11:13

酸辣粉不要辣的博客现在我们利用上节刚刚学到的正则表达式来爬取豆瓣电影Top250的名单。这是豆瓣电影的连接https://movie.douban.com/top250。豆瓣电影每个页面只有25个数据，所以我们需要爬取10个页面的数据。首先我们观察一下...
利用正则表达式获取豆瓣TOP250电影的英文名、港台名、导演、主演、上映年份、电影分类以及评分
2021-10-11 23:29

look仔的博客唐松编《python网络爬虫从入门到实践》第47页3.4.3自我实践题全部代码为原创代码完整代码如下： import requests import re headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) Apple...
正则表达式提取豆瓣T250中的部分信息
2023-09-02 17:22

天生打工仔的博客 3：使用正则表达式提取有用信息。(compile,findall,research,finditer)2：发送请求（get/post），收到url的网页源代码或者网页数据。1：确定自己需要爬虫的内容在哪一个url中。大体的处理思路如上。
豆瓣电影Top250数据爬取与分析系统_使用Python编写_通过requests库发送HTTP请求_BeautifulSoup解析HTML页面_正则表达式匹配关键信息_自动翻页爬.zip
2025-08-04 23:16

本爬取与分析系统通过Python编程语言结合requests库、BeautifulSoup库以及正则表达式的使用，能够高效地从豆瓣电影网站抓取Top250电影的相关数据。这些数据对于研究电影市场趋势、观众喜好等方面具有重要的价值。 ...
06. 实战：Python正则法抓取某电影网Top250信息
2022-12-29 16:54

Vec_Kun的博客使用了re正则方法来爬取信息，进一步熟悉了此种爬虫方式，大家感兴趣的话也可以自己找找其他感兴趣的网页尝试爬取对应的信息。不过记得一定要适度，不要频繁访问导致ip被禁用~还要记得resp.close()来关闭请求端口，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月9日

使用正则表达式匹配豆瓣电影top250电影信息

1条回答 默认 最新

问题事件

1条回答默认最新