python 爬虫方面的问题求交一交。。

我的目的是爬取豆瓣电影排行榜中的电影名称，评分，多少人评价
这个是网页的源代码

这这下面是我写的代码

import requests
import re
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.3"
}
url ="https://movie.douban.com/chart"
indes=requests.get(url,headers=headers)
page_concert=indes.text

obj=re.compile(r'<table.*?<a class="nbg".*?title="(?P<title>.*?)">'
               r'.*?<span class="rating_nums">(?P<score>.*?)</span>',re.S)



result=obj.finditer(page_concert)
for i in result:
    print(i.group("title"))
    print(i.group("score"))

能运行下面是运行截图

但还有一个评论人数没写
我写上提取评论人数的正则

<span class="pl">(?P<comment>.*?)</span>

下面是全部完整的代码

# 拿到页面源代码 requests
# 通过re 来提取有效的信息 re
import requests
import re
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.3"
}
url ="https://movie.douban.com/chart"
indes=requests.get(url,headers=headers)
page_concert=indes.text

obj=re.compile(r'<table.*?<a class="nbg".*?title="(?P<title>.*?)">'
               r'.*?<span class="rating_nums">(?P<score>.*?)</span>'
               r'<span class="pl">(?P<comment>.*?)</span>',re.S)



result=obj.finditer(page_concert)
for i in result:
    print(i.group("title"))
    print(i.group("score"))
    print(i.group("comment"))

但是运行结果是这样

我不知道该怎么办了，是我正则表达式写错了吗？
求解答
还有一个现象
不加评论的那句正则表达式运行时间1S,加了之后在运行10S往上，很慢

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱音斯坦牛优质创作者: 编程框架技术领域 2022-01-17 20:44
关注
obj = re.compile(r'<table.*?<a class="nbg".*?title="(?P<title>.*?)">' r'.*?<span class="rating_nums">(?P<score>.*?)</span>' r'.*?<span class="pl">(?P<comment>.*?)</span>', re.S)

最后一个前面加上.*？，看我给你截的图，两个span之间有空格
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的...
python爬虫数据可视化分析大作业.zip
2020-06-12 15:39

在本项目中，"python爬虫数据可视化分析大作业.zip" 是一个综合性的学习资源，主要涉及了Python编程中的两个重要领域：网络爬虫（Web Scraping）和数据可视化（Data Visualization）。通过这个作业，我们可以深入...
Python爬虫系列（一）——手把手教你写Python爬虫
2021-10-23 15:47

纸照片的博客这一部分我写在另一篇文章了，Python爬虫批量下载百度图片–点击跳转 5. 后言爬虫还是比较好入门的，这得益于成熟的爬虫工具。爬虫可以满足自己的个性化搜索需求，大家赶快动手试试吧。（如果觉得文章还不错的话...
python爬虫20个案例
2018-03-25 07:34

讲诉python爬虫的20个案例。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
【Python爬虫详解】第一篇：Python爬虫入门指南
2025-04-20 09:15

Luck_ff0810的博客网络爬虫（Web Crawler）是一种自动获取网页内容的程序。它可以访问网站，抓取页面内容，并从中提取有价值的数据。在信息爆炸的时代，爬虫技术可以帮助我们高效地收集、整理和分析互联网上的海量数据。为了应对不同...
Python爬虫完整代码拿走不谢
2023-03-22 09:46

q56731523的博客对于新手做Python爬虫来说是有点难处的，前期练习的时候可以直接套用模板，这样省时省力还很方便。
81个Python爬虫源代码
2018-12-13 14:23

81个Python爬虫源代码，内容包含新闻、视频、中介、招聘、图片资源等网站的爬虫资源
Python 万能代码模版：爬虫代码篇
2021-09-14 15:27

AI悦创Python一对一辅导的博客很多同学一听到 Python 或编程语言，可能条件反射就会觉得“很难”。但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要...
Python爬虫实战：从零到一构建数据采集系统
2025-02-21 19:25

DevKevin的博客在大数据时代，数据采集是开发者的必备技能之一，而Python凭借其简洁的语法和丰富的库（如requests）成为爬虫开发的首选语言。本文将从零开始，带你一步步构建一个简单的网页数据采集系统，爬取目标网站的数据并保存...
python爬虫爬取电影数据并做可视化
2023-09-18 13:26

程序小武的博客 #可视化库注意：后续用到分词库jieba以及词频统计库nltk 环境：解释器: python 3.10.5 编辑器：VsCode -jupyter-notebook 使用ipynb文件的扩展名 vscode会提示安装jupyter插件一、发送请求、获取html #请求的...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月17日

python 爬虫方面的问题 求交一交。。

1条回答 默认 最新

问题事件

python 爬虫方面的问题求交一交。。

1条回答默认最新