关于python爬虫利用正则表达式爬取不到内容的问题

我在用正则表达式爬取豆瓣电影里面的电影演员信息。
网页演员信息的位置如下：

图片说明

那么要爬取其中的这些演员名不就是下面的代码吗？

actors = re.findall(r'<div class="meta abstract_2">(.*?)</div>', resp, re.DOTALL)

其中resp是前面获取到的网页代码

可是print(actors)输出结果为空，请问是哪里不对呀？
有没有大佬就用正则表达式帮忙解答一下？因为我用爬虫只会用正则表达式匹配。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
毕小宝博客专家认证 2019-10-18 09:01
关注
爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种：

from lxml import etree # 解析页面的模块 html = etree.HTML(top_page)# top_page 你的代码中的页面 text result = html.xpath('//div[@class="meta abstract_2"]text()') # 得到 div 的文本内容。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

关于python爬虫利用正则表达式爬取不到内容的问题 python 数据挖掘机器学习正则表达式
2019-10-18 08:20

回答 3 已采纳爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种： ``` from lxml import etree # 解析页面的模块 html = etree.HTML
python利用正则表达式爬取网页的问题 macos python 正则表达式
2019-09-30 14:21

回答 3 已采纳 ```python3 resp = ''' 4室2厅4卫 250平南北向
python 爬虫 正则表达式 打印遇到问题 python 正则表达式爬虫
2021-12-30 23:54

回答 2 已采纳 ulrs = re.findall('<img src="(.*?)" alt=".*?">', html) 改成这样就行了，有帮助的话采纳一下哦！谢谢！
[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例
2020-09-30 21:07

Eastmount的博客欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍...第四篇文章将开启网络爬虫之旅，首先介绍基础知识及正则表达式的爬虫，希望对您有所帮助，文章中不足之处也请海涵。
Python爬虫能不能用正则表达式爬取学历部分？ python 爬虫
2022-09-25 14:35

回答 2 已采纳你好，这种HTML结构一般用xpath匹配，对于js般用正则表达式匹配，如果非要用正则表达式匹配HTML一般用：开头+（.*?）+结尾，括号里面的内容就是你要匹配的
python爬虫，当正则表达式无法匹配，怎么输出空字符 python 有问必答正则表达式爬虫
2021-09-01 16:19

回答 3 已采纳使用try except环绕即可
关于#python网络爬虫, 正则表达式 , html规则#的问题： python 正则表达式爬虫
2022-01-04 18:47

回答 2 已采纳 #导入包 import requests import re #请求网址 url = "https://www.vmgirls.com/18236.html" headers = {'User-A
python爬虫正则表达式
2023-02-04 00:14

心随而动的博客还不会正则表达式？博主带你学会正则表达式，以及正则表达式在爬虫中的实战
爬虫小白想拿正则表达式爬取豆瓣新书推荐 python
2021-06-16 12:24

回答 2 已采纳 src后面的左括号是中文的吧？另外，你可以用xpath提取数据比正则更方便哈
Python爬虫 正则表达式 python
2022-07-22 09:38

回答 3 已采纳
用PYTHON的正则表达式匹配不到目标 python
2020-12-29 16:16

回答 2 已采纳把点替换成 \.
7.网络爬虫—正则表达式详讲
2023-03-26 16:48

以山河作礼。的博客 Python 正则表达式 Python 正则表达式是一种用于匹配、搜索、替换文本中模式的工具。它使用特定的语法来描述一些规则，这些规则可以用于匹配文本中的某些模式。通过使用正则表达式，可以快速地搜索和处理大量的文本...
正则表达式返回结果为空列表，请问怎么解决？ python 爬虫
2022-08-05 10:54

回答 3 已采纳 import requests import re headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebK
通过Python爬取当当网，学正则表达式
2020-12-30 15:09

pythonputao的博客本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,,版权归原作者所有，如有问题请及时联系我们以作处理作者：啃书君来源：掘金原文链接：https://juejin.cn/post/6911667019435737101 PS：...
用正则表达式爬取数据,网络爬虫正则表达式
2024-03-19 21:46

Rtee1的博客大家好，小编来为大家解答以下问题，用正则表达式爬取数据，网络爬虫正则表达式，现在让我们一起来看看吧！免费源码获得：关注微信公众号:ancenok，然后回复：021。以下是代码的详细操作过程，并标注了相关注释，供...
没有解决我的问题, 去提问

悬赏问题

¥15 安卓adb backup备份应用数据失败
¥15 eclipse运行项目时遇到的问题
¥15 关于#c##的问题：最近需要用CAT工具Trados进行一些开发
¥15 南大pa1 小游戏没有界面，并且报了如下错误，尝试过换显卡驱动，但是好像不行
¥15 没有证书，nginx怎么反向代理到只能接受https的公网网站
¥50 成都蓉城足球俱乐部小程序抢票
¥15 yolov7训练自己的数据集
¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)（相关搜索：51单片机|单片机|测试代码）
¥15 电力市场出清matlab yalmip kkt 双层优化问题
¥30 ros小车路径规划实现不了，如何解决？(操作系统-ubuntu)