关于python爬虫利用正则表达式爬取不到内容的问题

我在用正则表达式爬取豆瓣电影里面的电影演员信息。
网页演员信息的位置如下：

图片说明

那么要爬取其中的这些演员名不就是下面的代码吗？

actors = re.findall(r'<div class="meta abstract_2">(.*?)</div>', resp, re.DOTALL)

其中resp是前面获取到的网页代码

可是print(actors)输出结果为空，请问是哪里不对呀？
有没有大佬就用正则表达式帮忙解答一下？因为我用爬虫只会用正则表达式匹配。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
毕小宝领域专家: 后端开发技术领域 2019-10-18 09:01
关注
爬虫内容解析比较方便的不是正则而是 xpath ，语法也很容易，建议试试这种：

from lxml import etree # 解析页面的模块 html = etree.HTML(top_page)# top_page 你的代码中的页面 text result = html.xpath('//div[@class="meta abstract_2"]text()') # 得到 div 的文本内容。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

Python + 基于正则表达式爬取汽车之家车型图片解决拦截问题！.zip
2026-01-12 10:42

本项目通过Python语言结合正则表达式技术，开发了一个爬虫程序，旨在解决爬取汽车之家车型图片时遭遇的反爬虫问题。程序通过分析汽车之家网页的结构，利用正则表达式匹配和提取车型图片的URL链接。然后，通过进一步...
用正则表达式爬取数据,网络爬虫正则表达式
2024-04-06 13:38

2401_82891570的博客大家好，给大家分享一下用正则表达式爬取数据，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！
初识Python爬虫，使用正则表达式提取数据
2024-10-19 22:54

学成大数据前不改名！的博客正则：用来匹配字符产的一门表达式语言1.正则支持普通字符2.元字符，即一个符号匹配部分对应内容\d 匹配0-9的数字 \d\d 一行提取2个数字\w 匹配数字、字母、下划线（0-9、a-z、_）\W \w取反\D \d取反[abc] 自定义...
Python爬虫基础-正则表达式！
2024-11-05 17:13

Python_trys的博客 正则表达式是对字符串的一种逻辑公式，用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则的字符串”，此字符串用来表示对字符串的一种“过滤”逻辑。正在在很多开发语言中都存在，而非python独有。...
[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例
2020-09-30 21:07

Eastmount的博客欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍...第四篇文章将开启网络爬虫之旅，首先介绍基础知识及正则表达式的爬虫，希望对您有所帮助，文章中不足之处也请海涵。
7.网络爬虫—正则表达式详讲
2023-03-26 16:48

以山河作礼。的博客 Python 正则表达式 Python 正则表达式是一种用于匹配、搜索、替换文本中模式的工具。它使用特定的语法来描述一些规则，这些规则可以用于匹配文本中的某些模式。通过使用正则表达式，可以快速地搜索和处理大量的文本...
Python爬虫代码分享01——(re 正则表达式爬取数据)
2024-04-09 21:39

Janice(贾雯爽)的博客通过浏览器提交请求给网站服务器（打开浏览器输入网址或者通过搜索引擎搜索打开网址） --> 下载网页代码 --> 浏览器解析成页面 --> 用户浏览爬虫爬取信息的过程：模拟浏览器发送请求获取网页代码 --> 按照代码设置...
python爬虫正则表达式
2023-02-04 00:14

心随而动的博客还不会正则表达式？博主带你学会正则表达式，以及正则表达式在爬虫中的实战
通过Python爬取当当网，学正则表达式
2020-12-30 15:09

pythonputao的博客本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,,版权归原作者所有，如有问题请及时联系我们以作处理作者：啃书君来源：掘金原文链接：https://juejin.cn/post/6911667019435737101 PS：...
【人工智能】Python常用的两种爬虫的方式 正则表达式、XPath
2019-04-19 17:23

沙振宇的博客本文讲解了我利用Python3爬取CSDN个人信息的两种方式（正则表达式、XPath）。由于CSDN也会不断的改变它的HTML代码，所以本文只是提供爬取方式哈。这篇文章中提过。只不过那篇文章讲解的是利用Scrapy框架去爬，本文讲...
没有解决我的问题, 去提问

关于python爬虫利用正则表达式爬取不到内容的问题

3条回答 默认 最新

3条回答默认最新