关于BeutifulSoup对象的find_all()中使用正则表达式的问题

如图所示的网页HTML标签，现想用正则表达式将div class='dg000'或者div class='dgfff'的标签提取出来，而不包括class='dgfff banner-box'
图片说明
用如下语句提取实现不了，原因是什么呢？
datas=soup.find_all('div',{'class':'re.compile(''bg[f,0]{3}$)})

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
skykaddish 2018-06-25 13:58
关注
soup.findAll("div", attrs={"class":re.compile(r'bg[f0]{3}$')})试试

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用BeautifulSoup爬取想要的标签（《python网络爬虫权威指南》笔记）
2020-04-29 21:01

pnd237的博客使用BeautifulSoup爬取想要的标签精确爬取标签BeautifulSoup中的find()和find_all()方法BeautifulSoup中的对象兄弟、子、父、后代标签的处理抓取子标签和其他后代标签抓取兄弟标签精确爬取标签我们可以使用标签的...
Python3实现的爬虫爬取数据并存入mysql数据库操作示例
2020-09-09 09:34

总结来说，这个示例展示了如何使用Python3结合正则表达式和MySQL数据库进行网络爬虫开发，实现从网页抓取数据并存储到数据库的过程。这对于数据分析、信息监控以及自动化任务等领域非常有用。不过，进行网络爬虫时，...
爬虫【网页构造+第三方库+爬取逻辑示例+正则表达式+xpath+多进程】
2020-04-01 09:57

呼呼啊噜噜的博客 flags控制匹配方式，是否区分大小写，多行匹配等 infos=re.search('\d+','one1two2three3')-->#正则表达式对象 print(infos.group())-->1#第一个 4.2.2 sub() 函数（相当于字符串中的replace但是更灵活，能用正则...
Python BeautifulSoup 使用教程
2025-10-02 10:32

Full Stack Developme的博客 Python BeautifulSoup 使用教程
Python编程-- BS4解析
2022-08-08 06:05

Bruce_xiaowei的博客简单来说，Beautiful Soup是python的一个库，最主要的功能是从网页抓取数据。官方解释如下：Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为...
Python常用库——beautifulsoup4
2024-08-06 23:23

不学Java已多年的博客简单来说，Beautiful Soup是python的一个库，最主要的功能是从网页抓取数据。官方解释如下：Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为...
Beautiful Soup --bs4模块
2019-06-19 12:59

bad kid's cute的博客 1. 什么是Beautiful Soup bs4是一个HTML/XML的解析器，主要的功能是解析... 四大对象 bs4库会将复杂的HTML文档换成树结构（HTML DOM），这个结构中的每个节点都是一个Python对象，这些对象可以归纳为如下四种 bs4.B...
python爬虫（网页解析）
2023-03-31 23:38

Mr.Joden的博客而findall内部使用的是正则表达式来匹配元素，效率较低。 xpath一定可以替代findall，但findall不一定能替代xpath，所以建议使用xpath即可。 ### 标签(lxml.etree._Element对象)操作(参考脑图)：创建标签：etree....
[学习笔记]Beautiful Soup语法基本使用
2018-02-02 22:55

法迪的博客 find all搜索的是全部节点，find搜索的是满足条件的第一个节点 2.获取网页信息思路如下 # Python # 根据 HTML 网页字符串创建 BeautifulSoup 对象 soup = BeautifulSoup( html_doc, # HTML 文档字符串 ...
python爬虫学习笔记-使用BeautifulSoup解析html
2018-11-24 11:23

懒懒的书虫的博客之前抓取豆瓣图书Top250的时候，获取内容使用的方法是正则表达式匹配，看上去是一种比较简洁的方法，但问题在于，正则表达式的编写必须非常细心，一旦出了任何小问题，就会导致得不到想要的结果。熟悉html的话，不难...
没有解决我的问题, 去提问

关于BeutifulSoup对象的find_all()中使用正则表达式的问题

7条回答 默认 最新

7条回答默认最新