正则表达式匹配标签问题
 <section>

    //此处为任何内容,会动态改变

</section>
<table>
    //此处也为任何内容,会动态改变
</table>
以上内容以字符串形式复制给了变量str,我需要用正则从str中分别提取<section></section>和<table></table>之间的内容(包括section和table)赋值给str1和str2,我知道一般的正则方法,现在问题是两标签之间的内容可能会包含<section>或<table>,导致多匹配或少匹配。如/(<section>[\s\S]*<\/section>)|(<table[\s\S]*<\/div>)/

因为内容是随时变化的,请问有没有办法,在不受标签未知内容的影响下完美匹配?
有的话,请给个demo,谢谢!

1个回答

标签嵌套需要用递归平衡组
http://c.biancheng.net/cpp/html/1419.html

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
正则表达式匹配标签内容
爬下面<table>标签内的内容如何去写正则表达式? ``` <table cellspacing="1" cellpadding="6" width="100%" class="ctb">这里是内容 </table> ```
如何用正则表达式匹配HTML标签内文字内容
![图片说明](https://img-ask.csdn.net/upload/201705/12/1494550802_115758.png)如求教各位大神,请问如何使用正则表达式匹配上图HTML页面内的相应字段达到返回 被告人 后面相应的字段,比如上图所示,通过使用正则表达式返回值“晋城市华东煤炭销售有限责任公司”
正则表达式匹配html标签内的内容
例如标签如下 <div class="tour-title"> <h3 >这里是要匹配的内容,但是可能包括<这个符号</h3> 我想匹配的内容是“这里是要匹配的内容,但是可能包括<这个符号” 我原本用的正则式 boost::regex re("<\\s*div\\s*class\\s*=\\s*\"tour-title\"\\s*>\\s*<\\s*h3\\s*>([^<]*)<\\s*/\\s*h3\\s*>", boost::regex::normal | boost::regbase::icase); 这个正则式在内容里面包括“<”这个符号时会出问题吧,那应该怎么处理好呢?
java爬虫webMagic用正则表达式匹配a标签的onclick里面的值
java爬虫webMagic用正则表达式匹配a标签的onclick里面queryArticleByCondition方法里的this后面的值,就是一个URL地址 ``` <a style="cursor:pointer" onclick="queryArticleByCondition(this,'/liuyanggov/dwzt/ggzyjyzx/jyxx96/fjsz34/zbgg97/2a7bc3f8-3.html')" tagname="/liuyanggov/dwzt/ggzyjyzx/jyxx96/fjsz34/zbgg97/2a7bc3f8-3.html">下一页</a> ```
正则表达式匹配HTML标签中的一部分内容
假设我有这样的 <span class="acm">回复[3042]</span> 一串内容,要从中将3042匹配出来,该用什么样的正则表达式?
正则表达式 html标签匹配
有这样一段html标签 **&lt;p** style=""&gt;aaa**&lt;p>bbb&lt;/p>**ccc**&lt;p>ddd&lt;/p>**eee**&lt;/p>** &lt;p>ffff&lt;/p> 我想最终得到的是第一行中从最开始p标签开始到最末端p标签结束,其中可能还包括多个成对出现的p标签例,但不包括下一行的p标签, 应该怎样写呢? 我这样写:&lt;p.*?(&lt;p>.*?&lt;/p>)?.*?&lt;/p>,最终得到的是&lt;p style="">aaa&lt;p>bbb&lt;/p> 求各位高手不吝赐教 注:我只有8个币了。。。
正则表达式 匹配字串问题
要在以下字串中计算有几个img的标签内容出现, <img src="static/image/smiley/comcom/9.gif" smilieid="296" border="0" alt="" />要要<img src="static/image/smiley/comcom/7.gif" smilieid="294" border="0" alt="" /> 我用的正则化表达式是:"(<img.+(src=\".+\").+/>){1}" 本来可以匹配2次的,但结果却是一次,这是为什么?
求一个匹配包含指定字符串的html标签的正则表达式
求一个匹配包含指定字符串的html标签的正则表达式,说明如下: ``` <li class="" data-tag="T">对</li> <li class="ucqo_g_solution" data-tag="F">错</li> ``` 上边的两个li标签,我要获取包含‘class="ucqo_g_solution"’这个li里面的内容,求高手赐一个正则表达式,谢谢了。
如何写以下正则表达式问题
``` <table cellspacing="1" cellpadding="10" width="100%" class="ctb"> <tr> <td class="ltd">展会日期</td> <td class="rtd">2018-07-05 至 2018-07-07</td> </tr> <tr> <td class="ltd">展出城市</td> <td class="rtd">上海</td> </tr> </table> ``` 我想匹配<table cellspacing="1" cellpadding="10" width="100%" class="ctb"></table>,抓取标签中间内容,如何写正则?
C# 匹配除<p>标签外的其它html标签的正则表达式怎么写?
C# 匹配除<p>标签外的其它html标签的正则表达式怎么写?
用正则表达式匹配网页<th>标签内的文字内容
想写个爬虫脚本将“http://db.yaozh.com/instruct”中的药品信息爬下来,现在我需要用正则表达式来匹配以下的html内容,跪求。。。 ``` <tr> <th class="priority1">药用炭</th> <td class="priority1">高血脂</td> <td class="priority1">作为吸附剂,可用于促进尿毒症性毒素的肠道排泄,以及食物、生物碱等中毒及腹泻、腹胀</td> <td class="priority1"> <a href="#" class="cl-blue hasrule" data-norule="norle">查看</a> </td> </tr> ```
C# 获取a标签的正则表达式求助
例如该链接为< a href="http://www.baidu.com" title="标题">标签内容</ a>,求一个正则表达式能匹配到到a标签href、title和“标签内容”的内容,title的位置可能在href前面,也有可能在href后面,或者就没有title
js中如何通过正则表达式提取出一个网页中的a标签
js中如何通过正则表达式提取出一个网页中的a标签?? ``` const reg = '<a href="(.+?)">(.+?)</a>'; const result = response.data.match(reg); ``` 在上面代码中,我通过response.data获取到网页中的数据,然后通过正则表达式reg去匹配,但是result中的结果,不是我想要的,我想把所有的<b>a标签存到一个数组中</b>,这怎么做?? ###怎么把匹配到的所有数据存到result数组中
各路大神,求一个忽略html标签匹配字符串的正则表达式
譬如我要匹配一个字符串“请拨打110求助”,这个正则不仅要匹配“请拨打110求助”, 也要能匹配包含html标签的字符串(中间的|去掉,防止被过滤用的)如:“请拨打<|span>110<|/span>求助“
利用正则表达匹配符合条件的内容
利用正则表达式匹配指定的<tr></tr>,在这个tr标签中存在一个特殊的字符串“[$]”,要在多个tr标签中匹配出所有符合条件的<tr>。 样例输入 ``` <tr>123456</tr><tr>ABCD[$]12345678</tr><tr>3456789</tr> ``` 样例输出 ``` <tr>ABCD[$]12345678</tr> ``` 希望能用正则表达是解决这个问题,谢谢!
正则表达式‘.*?’是不包括冒号‘:’吗
![图片说明](https://img-ask.csdn.net/upload/202001/03/1578019460_955818.png) * 如题(第一次发问,不是很懂这个markdown 见谅)。我想用正则表达式提取这个A标签的文本,也就是‘Jason Mraz’,但是我发现第一段代码是可以正确提取的,第二段则不行,这个冒号不加在正则表达式里面就不会被我的.*?匹配到吗?为此我特地复习了一下‘.’的匹配规则:“匹配除 "\n" 之外的任何单个字符”似乎冒和号没什么关系。 ``` re.findall('表演者:.*?>(.*?)</a>', html.text, re.S)[0] ``` ``` re.findall('表演者.*?>(.*?)</a>', html.text, re.S)[0] ``` 推理下来就是正则表达式‘.*?’是匹配不到冒号‘:’是这样吗?总感觉不太对,来论坛求助大佬解决
python正则表达式匹配网页标签中的双引号
如图所示,我想匹配第一张图片,关键内容就是在<span class="14">里面,但是我按照第二幅图片写pattern的话,会报错,一个也搜索不到,求救各位大神,谢谢!! ![图片说明](https://img-ask.csdn.net/upload/201608/14/1471173508_466407.png) ![图片说明](https://img-ask.csdn.net/upload/201608/14/1471173522_589984.png)
求正则表达式
求匹配html,javascript标签的java正则表达式,哪位朋友知道的,谢谢!
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...
【JSON解析】浅谈JSONObject的使用
简介 在程序开发过程中,在参数传递,函数返回值等方面,越来越多的使用JSON。JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,同时也易于机器解析和生成、易于理解、阅读和撰写,而且Json采用完全独立于语言的文本格式,这使得Json成为理想的数据交换语言。 JSON建构于两种结构: “名称/值”对的集合(A Collection of name/va...
《MySQL 性能优化》之理解 MySQL 体系结构
本文介绍 MySQL 的体系结构,包括物理结构、逻辑结构以及插件式存储引擎。
程序员请照顾好自己,周末病魔差点一套带走我。
程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。
卸载 x 雷某度!GitHub 标星 1.5w+,从此我只用这款全能高速下载工具!
作者 | Rocky0429 来源 | Python空间 大家好,我是 Rocky0429,一个喜欢在网上收集各种资源的蒟蒻… 网上资源眼花缭乱,下载的方式也同样千奇百怪,比如 BT 下载,磁力链接,网盘资源等等等等,下个资源可真不容易,不一样的方式要用不同的下载软件,因此某比较有名的 x 雷和某度网盘成了我经常使用的工具。 作为一个没有钱的穷鬼,某度网盘几十 kb 的下载速度让我...
只因接了一个电话,程序员被骗 30 万!
今天想给大家说一个刚刚发生在我身边的一起真实的诈骗经历,我的朋友因此被骗走30万。注:为了保护当事人隐私,部分情节进行了修改。1平安夜突来的电话开始以为就像普通的诈骗一样,想办法让你把钱...
我一个37岁的程序员朋友
周末了,人一旦没有点事情干,心里就瞎想,而且跟几个老男人坐在一起,更容易瞎想,我自己现在也是 30 岁了,也是无时无刻在担心自己的职业生涯,担心丢掉工作没有收入,担心身体机能下降,担心突...
python自动下载图片
近日闲来无事,总有一种无形的力量萦绕在朕身边,让朕精神涣散,昏昏欲睡。 可是,像朕这么有职业操守的社畜怎么能在上班期间睡瞌睡呢,我不禁陷入了沉思。。。。 突然旁边的IOS同事问:‘嘿,兄弟,我发现一个网站的图片很有意思啊,能不能帮我保存下来提升我的开发灵感?’ 作为一个坚强的社畜怎么能说自己不行呢,当时朕就不假思索的答应:‘oh, It’s simple. Wait for me for a ...
一名大专同学的四个问题
【前言】   收到一封来信,赶上各种事情拖了几日,利用今天要放下工作的时机,做个回复。   2020年到了,就以这一封信,作为开年标志吧。 【正文】   您好,我是一名现在有很多困惑的大二学生。有一些问题想要向您请教。   先说一下我的基本情况,高考失利,不想复读,来到广州一所大专读计算机应用技术专业。学校是偏艺术类的,计算机专业没有实验室更不用说工作室了。而且学校的学风也不好。但我很想在计算机领...
复习一周,京东+百度一面,不小心都拿了Offer
京东和百度一面都问了啥,面试官百般刁难,可惜我全会。
Java 14 都快来了,为什么还有这么多人固守Java 8?
从Java 9开始,Java版本的发布就让人眼花缭乱了。每隔6个月,都会冒出一个新版本出来,Java 10 , Java 11, Java 12, Java 13, 到2020年3月份,...
达摩院十大科技趋势发布:2020 非同小可!
【CSDN编者按】1月2日,阿里巴巴发布《达摩院2020十大科技趋势》,十大科技趋势分别是:人工智能从感知智能向认知智能演进;计算存储一体化突破AI算力瓶颈;工业互联网的超融合;机器间大规模协作成为可能;模块化降低芯片设计门槛;规模化生产级区块链应用将走入大众;量子计算进入攻坚期;新材料推动半导体器件革新;保护数据隐私的AI技术将加速落地;云成为IT技术创新的中心 。 新的画卷,正在徐徐展开。...
轻松搭建基于 SpringBoot + Vue 的 Web 商城应用
首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传。函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费。Fun: Fun 是一个用于支持 Serverless 应用部署的工具,能帮助您便捷地管理函数计算、API ...
Python+OpenCV实时图像处理
目录 1、导入库文件 2、设计GUI 3、调用摄像头 4、实时图像处理 4.1、阈值二值化 4.2、边缘检测 4.3、轮廓检测 4.4、高斯滤波 4.5、色彩转换 4.6、调节对比度 5、退出系统 初学OpenCV图像处理的小伙伴肯定对什么高斯函数、滤波处理、阈值二值化等特性非常头疼,这里给各位分享一个小项目,可通过摄像头实时动态查看各类图像处理的特点,也可对各位调参、测试...
2020年一线城市程序员工资大调查
人才需求 一线城市共发布岗位38115个,招聘120827人。 其中 beijing 22805 guangzhou 25081 shanghai 39614 shenzhen 33327 工资分布 2020年中国一线城市程序员的平均工资为16285元,工资中位数为14583元,其中95%的人的工资位于5000到20000元之间。 和往年数据比较: yea...
为什么猝死的都是程序员,基本上不见产品经理猝死呢?
相信大家时不时听到程序员猝死的消息,但是基本上听不到产品经理猝死的消息,这是为什么呢? 我们先百度搜一下:程序员猝死,出现将近700多万条搜索结果: 搜索一下:产品经理猝死,只有400万条的搜索结果,从搜索结果数量上来看,程序员猝死的搜索结果就比产品经理猝死的搜索结果高了一倍,而且从下图可以看到,首页里面的五条搜索结果,其实只有两条才是符合条件。 所以程序员猝死的概率真的比产品经理大,并不是错...
害怕面试被问HashMap?这一篇就搞定了!
声明:本文以jdk1.8为主! 搞定HashMap 作为一个Java从业者,面试的时候肯定会被问到过HashMap,因为对于HashMap来说,可以说是Java集合中的精髓了,如果你觉得自己对它掌握的还不够好,我想今天这篇文章会非常适合你,至少,看了今天这篇文章,以后不怕面试被问HashMap了 其实在我学习HashMap的过程中,我个人觉得HashMap还是挺复杂的,如果真的想把它搞得明明白...
毕业5年,我问遍了身边的大佬,总结了他们的学习方法
我问了身边10个大佬,总结了他们的学习方法,原来成功都是有迹可循的。
推荐10个堪称神器的学习网站
每天都会收到很多读者的私信,问我:“二哥,有什么推荐的学习网站吗?最近很浮躁,手头的一些网站都看烦了,想看看二哥这里有什么新鲜货。” 今天一早做了个恶梦,梦到被老板辞退了。虽然说在我们公司,只有我辞退老板的份,没有老板辞退我这一说,但是还是被吓得 4 点多都起来了。(主要是因为我掌握着公司所有的核心源码,哈哈哈) 既然 4 点多起来,就得好好利用起来。于是我就挑选了 10 个堪称神器的学习网站,推...
这些软件太强了,Windows必装!尤其程序员!
Windows可谓是大多数人的生产力工具,集娱乐办公于一体,虽然在程序员这个群体中都说苹果是信仰,但是大部分不都是从Windows过来的,而且现在依然有很多的程序员用Windows。 所以,今天我就把我私藏的Windows必装的软件分享给大家,如果有一个你没有用过甚至没有听过,那你就赚了????,这可都是提升你幸福感的高效率生产力工具哦! 走起!???? NO、1 ScreenToGif 屏幕,摄像头和白板...
阿里面试,面试官没想到一个ArrayList,我都能跟他扯半小时
我是真的没想到,面试官会这样问我ArrayList。
曾经优秀的人,怎么就突然不优秀了。
职场上有很多辛酸事,很多合伙人出局的故事,很多技术骨干被裁员的故事。说来模板都类似,曾经是名校毕业,曾经是优秀员工,曾经被领导表扬,曾经业绩突出,然而突然有一天,因为种种原因,被裁员了,...
大学四年因为知道了这32个网站,我成了别人眼中的大神!
依稀记得,毕业那天,我们导员发给我毕业证的时候对我说“你可是咱们系的风云人物啊”,哎呀,别提当时多开心啦????,嗯,我们导员是所有导员中最帅的一个,真的???? 不过,导员说的是实话,很多人都叫我大神的,为啥,因为我知道这32个网站啊,你说强不强????,这次是绝对的干货,看好啦,走起来! PS:每个网站都是学计算机混互联网必须知道的,真的牛杯,我就不过多介绍了,大家自行探索,觉得没用的,尽管留言吐槽吧???? 社...
良心推荐,我珍藏的一些Chrome插件
上次搬家的时候,发了一个朋友圈,附带的照片中不小心暴露了自己的 Chrome 浏览器插件之多,于是就有小伙伴评论说分享一下我觉得还不错的浏览器插件。 我下面就把我日常工作和学习中经常用到的一些 Chrome 浏览器插件分享给大家,随便一个都能提高你的“生活品质”和工作效率。 Markdown Here Markdown Here 可以让你更愉快的写邮件,由于支持 Markdown 直接转电子邮...
看完这篇HTTP,跟面试官扯皮就没问题了
我是一名程序员,我的主要编程语言是 Java,我更是一名 Web 开发人员,所以我必须要了解 HTTP,所以本篇文章就来带你从 HTTP 入门到进阶,看完让你有一种恍然大悟、醍醐灌顶的感觉。 最初在有网络之前,我们的电脑都是单机的,单机系统是孤立的,我还记得 05 年前那会儿家里有个电脑,想打电脑游戏还得两个人在一个电脑上玩儿,及其不方便。我就想为什么家里人不让上网,我的同学 xxx 家里有网,每...
史上最全的IDEA快捷键总结
现在Idea成了主流开发工具,这篇博客对其使用的快捷键做了总结,希望对大家的开发工作有所帮助。
阿里程序员写了一个新手都写不出的低级bug,被骂惨了。
这种新手都不会范的错,居然被一个工作好几年的小伙子写出来,差点被当场开除了。
谁是华为扫地僧?
是的,华为也有扫地僧!2020年2月11-12日,“养在深闺人不知”的华为2012实验室扫地僧们,将在华为开发者大会2020(Cloud)上,和大家见面。到时,你可以和扫地僧们,吃一个洋...
Idea 中最常用的10款插件(提高开发效率),一定要学会使用!
学习使用一些插件,可以提高开发效率。对于我们开发人员很有帮助。这篇博客介绍了开发中使用的插件。
AI 没让人类失业,搞 AI 的人先失业了
最近和几个 AI 领域的大佬闲聊 根据他们讲的消息和段子 改编出下面这个故事 如有雷同 都是巧合 1. 老王创业失败,被限制高消费 “这里写我跑路的消息实在太夸张了。” 王葱葱哼笑一下,把消息分享给群里。 阿杰也看了消息,笑了笑。在座几位也都笑了。 王葱葱是个有名的人物,21岁那年以全额奖学金进入 KMU 攻读人工智能博士,累计发表论文 40 余篇,个人技术博客更是成为深度学习领域内风向标。 ...
2020年,冯唐49岁:我给20、30岁IT职场年轻人的建议
点击“技术领导力”关注∆每天早上8:30推送 作者|Mr.K 编辑| Emma 来源|技术领导力(ID:jishulingdaoli) 前天的推文《冯唐:职场人35岁以后,方法论比经验重要》,收到了不少读者的反馈,觉得挺受启发。其实,冯唐写了不少关于职场方面的文章,都挺不错的。可惜大家只记住了“春风十里不如你”、“如何避免成为油腻腻的中年人”等不那么正经的文章。 本文整理了冯...
立即提问