2 satanonetobe satanonetobe 于 2015.07.22 11:06 提问

python3.4正则匹配HTML问题

图片说明

2014年 井[4.4GB]:The.Last.Survivors.2014.720p.BluRay.x264-RUSTED

不知道怎么下载请看这里===>

我写的正则是:(.*?)
第二个内容(不知道怎么下载请看这里===)可以匹配出,但是我不要它。
两个表达式的嵌套标签一样。
正则该怎么写?最好可以只匹配出 2014年 井[4.4GB] 冒号 后面的内容

2个回答

CSDNXIAON
CSDNXIAON   2015.07.22 11:10

python之正则匹配
Python正则-多行匹配
Python正则-多行匹配
----------------------同志你好,我是CSDN问答机器人小N,奉组织之命为你提供参考答案,编程尚未成功,同志仍需努力!

oyljerry
oyljerry   Ds   Rxr 2015.07.22 12:22

你把2014年 井[4.4GB] 这些放到括号外面,不捕获分组就可以了

satanonetobe
satanonetobe 才看到问题没有写完整。我写的完整正则是:<span.*?style="color.*?ff0000.*?">(.*?)</span> 放到括号外面不捕获分组?可以说的详细点吗
接近 3 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
PHP 正则匹配 HTML 标签
$str = '<div class="subnav-title-name"><a href="http://www.autohome.com.cn/16/">一汽-大众-捷达</a></div>'; //两个rule 都可以匹配到数据 $rule = '/<div class="subnav-title-name">(.*?)<\/div>/ies'; $rule = '/<div class=\
正则表达式匹配Html标签
以下是一段Html代码其它内容...headline">典经HTML正则表达式!其它内容...正则表过式:说明:正则表达式匹配表格开始标记,能够返回开始标记直至 “headline”之间的所有内容(换行除外);就是以上红色标示出来的部分。原理:                          //匹配的开始部分.*                                   //除换行外
PHP正则表达式匹配嵌套HTML标签的方法和技巧
正则表达式是一个非常有用的编程技能。一般来说,简单的抓取一个HTML页面的某一条信息,比如<title>标题</title>,是很容易实现的。但是,我们往往要抓取某一个列表页面里的多个重复的<div></div>块里的特定内容,并且<div></div>块还有嵌套的使用,我们抓取的则是每个重复<div></div>块里的多个信息。同时,网页源文件不同于一般的字符串,其还存在大量的回车、换行和制表符,这些都造成了匹配失败。而初学者往往无法判断到底是哪个环节出现了问题,并且看到高度技巧化的正则表达式会感到非常沮
Python 正则表达式,html标签 提取
标签: import re mystr1="helloworld" res=re.match("\w*",mystr1) #前后标签不一样也能匹配 print(res) #(\w*)和\\1 对应匹配,前面的必须加括号 res1=re.match("\w*",mystr1) #前后标签必须一样才能匹配 print(res1) 嵌套标签: import re mystrs
php--正则匹配抓取html的相关内容
$str = &amp;lt;&amp;lt;&amp;lt;s &amp;lt;div class=&quot;article-content&quot;&amp;gt; &amp;lt;p&amp;gt;&amp;lt;br/&amp;gt;&amp;lt;/p&amp;gt;&amp;lt;section style=&quot;background-color: rgb(255, 255, 255); box-sizing: border-box;&quot;&
golang Html 正则
原文链接:http://outofmemory.cn/code-snippet/2092/usage-golang-regular-expression-regexp-quchu-HTML-CSS-SCRIPT-code-jin-maintain-page-wenzi package main import ( "fmt" "io/ioutil" "ne
php正则爬取html标签
1、按类名匹配div&quot;/&amp;lt;div class=\&quot;user_dazi_info\&quot;.*?&amp;gt;.*?&amp;lt;\/div&amp;gt;/ism&quot;;2、简单匹配标签'/&amp;lt;strong&amp;gt;(.*)&amp;lt;\/strong&amp;gt;/U'; 3、匹配表格之类的标签'/&amp;lt;thead[^&amp;gt;]*&amp;gt;(.*?) &amp;lt;\/thead&amp;gt;/si';4、
匹配获取HTML标签属性的正则 表达式
目的: 1、希望删除除class,src,href外的其他HTML 例如 1) 标题 删除属性后: 标题 2) &nbsp; 删除属性后: &nbsp; 想找到以个匹配这样的正则表达式,谢谢。   LZ,刚看到,你一是“希望删除除class、src、href外的其他”,二是希望删除除class、 rospan、 colspan外的其它。综合1、2,你的意思
正则表达式匹配所有不包含 css 的 html 标签
需求 取出下列html标签中的css标签 <meta content='Flat administration template for Twitter Bootstrap.' name='description'> <link href="assets/stylesheets/bootstrap/bootstrap.css" media="all" rel="stylesheet" type=
正则匹配代码\正则匹配代码
正则匹配代码\正则匹配代码\正则匹配代码\正则匹配代码