python re正则表达式,怎么匹配一段字符中间 的部分,已知头尾

例如:12<34<123456>123

需要输出的结果是<>中间的 123456

一开始我是这么写的

re.findall(<(.*?)>)

但是输出的结果是 34<123456

应该怎么写才能正确获取到<>中的数据呢

刚学python 爬虫,求大佬指路

1个回答

re.compile(r'.*<(.*?)>.*').findall("12<34<123456>123")
nfy5191336
nfy5191336 顺便问一下,正则表达式怎么学习,有推荐的文章或者书籍么,自己看文档,感觉还是不会用,看别人的文章也都是照着文档讲的。。
大约一年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python3正则表达式匹配字符串时,能不能不匹配字符串中间的某个子字符串

我的正则reg = r'((?=src=).*?\.jpg)' 已经匹配出的字符串: https://img3.doubanio.com/f/shire/a1fdee122b95748d81cee426d717c05b5174fe96/pics/blank.gif" **data-origin**="https://img3.doubanio.com/icon/g28131-1.jpg 但我要的是 data-origin 后面的.jpg的url 请问正则应该怎么做

正则表达式匹配:9位数字加一个“-”

正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”; 正则表达式匹配:9位数字加一个“-”;

用python正则表达式替换字符串问题

我用python写一个计算器,想用正则表达式将字符串中的一些内容替换,举个例子字符串如下 1+2*3-(5/6)+sin(45)-ln(100) 如何将用正则表达式先找到其中有sin()的内容,然后将sin(45)这个子串提取出来算出其值,然后用值去替换字符串中sin(45)

python正则表达式 2个及以上字符要放在一起重复 如何表示?

写一个正则表达式,匹配每 3 位就有一个逗号的数字? 匹配以下数字: '42' '1,234' '6,368,745' 但不会匹配: '12,34,567' (逗号之间只有两位数字) '1234' (缺少逗号) ``` s = '42 1,234 6,368,745 12,34,567 1234' numRegex = re.compile(r'\d{1,3},\d{3}') #',\d{3}'为需要一起重复的4个字符. print(numRegex.findall(s)) ```

使用正则表达式匹配一段json字符串中是否有包含的字符

打比方,下面是我要匹配的字符串,规则是取出 #号后到"号前的字符串中的逗号(,) ``` {"10#a,a":"aaa", "11#d,a":"ada", "12#dd,asa": "da"} ``` 下面是我写出来的正则: ``` /((?<=#).*?(?="))/g ``` 效果图: ![图片说明](https://img-ask.csdn.net/upload/201912/14/1576298940_327242.png) 我现在能匹配到#号到"号的区间中的任意字符,我尝试将正则改变如下: ``` /((?<=#),(?="))/g ``` 匹配失败,望求各位大神救救我 =============分割线=============== 尝试了以下方法 ``` /((?<=#).*?,.*?(?="))/g ``` ``` /((?<=#).*?\,.*?(?="))/g ``` ``` /((?<=#).*?[,].*?(?="))/g ``` 三种方式的效果图:![图片说明](https://img-ask.csdn.net/upload/201912/14/1576312921_660230.png)

如何用正则表达式匹配HTML标签内文字内容

![图片说明](https://img-ask.csdn.net/upload/201705/12/1494550802_115758.png)如求教各位大神,请问如何使用正则表达式匹配上图HTML页面内的相应字段达到返回 被告人 后面相应的字段,比如上图所示,通过使用正则表达式返回值“晋城市华东煤炭销售有限责任公司”

python的正则表达式匹配

<a href="http://bbs.ghtt.net/forum.php?mod=viewthread&amp;tid=1854161&amp;page=1&amp;authorid=106072" rel="nofollow">只看该作者</a> </div> </div> </div><div class="pct"><div class="pcb"> <div class="t_fsz"> <table cellspacing="0" cellpadding="0"><tr><td class="t_f" id="postmessage_3855116"> 没校内网啊,亲</td></tr></table> 这是网页html中的某一段,现在需要从里面匹配出authorid和之后的发言内容,在这里是'没校内网啊,亲'。大家有什么好办法么 for mo in re.finditer('<td class="t_f" id=".*">(.*)(</td></tr></table>){1}',a): print mo.group(1) 这是我的代码,a是我读取的文本,并不能实现匹配出多组结果,结果只有文本中符合条件的最后一组

python正则表达式匹配反斜杠

本意是把地址里那个讨厌的反斜杠变成斜杠,但是用replace函数换掉反斜杠的时候总是会把反斜杠后面的a一起给替换掉,所以想用正则表达式匹配出/,再把匹配到的位置上的反斜杠换掉,但是运行后会报错或匹配不到。 ``` import re str="D:/icnet/data/cityscape/leftImg8bit/train\aachen" print(re.search("\\",str,re.I)) ``` ![图片说明](https://img-ask.csdn.net/upload/201905/01/1556708146_332676.png) ``` import re str="D:/icnet/data/cityscape/leftImg8bit/train\aachen" print(re.search(r"\\",str,re.I)) ``` ![图片说明](https://img-ask.csdn.net/upload/201905/01/1556708161_719300.png) 我又尝试匹配\加任意一个字母的模式(因为除了这条还有很多其他地址,反斜杠后跟的字母都不一样)但是无论用“\\.”或者元字符的r“\.”都匹配不到\a,请问问题到底出在哪里呢? ``` import re str="D:/icnet/data/cityscape/leftImg8bit/train\aachen" print(re.search("\\.",str,re.I)) ``` ![图片说明](https://img-ask.csdn.net/upload/201905/01/1556708276_635323.png)

python中用正则去匹配多个div嵌套的时候,需要这样来写正则表达式

<div class="tabbox1"> <dl> <dt> <div class="dt-div1">评测项目</div> <div class="dt-div2">成绩</div> <div class="dt-div3">排名</div> </dt> <dd> <div class="dd-div1">加速(0-100公里/小时)</div> <div class="dd-div2">9.01秒</div> <div class="dd-div3"><a target='_blank' href='//www.autohome.com.cn/channel2/bestauto/list.aspx?type=1#591'>591</a></div> </dd> <dd> <div class="dd-div1">刹车(100-0公里/小时)</div> <div class="dd-div2">39.69米</div> <div class="dd-div3"><a target='_blank' href='//www.autohome.com.cn/channel2/bestauto/list.aspx?type=2#519'>519</a></div> </dd> <dd> <div class="dd-div1">实测油耗(升/100公里)</div> <div class="dd-div2">9.5升</div> <div class="dd-div3"><a target='_blank' href='//www.autohome.com.cn/channel2/bestauto/list.aspx?type=3#572'>572</a></div> </dd> </dl> </div> 要求:需要这样来写正则才能匹配到这整个div

python 正则表达式 匹配指定单词前几个单词

``` import re text = "May we stop to remember the 2,996 people that died & the more than 6000 injured on #September11" m = re.findall(r"\bdied|injured\b", text) if m: print(m) else: print('not match') ``` 我 想匹配的是died和injured包括他们前面3个单词,包括数字,主要是需要数字,这个该如何填写呢?

python正则表达式如何匹配网页标签中的双引号

如图所示,我想匹配第一张图片,关键内容就是在<span class="14">里面,但是我按照第二幅图片写pattern的话,会报错,一个也搜索不到,求救各位大神,谢谢!! ![图片说明](https://img-ask.csdn.net/upload/201608/14/1471145085_69192.png) ![图片说明](https://img-ask.csdn.net/upload/201608/14/1471145070_15894.png)

python利用正则表达式爬取网页的问题

我在利用python正则表达式爬取网页内文本时(如下图所示)遇到了一些问题: ![图片说明](https://img-ask.csdn.net/upload/201909/30/1569823610_553184.png) 比如爬取250平方米吧,实现代码如下: ```python area = re.findall(r'<dd class="dd-item size">.*?<span>.*?</span>.*?<span class="item-line">.*?</span>.*?<span>(.*?)</span>', resp, re.DOTALL) ``` 但是如果想按照上面的思路继续追加正则表达式爬取“南北向”这个文本就爬取不出来了: ```python area = re.findall(r'<dd class="dd-item size">.*?<span>.*?</span>.*?<span class="item-line">.*?</span>.*?<span>.*?</span>.*?<span class="item-line">.*?</span><span>(.*?)</span>', resp, re.DOTALL) ``` 请问问题出在哪里啊?

python中用正则表达式去掉除汉字以外的所有字符

因为我是刚学!有可能问题很智障·大家谅解! >>> print(title) [<title>国内新闻_新闻中心_新浪网</title>] 怎么才能只取到文字部分!谢谢!

python正则表达式匹配网页标签中的双引号

如图所示,我想匹配第一张图片,关键内容就是在<span class="14">里面,但是我按照第二幅图片写pattern的话,会报错,一个也搜索不到,求救各位大神,谢谢!! ![图片说明](https://img-ask.csdn.net/upload/201608/14/1471173508_466407.png) ![图片说明](https://img-ask.csdn.net/upload/201608/14/1471173522_589984.png)

python使用正则表达式提取文本中的中文项

'kong=\'\';var line_points=\'\';var line_runtime=\'\';kresult+="m5aa28c34|m5c626c4a|";\r\nvar m5aa28c34= new Array("169路去程","市区线路","水晶城 05:20-19:15 |长白港湾站 06:15-20:15","无人售票,投币每人次1元,IC卡有效","沈阳安运巴士有限公司","169路车型由XML6102UE52型更换为黄海DD6118S13型客车,线路配车为34台,来源于162路。","EUVSHJDZJUJUWRA","EUVSVSHZJUSDVWR|水晶城|148路@2deb8f03,169路@af7e1089","EUVTAIUZJUSCBEA|水晶城街八家子|148路@2deb8f03,148路@2deb8f03,169路@af7e1089,169路@af7e1089","EUVWAHSZJUSBHHC|水晶城街一汽福达|148路@2deb8f03,148路@2deb8f03,169路@af7e1089,169路@af7e1089","EUVUUGSZJUSAABG|良城美景|107路@9c557848,107路@9c557848,112路@94192360,112路@94192360,133路@d810a85c,133路@d810a85c,168路北线@2e2b17a2,168路南线@d0229eed,168路北线@2e2b17a2,168路南线@d0229eed,169路@af7e1089,169路@af7e1089,218路@8beac754,218路@8beac754,384路@e0499228,384路@e0499228,385路@7a32571f,385路@7a32571f,386路@e3ce166e,386路@e3ce166e","EUVTIBHZJURVWHC|辽宁奥通|107路@9c557848,107路@9c557848,112路@94192360,112路@94192360,133路@d810a85c,133路@d810a85c,168路北线@2e2b17a2,168路南线@d0229eed,168路北线@2e2b17a2,168路南线@d0229eed,169路@af7e1089,169路@af7e1089,218路@8beac754,218路@8bea 想要把中间的车站名称提取出来 例如|水晶城|

python正则表达式如何封装

一个文本处理函数,需要经常调用正则表达式,文档结构类似于: ``` def function(): match=re.match(pattern,string) # 省略 ``` 现在的问题是,这个function是经常被其它函数调用的: (1)如果把正则表达式的定义写在function里面,每调用一次function就会重新对这个正则表达式进行编译,会占用很多时间; (2)如果把正则表达式的定义和编译写在function外面作为全局变量,由于需要用到的正则表达式很多,每个正则表达式都声明为一个全局变量不太合适,请问如何封装比较好?

关于python正则表达式抓取图片地址的问题

抓取图片正则表达式为r'src="(.+?\.(?:bmp|jpg|png|gif))"' 问下大神们,为什么抓取时不会将src=抓取进去,而只是抓取了括号里内容? (?:)是非捕获型括号吗?为什么直接用捕获型会多出.jpg类的字符?

关于URL正则表达式匹配

大家好, 我在命令行,用如下命令,正则表达式匹配成功: >>> m=re.match(r'api/blogs/\?idstart=\d+',"api/blogs/?idstart=12"); >>> m <_sre.SRE_Match object at 0x024A3E20> 但是在url文件中,写成这样: url(r'^api/blogs/\?idstart=\d+',blogs), 再通过地址http://127.0.0.1:8000/api/blogs/?idstart=12 去访问,提示匹配不成功。 请大家指导。谢谢。

大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了

大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

Java基础知识面试题(2020最新版)

文章目录Java概述何为编程什么是Javajdk1.5之后的三大版本JVM、JRE和JDK的关系什么是跨平台性?原理是什么Java语言有哪些特点什么是字节码?采用字节码的最大好处是什么什么是Java程序的主类?应用程序和小程序的主类有何不同?Java应用程序与小程序之间有那些差别?Java和C++的区别Oracle JDK 和 OpenJDK 的对比基础语法数据类型Java有哪些数据类型switc...

我以为我学懂了数据结构,直到看了这个导图才发现,我错了

数据结构与算法思维导图

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

Linux 会成为主流桌面操作系统吗?

整理 |屠敏出品 | CSDN(ID:CSDNnews)2020 年 1 月 14 日,微软正式停止了 Windows 7 系统的扩展支持,这意味着服役十年的 Windows 7,属于...

讲一个程序员如何副业月赚三万的真实故事

loonggg读完需要3分钟速读仅需 1 分钟大家好,我是你们的校长。我之前讲过,这年头,只要肯动脑,肯行动,程序员凭借自己的技术,赚钱的方式还是有很多种的。仅仅靠在公司出卖自己的劳动时...

学习总结之HTML5剑指前端(建议收藏,图文并茂)

前言学习《HTML5与CSS3权威指南》这本书很不错,学完之后我颇有感触,觉得web的世界开明了许多。这本书是需要有一定基础的web前端开发工程师。这本书主要学习HTML5和css3,看...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

搜狗输入法也在挑战国人的智商!

故事总是一个接着一个到来...上周写完《鲁大师已经彻底沦为一款垃圾流氓软件!》这篇文章之后,鲁大师的市场工作人员就找到了我,希望把这篇文章删除掉。经过一番沟通我先把这篇文章从公号中删除了...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

新一代神器STM32CubeMonitor介绍、下载、安装和使用教程

关注、星标公众号,不错过精彩内容作者:黄工公众号:strongerHuang最近ST官网悄悄新上线了一款比较强大的工具:STM32CubeMonitor V1.0.0。经过我研究和使用之...

记一次腾讯面试,我挂在了最熟悉不过的队列上……

腾讯后台面试,面试官问:如何自己实现队列?

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

冒泡排序动画(基于python pygame实现)

本项目效果初始截图如下 动画见本人b站投稿:https://www.bilibili.com/video/av95491382 本项目对应github地址:https://github.com/BigShuang python版本:3.6,pygame版本:1.9.3。(python版本一致应该就没什么问题) 样例gif如下 ======================= 大爽歌作,mad

Redis核心原理与应用实践

Redis核心原理与应用实践 在很多场景下都会使用Redis,但是到了深层次的时候就了解的不是那么深刻,以至于在面试的时候经常会遇到卡壳的现象,学习知识要做到系统和深入,不要把Redis想象的过于复杂,和Mysql一样,是个读取数据的软件。 有一个理解是Redis是key value缓存服务器,更多的优点在于对value的操作更加丰富。 安装 yum install redis #yum安装 b...

现代的 “Hello, World”,可不仅仅是几行代码而已

作者 |Charles R. Martin译者 | 弯月,责编 | 夕颜头图 |付费下载自视觉中国出品 | CSDN(ID:CSDNnews)新手...

带了6个月的徒弟当了面试官,而身为高级工程师的我天天修Bug......

即将毕业的应届毕业生一枚,现在只拿到了两家offer,但最近听到一些消息,其中一个offer,我这个组据说客户很少,很有可能整组被裁掉。 想问大家: 如果我刚入职这个组就被裁了怎么办呢? 大家都是什么时候知道自己要被裁了的? 面试软技能指导: BQ/Project/Resume 试听内容: 除了刷题,还有哪些技能是拿到offer不可或缺的要素 如何提升面试软实力:简历, 行为面试,沟通能...

!大部分程序员只会写3年代码

如果世界上都是这种不思进取的软件公司,那别说大部分程序员只会写 3 年代码,恐怕就没有程序员这种职业。

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

2020阿里全球数学大赛:3万名高手、4道题、2天2夜未交卷

阿里巴巴全球数学竞赛( Alibaba Global Mathematics Competition)由马云发起,由中国科学技术协会、阿里巴巴基金会、阿里巴巴达摩院共同举办。大赛不设报名门槛,全世界爱好数学的人都可参与,不论是否出身数学专业、是否投身数学研究。 2020年阿里巴巴达摩院邀请北京大学、剑桥大学、浙江大学等高校的顶尖数学教师组建了出题组。中科院院士、美国艺术与科学院院士、北京国际数学...

为什么你不想学习?只想玩?人是如何一步一步废掉的

不知道是不是只有我这样子,还是你们也有过类似的经历。 上学的时候总有很多光辉历史,学年名列前茅,或者单科目大佬,但是虽然慢慢地长大了,你开始懈怠了,开始废掉了。。。 什么?你说不知道具体的情况是怎么样的? 我来告诉你: 你常常潜意识里或者心理觉得,自己真正的生活或者奋斗还没有开始。总是幻想着自己还拥有大把时间,还有无限的可能,自己还能逆风翻盘,只不是自己还没开始罢了,自己以后肯定会变得特别厉害...

HTTP与HTTPS的区别

面试官问HTTP与HTTPS的区别,我这样回答让他竖起大拇指!

程序员毕业去大公司好还是小公司好?

虽然大公司并不是人人都能进,但我仍建议还未毕业的同学,尽力地通过校招向大公司挤,但凡挤进去,你这一生会容易很多。 大公司哪里好?没能进大公司怎么办?答案都在这里了,记得帮我点赞哦。 目录: 技术氛围 内部晋升与跳槽 啥也没学会,公司倒闭了? 不同的人脉圈,注定会有不同的结果 没能去大厂怎么办? 一、技术氛围 纵观整个程序员技术领域,哪个在行业有所名气的大牛,不是在大厂? 而且众所...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

立即提问
相关内容推荐