python3正则表达式匹配字符串时,能不能不匹配字符串中间的某个子字符串

我的正则reg = r'((?=src=).*?.jpg)'
已经匹配出的字符串:
https://img3.doubanio.com/f/shire/a1fdee122b95748d81cee426d717c05b5174fe96/pics/blank.gif" data-origin="https://img3.doubanio.com/icon/g28131-1.jpg
但我要的是 data-origin 后面的.jpg的url
请问正则应该怎么做

1个回答

做两次正则匹配,先匹配出第一个字符串,字符串切割,再做第二次匹配

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
用python正则表达式替换字符串问题
我用python写一个计算器,想用正则表达式将字符串中的一些内容替换,举个例子字符串如下 1+2*3-(5/6)+sin(45)-ln(100) 如何将用正则表达式先找到其中有sin()的内容,然后将sin(45)这个子串提取出来算出其值,然后用值去替换字符串中sin(45)
python正则表达式,匹配到了不希望匹配的东西,但不知道原因
import re r=re.compile(r'/re\s[\dt\d,?]+\srpl\d') r.search('/re 5t10,11t55,58t62,88,67t77 rpl2') 输出:<_sre.SRE_Match object; span=(0, 34), match='/re 5t10,11t55,58t62,88,67t77 rpl2'> 我的重点主要是放在该字符串中间的重复部分,例如5t10,11t55,58t62等,也就是前后两个数字夹中间一个t的、后面再跟个逗号——这个结构可以重复很多次。这个表达式我写出来了,但是我不知道中间那个纯数字88为什么可以匹配成功,它中间又没有t,凭什么会被匹配到?我实在是想不明白,我的代码明明写的就是 \dt\d,两个数字中间一个t,怎么就会有纯数字可以匹配到呢?
正则表达式提取字符串
``` Elisabetta Mei,1,2 Dadi Beck,1,2 Connor M. Mosby,1 Monica Sami, 1 Chiara Mass,3 and Susan A. Sloan1,2,* ``` 上面字段 我希望提取以下字段(我用Python): Elisabetta Mei,1,2 Dadi Beck,1,2 Connor M. Mosby,1 Monica Sami, 1 Chiara Mass,3 Susan A. Sloan1,2,* (包括星号) 请问怎么用正则表达?
python3用正则表达式解析字符串
str1 = 'service add name "testserver" protocol 100 protocol tcp sp 0:65535 dp 1000:6000 protocol udp sp 0:65535 dp 1000:6000 comment "test"' 想解析这种字符串,提取出name和dp后面的内容写到字典里,protocol 代表协议,分tcp、udp和自定义的(样例里有自定义的100,自定义的协议没有sp和dp),每条这样的字符串包含的proctocol数量不太一样,1个到8个之间随机的,而且tcp、udp和自定义的protocol的顺序也是随机的。自己尝试用正则表达式没弄出来。 想最后生成的结果是: dict = {'testserver':[[100],[tcp,1000:6000],[udp,1000:6000]]}
如何用正则表达式筛选出评论里的用户名,并将其替换成字符串"Username"
爬油管评论,做语义分析,评论中有@别人进行回复。但是这些用户名对语义分析没有用处。如何将他们用正则表达式筛选出来,然后替换成字符串“Username“ **1.第一种情况回复是有@打头的** @Yu Yu 你只是一个游客,人家本身的生活习惯使5使為你改变 @Chen Vergil 人地只懂 北上返大陆 唔 懂北角 在哪里 哈哈哈 @梁侃 另,我们广东人认为广东以北都系北方 **2.有的情况是:没有@字符,只有对方用户名,但大多这种情况,是英文的用户名:** Chiu Alice 怎么可以这样 Su Chung 香港街头乱七八糟 如何匹配?筛选出来,然后用“Username”替换掉
使用正则表达式匹配一段json字符串中是否有包含的字符
打比方,下面是我要匹配的字符串,规则是取出 #号后到"号前的字符串中的逗号(,) ``` {"10#a,a":"aaa", "11#d,a":"ada", "12#dd,asa": "da"} ``` 下面是我写出来的正则: ``` /((?<=#).*?(?="))/g ``` 效果图: ![图片说明](https://img-ask.csdn.net/upload/201912/14/1576298940_327242.png) 我现在能匹配到#号到"号的区间中的任意字符,我尝试将正则改变如下: ``` /((?<=#),(?="))/g ``` 匹配失败,望求各位大神救救我 =============分割线=============== 尝试了以下方法 ``` /((?<=#).*?,.*?(?="))/g ``` ``` /((?<=#).*?\,.*?(?="))/g ``` ``` /((?<=#).*?[,].*?(?="))/g ``` 三种方式的效果图:![图片说明](https://img-ask.csdn.net/upload/201912/14/1576312921_660230.png)
关于Python正则表达式的问题
如题,我想要匹配开头为b的字符串是这么写: rex = re.compile('^b.*') 那我想要匹配开头为a或b或c的该怎么写呢?
关于python正则表达式的问题
<!-- <td class="report1_2" style="color:#00A7D1;" onmouseover="report1416700over()" colspan="2"> **30** </td> <td class="report1_2" style="color:#00A7D1;"> **安阳** </td> <td class="report1_2" style="color:#00A7D1;"> **2013-12-30** </td> <td class="report1_2" style="color:#00A7D1;" onmouseover="report1416700over()">82</td> <td class="report1_2" style="color:#00A7D1;"> **可吸入颗粒物** </td> <td class="report1_2" style="color:#00A7D1;"> **Ⅱ** </td> <td class="report1_2" style="color:#00A7D1;"> **良** </td> --> 原始字符串如上,想要匹配每个标签中的内容,即粗体部分的信息。 代码如下: onmouseover="report1416700over()" colspan="2">1</td>' p=re.compile('<td class="report1_2 .+>(.*)</td>') m = p.match(html)【注】此处的html即为上面的原始字符串 为什么有部分内容匹配不出来?正确的写法应该是怎么样的?
python正则表达式求助
![图片说明](https://img-ask.csdn.net/upload/201811/06/1541492634_210594.jpg) ![图片说明](https://img-ask.csdn.net/upload/201811/06/1541492861_995335.jpg) 我想实现把以下格式的字符串全部转为空格: (非字母)数字(非字母) 只有满足上述条件的才会转为空格,但最后的结果老是不对,比如sadf11,总会把11给删掉。 求助各位,怎么解决?谢谢
Python 如何用正则表达式只保留字符串中汉字和换行符?
如题,要对一个文本进行处理,想到正则表达式应该可以但是不是很会,求大神指点一下
现有一串字符 o/u \d +/- o/u \d +/-, 如何使用正则表达式去除字符串中的oi + ui+
举个例子吧, 有一串字符 h1-o1-u1-o2-u2-v1+, 我想要去除o1-u1-, 因为o和u的下标都一样,也就是1,他们的正负号也一样,都是负号。我想要去除所有符合这个规则的字符,正则表达式该怎么写呢?
python中正则表达式不能匹配
想要在网页源码中匹配字符串 目标字符串 <tr><td><span class='cpp file-ico'></span><a class='read-able r-file-name'' href='/read/185551/signal.cpp__html' title='点击可预览文件内容'>signal.cpp<i></i></a></td><td>1.04 kB</td><td>26-08-04 22:01</td></tr> 想要匹配的字符串 /read/185551/signal.cpp__html 匹配规则是 /read/\d+/\w+.\w+_html 但是用re.match没有结果,在线测试有匹配,这是怎么回事啊? 系统是ubuntu16.04,python2.7 ![![图片说明](https://img-ask.csdn.net/upload/201607/09/1468063727_783379.png)图片说明](https://img-ask.csdn.net/upload/201607/09/1468063720_903934.png)
正则表达式匹配问题
现有字符串aa[b]aabbbccsdcdscs[/b]dd 能不能一条正则匹配得到aadd。。
如何用正则表达式提取所有符合「介于两个特定字符串a和b之间」这一条件的内容?
例如有这样一段文本(无标点符号): > 请问您的姓名是什么姓名张三对吗 现在需要提取姓名,即"张三"。需要提取的姓名,位于"姓名"和"对"这两个固定的字符串之间,故使用以下正则表达式规则: ``` (?<=姓名)(.*?)(?=对) ``` 提取结果只有一条,如下: > 是什么姓名张三 请问怎样的正则表达式可以完整地返回以下两个结果: > 是什么姓名张三 > 张三
python 正则表达式替换的问题 re.sub
要求: 查找字符串str中紧挨着‘-’后的两个数字字符,将其替换为99. 比如str = 'adbc33df-23djk'; 要求将23替换成99. 我试了str1 = re.sub('-/d/d', '99', str); print str1; 结果会将‘-23’一起替换为99. 我试着参照perl的做法,加上圆括号: str1 = re.sub('-(/d/d)', '99', str); print str1; 照样不行。 哪位大神指导下? 感觉python在正则表达式上不及perl好用
Python如何判断一个字符串是否一个字典中存在的英文单词?
Python如何判断一个字符串是否一个字典中存在的英文单词?(这个字典指的是牛津字典那种英文字典) 就是处理文本时要过滤垃圾数据,只保留有意义的单词,过滤掉无意义的字符串。 初始 ``` list = ['recommend', 'muuj', 'survey', 'wtsbw'] ``` 过滤后 ``` list = ['recommend', 'survey'] ``` 求教!
python中计算表达式值时候,如何简答的提取表达式中的数字
python中计算表达式值时候,如何简答的提取表达式中的数字 举个例子,字符串str="2+4.5*6.887-4.5/3.56" 用for循环读取字符串中的字符,如果字符是数字,用一个函数提取其中的浮点数 比如,读到第一个6的时候直接提取6.887这个数字,把数字压入栈中,然后循环变量 到‘-’号
正则表达式 如何匹配带特殊符号的文本
例如这样的一段字符串a = ('/song?id=407039065', '【全明星】巴啦啦小魔仙'),如果我想匹配出【全明星】巴啦啦小魔仙这几个字样,应该如何写pattern
正则表达式的相关问题,我实在不会了,555
比如说我要匹配 1.first 2.second second 3.third 用字符串表示就是1.first\n2.second\nsecond\n3.third\n, 怎么匹配成["1.first\n", "2.second\nsecond\n", "3.third\n"] 谢谢谢谢
相见恨晚的超实用网站
相见恨晚的超实用网站 持续更新中。。。
爬虫福利二 之 妹子图网MM批量下载
爬虫福利一:27报网MM批量下载 点击 看了本文,相信大家对爬虫一定会产生强烈的兴趣,激励自己去学习爬虫,在这里提前祝:大家学有所成! 目标网站:妹子图网 环境:Python3.x 相关第三方模块:requests、beautifulsoup4 Re:各位在测试时只需要将代码里的变量path 指定为你当前系统要保存的路径,使用 python xxx.py 或IDE运行即可。 ...
字节跳动视频编解码面经
三四月份投了字节跳动的实习(图形图像岗位),然后hr打电话过来问了一下会不会opengl,c++,shador,当时只会一点c++,其他两个都不会,也就直接被拒了。 七月初内推了字节跳动的提前批,因为内推没有具体的岗位,hr又打电话问要不要考虑一下图形图像岗,我说实习投过这个岗位不合适,不会opengl和shador,然后hr就说秋招更看重基础。我当时想着能进去就不错了,管他哪个岗呢,就同意了面试...
开源一个功能完整的SpringBoot项目框架
福利来了,给大家带来一个福利。 最近想了解一下有关Spring Boot的开源项目,看了很多开源的框架,大多是一些demo或者是一个未成形的项目,基本功能都不完整,尤其是用户权限和菜单方面几乎没有完整的。 想到我之前做的框架,里面通用模块有:用户模块,权限模块,菜单模块,功能模块也齐全了,每一个功能都是完整的。 打算把这个框架分享出来,供大家使用和学习。 为什么用框架? 框架可以学习整体...
源码阅读(19):Java中主要的Map结构——HashMap容器(下1)
HashMap容器从字面的理解就是,基于Hash算法构造的Map容器。从数据结构的知识体系来说,HashMap容器是散列表在Java中的具体表达(并非线性表结构)。具体来说就是,利用K-V键值对中键对象的某个属性(默认使用该对象的“内存起始位置”这一属性)作为计算依据进行哈希计算(调用hashCode方法),然后再以计算后的返回值为依据,将当前K-V键值对在符合HashMap容器构造原则的基础上,放置到HashMap容器的某个位置上,且这个位置和之前添加的K-V键值对的存储位置完全独立,不一定构成连续的存储
c++制作的植物大战僵尸,开源,一代二代结合游戏
此游戏全部由本人自己制作完成。游戏大部分的素材来源于原版游戏素材,少部分搜集于网络,以及自己制作。 此游戏为同人游戏而且仅供学习交流使用,任何人未经授权,不得对本游戏进行更改、盗用等,否则后果自负。目前有六种僵尸和六种植物,植物和僵尸的动画都是本人做的。qq:2117610943 开源代码下载 提取码:3vzm 点击下载--&gt; 11月28日 新增四种植物 统一植物画风,全部修...
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它是一个过程,是一个不断累积、不断沉淀、不断总结、善于传达自己的个人见解以及乐于分享的过程。
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
Python——画一棵漂亮的樱花树(不同种樱花+玫瑰+圣诞树喔)
最近翻到一篇知乎,上面有不少用Python(大多是turtle库)绘制的树图,感觉很漂亮,我整理了一下,挑了一些我觉得不错的代码分享给大家(这些我都测试过,确实可以生成) one 樱花树 动态生成樱花 效果图(这个是动态的): 实现代码 import turtle as T import random import time # 画樱花的躯干(60,t) def Tree(branch, ...
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 free -m 其中:m表示兆,也可以用g,注意都要小写 Men:表示物理内存统计 total:表示物理内存总数(total=used+free) use...
Python 基础(一):入门必备知识
Python 入门必备知识,你都掌握了吗?
深度学习图像算法在内容安全领域的应用
互联网给人们生活带来便利的同时也隐含了大量不良信息,防范互联网平台有害内容传播引起了多方面的高度关注。本次演讲从技术层面分享网易易盾在内容安全领域的算法实践经验,包括深度...
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发...
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 演示地点演示 html代码如下` music 这个年纪 七月的风 音乐 ` 然后就是css`*{ margin: 0; padding: 0; text-decoration: none; list-...
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。
数据库优化 - SQL优化
以实际SQL入手,带你一步一步走上SQL优化之路!
2019年11月中国大陆编程语言排行榜
2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下: 编程语言比例 rank pl_ percentage 1 java 33.62% 2 cpp 16.42% 3 c_sharp 12.82% 4 javascript 12.31% 5 python 7.93% 6 go 7.25% 7 p...
通俗易懂地给女朋友讲:线程池的内部原理
餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”
经典算法(5)杨辉三角
写在前面: 我是 扬帆向海,这个昵称来源于我的名字以及女朋友的名字。我热爱技术、热爱开源、热爱编程。技术是开源的、知识是共享的。 这博客是对自己学习的一点点总结及记录,如果您对 Java、算法 感兴趣,可以关注我的动态,我们一起学习。 用知识改变命运,让我们的家人过上更好的生活。 目录一、杨辉三角的介绍二、杨辉三角的算法思想三、代码实现1.第一种写法2.第二种写法 一、杨辉三角的介绍 百度
腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹?
昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔者又发现有网友吐槽了一道腾讯的面试题,我们一起来看看。 腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹? 在互联网职场论坛,一名程序员发帖求助到。二面腾讯,其中一个算法题:64匹...
面试官:你连RESTful都不知道我怎么敢要你?
干货,2019 RESTful最贱实践
为啥国人偏爱Mybatis,而老外喜欢Hibernate/JPA呢?
关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。 声明:本文不会下关于Mybatis和JPA两个持久层框架哪个更好这样的结论。只是摆事实,讲道理,所以,请各位看官勿喷。 一、事件起因 关于Mybatis和JPA孰优孰劣的问题,争论已经很多年了。一直也没有结论,毕竟每个人的喜好和习惯是大不相同的。我也看...
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
致 Python 初学者
欢迎来到“Python进阶”专栏!来到这里的每一位同学,应该大致上学习了很多 Python 的基础知识,正在努力成长的过程中。在此期间,一定遇到了很多的困惑,对未来的学习方向感到迷茫。我非常理解你们所面临的处境。我从2007年开始接触 python 这门编程语言,从2009年开始单一使用 python 应对所有的开发工作,直至今天。回顾自己的学习过程,也曾经遇到过无数的困难,也曾经迷茫过、困惑过。开办这个专栏,正是为了帮助像我当年一样困惑的 Python 初学者走出困境、快速成长。希望我的经验能真正帮到你
Python 编程实用技巧
Python是一门很灵活的语言,也有很多实用的方法,有时候实现一个功能可以用多种方法实现,我这里总结了一些常用的方法,并会持续更新。
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,
程序员:我终于知道post和get的区别
IT界知名的程序员曾说:对于那些月薪三万以下,自称IT工程师的码农们,其实我们从来没有把他们归为我们IT工程师的队伍。他们虽然总是以IT工程师自居,但只是他们一厢情愿罢了。 此话一出,不知激起了多少(码农)程序员的愤怒,却又无可奈何,于是码农问程序员。 码农:你知道get和post请求到底有什么区别? 程序员:你看这篇就知道了。 码农:你月薪三万了? 程序员:嗯。 码农:你是怎么做到的? 程序员:
"狗屁不通文章生成器"登顶GitHub热榜,分分钟写出万字形式主义大作
前言 GitHub 被誉为全球最大的同性交友网站,……,陪伴我们已经走过 10+ 年时间,它托管了大量的软件代码,同时也承载了程序员无尽的欢乐。 上周给大家分享了一篇10个让你笑的合不拢嘴的Github项目,而且还拿了7万+个Star哦,有兴趣的朋友,可以看看, 印象最深刻的是 “ 呼吸不止,码字不停 ”: 老实交代,你是不是经常准备写个技术博客,打开word后瞬间灵感便秘,码不出字? 有什么
推荐几款比较实用的工具,网站
1.盘百度PanDownload 这个云盘工具是免费的,可以进行资源搜索,提速(偶尔会抽风????) 不要去某站买付费的???? PanDownload下载地址 2.BeJSON 这是一款拥有各种在线工具的网站,推荐它的主要原因是网站简洁,功能齐全,广告相比其他广告好太多了 bejson网站 3.二维码美化 这个网站的二维码美化很好看,网站界面也很...
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU
相关热词 c# plc s1200 c#里氏转换原则 c# 主界面 c# do loop c#存为组套 模板 c# 停掉协程 c# rgb 读取图片 c# 图片颜色调整 最快 c#多张图片上传 c#密封类与密封方法
立即提问