怎么用python re模块匹配问号?

现在我用

 re.sub("?", "", some_string)

然后报错

 Traceback (most recent call last):
  File "insert_mysql.py", line 338, in <module>
    main()
  File "insert_mysql.py", line 255, in main
    f_1 = re.sub("?", "", f_0)
  File "/usr/lib/python2.7/re.py", line 155, in sub
    return _compile(pattern, flags).sub(repl, string, count)
  File "/usr/lib/python2.7/re.py", line 251, in _compile
    raise error, v # invalid expression
sre_constants.error: nothing to repeat

不知道怎么解决了,大神们快出手~

然后加了原生符

 re.sub(r"?", "", some_string)

还是不行

2个回答

 问号需要转义,用\?

仅供参考

 '''针对字符串去除标点符号,[\s+\.\!\/_,$%^*(+\"\']+|'''
def SubPunctuation(str):
    s = re.sub(u"[+——!,。?、~@#¥%……&*()::¶]+", u"",str)
    return s
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python re 字符串匹配问题

#coding=utf-8 import requests import re html = requests.get('http://tieba.baidu.com/f?ie=utf-8&kw=python&fr=search') # html = requests.get('http://jp.tingroom.com/yuedu/yd300p/') # html.encoding = 'utf-8' # print html.text lastreponder = re.findall('最后回复人:(.*?)">',html.text,re.S) for each in lastreponder: print each 代码如上 网页部分源代码如下:title="最后回复人:黄哥python培训"> 即: '最后回复人:(.*?)">'与"最后回复人:黄哥python培训">匹配不起来, 试过加\在"前,也是不行,求助下,谢谢!

python使用re模块提取列表中对应字段

list=["\r\r\n 双流市场设备维修员(百事可乐) "] 列表如上,需要将其中 双流市场设备维修员(百事可乐)这一部分提取出来,使用re.match来进行提取,请问应该如何书写,请知道的告诉下谢谢

python re正则表达式,怎么匹配一段字符中间 的部分,已知头尾

例如:12\<34\<123456>123 需要输出的结果是<>中间的 123456 一开始我是这么写的 re.findall(<(.*?)>) 但是输出的结果是 34\<123456 应该怎么写才能正确获取到<>中的数据呢 刚学python 爬虫,求大佬指路

一个python的re匹配的疑惑

目的是匹配中文,代码是下面这样的: ```python re_zh = re.compile('([\u4E00-\u9FA5]+)') sent = u'这个东西真心很赞;啊哈哈' for s in re_zh.split(sent): s = s.strip() if not s: print 'not s:' + s continue if re_zh.match(s): print 'match s:' + s else: print 'not match s:' + s ``` 输出如下: ``` not match s:这个东西真心很赞 match s:; not match s:啊哈哈 ``` 我的疑惑是re_zh.match(s)这里,为什么中文匹配失败,‘;’反而成功了

python 正则如何多次匹配?

例如abc1abc2abc3abc re.findall('abc\w*?abc','abc1abc2abc3abc',re.I) 结果为['abc1abc', 'abc3abc'] 怎么把abc2abc也提取出来?

python 正则匹配 有重叠区时只能匹配到第一个 如何能将所有符合条件的都匹配到???

python 正则匹配 有重叠区时只能匹配到第一个 如何能将所有符合条件的都匹配到,示例如下 >>> a='GGGTCCC' >>> re.findall('GG.{2}CC',a) ['GGGTCC'] >>> 如何才能将两个符合条件的(即['GGGTCC']和['GGTCCC'])都匹配到

python正则匹配一个html中的几个url

在一个网页中匹配出如下的几个url,从url开始匹配不是从href开始匹配 href="http://redirect.wangpansou.cn/redirect.php?url=http%3A%2F%2Fpan.baidu.com%2Fshare%2Flink%3Fuk%3D2803502175%26shareid%3D3310887851%26third%3D0" href="http://redirect.wangpansou.cn/redirect.php?url=http%3A%2F%2Fpan.baidu.com%2Fshare%2Fhome%3Fuk%3D981206555%26view%3Dshare" href="http://redirect.wangpansou.cn/redirect.php?url=http%3A%2F%2Fpan.baidu.com%2Fshare%2Flink%3Fuk%3D1075874930%26shareid%3D3128951413%26third%3D0" python的正则表达式应该怎么写?求大神啊!就结了好久了.

python正则匹配有关汉字的问题

match=re.findall('''<a href=".*?">未来的人</a>''',unicodePage,re.S)。 怎样才能匹配,需要找到所有未来的人所有链接

python 正则表达式 匹配指定单词前几个单词

``` import re text = "May we stop to remember the 2,996 people that died & the more than 6000 injured on #September11" m = re.findall(r"\bdied|injured\b", text) if m: print(m) else: print('not match') ``` 我 想匹配的是died和injured包括他们前面3个单词,包括数字,主要是需要数字,这个该如何填写呢?

python正则表达式,匹配到了不希望匹配的东西,但不知道原因

import re r=re.compile(r'/re\s[\dt\d,?]+\srpl\d') r.search('/re 5t10,11t55,58t62,88,67t77 rpl2') 输出:<_sre.SRE_Match object; span=(0, 34), match='/re 5t10,11t55,58t62,88,67t77 rpl2'> 我的重点主要是放在该字符串中间的重复部分,例如5t10,11t55,58t62等,也就是前后两个数字夹中间一个t的、后面再跟个逗号——这个结构可以重复很多次。这个表达式我写出来了,但是我不知道中间那个纯数字88为什么可以匹配成功,它中间又没有t,凭什么会被匹配到?我实在是想不明白,我的代码明明写的就是 \dt\d,两个数字中间一个t,怎么就会有纯数字可以匹配到呢?

在python中如何使用正则的分组,进行匹配?

**使用的是python3** ![图片说明](https://img-ask.csdn.net/upload/201706/16/1497604538_745758.png) ![图片说明](https://img-ask.csdn.net/upload/201706/16/1497604547_74087.png) ![图片说明](https://img-ask.csdn.net/upload/201706/16/1497604873_139846.png) 我觉得应该是这个 imglist = re.findall(imgre,html) 语法不对 谁知道正确的语法是什么 哪位大神能帮改下 ``` import re import urllib.request def getHtml(url): page = urllib.request.urlopen(url) html = page.read() return html def getImg(html): reg1 = r'<img src="([\s\S]*?)" data-baiduimageplus-ignore="1">' g0 = re.search(reg1,html).group(0) print(g0) # reg = r'src="([.*\S]*\.jpg)" pic_ext="jpeg"' # imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglist html = getHtml("http://huaban.com/") html = html.decode("UTF-8") imgList = getImg(html) imgName = 0 for imgPath in imgList: f = open("pic/"+str(imgName)+".jpg","wb") print(imgPath) f.write((urllib.request.urlopen(imgPath)).read()) f.close() imgName +=1 print("All done") ``` 有了一点进展 网上有人说用search 我找了一个demo,并修改了我的代码 ![图片说明](https://img-ask.csdn.net/upload/201706/16/1497605588_142995.png) 但是还是报错 ![图片说明](https://img-ask.csdn.net/upload/201706/16/1497605730_46782.png)

python 正则匹配读取本地文件

下了一堆html,命名都是数字,想用正则匹配并挨个读取解析 于是,只能写到这里 ``` import re #重点在这里 #---------------------------------------------- files = re.findall(r'\d+\.html',这里咋写) #后面打算这样 for file in files: html = open(file,'r',encoding='utf-8') #---------------------------------------------- #现在只能这样 for i in range(0,49999): try: html = open(str(i)+'.html','r',encoding='utf-8') except: continue ``` 这里咋写哪里咋写 啊啊啊。。。

python正则表达式匹配反斜杠

本意是把地址里那个讨厌的反斜杠变成斜杠,但是用replace函数换掉反斜杠的时候总是会把反斜杠后面的a一起给替换掉,所以想用正则表达式匹配出/,再把匹配到的位置上的反斜杠换掉,但是运行后会报错或匹配不到。 ``` import re str="D:/icnet/data/cityscape/leftImg8bit/train\aachen" print(re.search("\\",str,re.I)) ``` ![图片说明](https://img-ask.csdn.net/upload/201905/01/1556708146_332676.png) ``` import re str="D:/icnet/data/cityscape/leftImg8bit/train\aachen" print(re.search(r"\\",str,re.I)) ``` ![图片说明](https://img-ask.csdn.net/upload/201905/01/1556708161_719300.png) 我又尝试匹配\加任意一个字母的模式(因为除了这条还有很多其他地址,反斜杠后跟的字母都不一样)但是无论用“\\.”或者元字符的r“\.”都匹配不到\a,请问问题到底出在哪里呢? ``` import re str="D:/icnet/data/cityscape/leftImg8bit/train\aachen" print(re.search("\\.",str,re.I)) ``` ![图片说明](https://img-ask.csdn.net/upload/201905/01/1556708276_635323.png)

python中用正则去匹配多个div嵌套的时候,需要这样来写正则表达式

<div class="tabbox1"> <dl> <dt> <div class="dt-div1">评测项目</div> <div class="dt-div2">成绩</div> <div class="dt-div3">排名</div> </dt> <dd> <div class="dd-div1">加速(0-100公里/小时)</div> <div class="dd-div2">9.01秒</div> <div class="dd-div3"><a target='_blank' href='//www.autohome.com.cn/channel2/bestauto/list.aspx?type=1#591'>591</a></div> </dd> <dd> <div class="dd-div1">刹车(100-0公里/小时)</div> <div class="dd-div2">39.69米</div> <div class="dd-div3"><a target='_blank' href='//www.autohome.com.cn/channel2/bestauto/list.aspx?type=2#519'>519</a></div> </dd> <dd> <div class="dd-div1">实测油耗(升/100公里)</div> <div class="dd-div2">9.5升</div> <div class="dd-div3"><a target='_blank' href='//www.autohome.com.cn/channel2/bestauto/list.aspx?type=3#572'>572</a></div> </dd> </dl> </div> 要求:需要这样来写正则才能匹配到这整个div

python3正则表达式匹配字符串时,能不能不匹配字符串中间的某个子字符串

我的正则reg = r'((?=src=).*?\.jpg)' 已经匹配出的字符串: https://img3.doubanio.com/f/shire/a1fdee122b95748d81cee426d717c05b5174fe96/pics/blank.gif" **data-origin**="https://img3.doubanio.com/icon/g28131-1.jpg 但我要的是 data-origin 后面的.jpg的url 请问正则应该怎么做

python3.4正则匹配HTML问题

![图片说明](https://img-ask.csdn.net/upload/201507/22/1437534263_193683.png) <span style="color: #ff0000;">2014年 井[4.4GB]:The.Last.Survivors.2014.720p.BluRay.x264-RUSTED</span> <span style="color: #ff0000;">不知道怎么下载请看这里===></span> 我写的正则是:<span.*?style="color.*?ff0000.*?">(.*?)</span> 第二个内容(不知道怎么下载请看这里===)可以匹配出,但是我不要它。 两个表达式的嵌套标签一样。 正则该怎么写?最好可以只匹配出 2014年 井[4.4GB] 冒号 后面的内容

python 提升匹配效率的问题

用列表1(set集合) 匹配 列表2内元素(有重复元素),然后将列表1内每个元素对应列表2的索引集合组合成字典,但我发现一但·行数达到几十万条时后,匹配效率太低,匹配次数为len(列表1)*len(列表2).,,请问下有各位老大没有什么好的方法提升效率,或者有没有其他实现方法,怎么实现或者修改?。下面举个栗子: ``` def CellIndexDict(cells,cell_list): """根据cells列表内的清单,匹配出cell_list列表内所在的索引,制成字典{cell:[indexhub]} """ allcellindexDict={} for c in cells: indexlist=[i+1 for i,v in enumerate(cell_list) if v==c] allcellindexDict[c]=indexlist#单个小区索引集合 return allcellindexDict cells=["a","aa","aaa","b","bb","bbb","c","cc","ccc"] cell_lists=["a","aa","aaa","b","bb","bbb","c","cc","ccc"]*1000000 ```

python正则表达式匹配

我想匹配文件中所有 (NN 单词) (NN 单词),示例程序如下: import re pattern2 = re.compile('(NN [a-z]+)') it = re.finditer(pattern2, '(NN computer) (NN database)') for match in it: print match.group() 此程序可以找到(NN computer)、(NN database)这两个匹配。 可如果换成pattern2 = re.compile('(NN [a-z]+) (NN [a-z]+)'),就无法匹配(NN computer) (NN database)。这是为什么?

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

程序员请照顾好自己,周末病魔差点一套带走我。

程序员在一个周末的时间,得了重病,差点当场去世,还好及时挽救回来了。

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

搜狗输入法也在挑战国人的智商!

故事总是一个接着一个到来...上周写完《鲁大师已经彻底沦为一款垃圾流氓软件!》这篇文章之后,鲁大师的市场工作人员就找到了我,希望把这篇文章删除掉。经过一番沟通我先把这篇文章从公号中删除了...

总结了 150 余个神奇网站,你不来瞅瞅吗?

原博客再更新,可能就没了,之后将持续更新本篇博客。

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

优雅的替换if-else语句

场景 日常开发,if-else语句写的不少吧??当逻辑分支非常多的时候,if-else套了一层又一层,虽然业务功能倒是实现了,但是看起来是真的很不优雅,尤其是对于我这种有强迫症的程序"猿",看到这么多if-else,脑袋瓜子就嗡嗡的,总想着解锁新姿势:干掉过多的if-else!!!本文将介绍三板斧手段: 优先判断条件,条件不满足的,逻辑及时中断返回; 采用策略模式+工厂模式; 结合注解,锦...

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

2020阿里全球数学大赛:3万名高手、4道题、2天2夜未交卷

阿里巴巴全球数学竞赛( Alibaba Global Mathematics Competition)由马云发起,由中国科学技术协会、阿里巴巴基金会、阿里巴巴达摩院共同举办。大赛不设报名门槛,全世界爱好数学的人都可参与,不论是否出身数学专业、是否投身数学研究。 2020年阿里巴巴达摩院邀请北京大学、剑桥大学、浙江大学等高校的顶尖数学教师组建了出题组。中科院院士、美国艺术与科学院院士、北京国际数学...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

当HR压你价,说你只值7K,你该怎么回答?

当HR压你价,说你只值7K时,你可以流畅地回答,记住,是流畅,不能犹豫。 礼貌地说:“7K是吗?了解了。嗯~其实我对贵司的面试官印象很好。只不过,现在我的手头上已经有一份11K的offer。来面试,主要也是自己对贵司挺有兴趣的,所以过来看看……”(未完) 这段话主要是陪HR互诈的同时,从公司兴趣,公司职员印象上,都给予对方正面的肯定,既能提升HR的好感度,又能让谈判气氛融洽,为后面的发挥留足空间。...

面试:第十六章:Java中级开发(16k)

HashMap底层实现原理,红黑树,B+树,B树的结构原理 Spring的AOP和IOC是什么?它们常见的使用场景有哪些?Spring事务,事务的属性,传播行为,数据库隔离级别 Spring和SpringMVC,MyBatis以及SpringBoot的注解分别有哪些?SpringMVC的工作原理,SpringBoot框架的优点,MyBatis框架的优点 SpringCould组件有哪些,他们...

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

《Oracle Java SE编程自学与面试指南》最佳学习路线图2020年最新版(进大厂必备)

正确选择比瞎努力更重要!

《Oracle Java SE编程自学与面试指南》最佳学习路线图(2020最新版)

正确选择比瞎努力更重要!

都前后端分离了,咱就别做页面跳转了!统统 JSON 交互

文章目录1. 无状态登录1.1 什么是有状态1.2 什么是无状态1.3 如何实现无状态1.4 各自优缺点2. 登录交互2.1 前后端分离的数据交互2.2 登录成功2.3 登录失败3. 未认证处理方案4. 注销登录 这是本系列的第四篇,有小伙伴找不到之前文章,松哥给大家列一个索引出来: 挖一个大坑,Spring Security 开搞! 松哥手把手带你入门 Spring Security,别再问密...

字节跳动面试官竟然问了我JDBC?

轻松等回家通知

面试官:你连SSO都不懂,就别来面试了

大厂竟然要考我SSO,卧槽。

阿里面试官让我用Zk(Zookeeper)实现分布式锁

他可能没想到,我当场手写出来了

终于,月薪过5万了!

来看几个问题想不想月薪超过5万?想不想进入公司架构组?想不想成为项目组的负责人?想不想成为spring的高手,超越99%的对手?那么本文内容是你必须要掌握的。本文主要详解bean的生命...

自从喜欢上了B站这12个UP主,我越来越觉得自己是个废柴了!

不怕告诉你,我自从喜欢上了这12个UP主,哔哩哔哩成为了我手机上最耗电的软件,几乎每天都会看,可是吧,看的越多,我就越觉得自己是个废柴,唉,老天不公啊,不信你看看…… 间接性踌躇满志,持续性混吃等死,都是因为你们……但是,自己的学习力在慢慢变强,这是不容忽视的,推荐给你们! 都说B站是个宝,可是有人不会挖啊,没事,今天咱挖好的送你一箩筐,首先啊,我在B站上最喜欢看这个家伙的视频了,为啥 ,咱撇...

代码注释如此沙雕,会玩还是你们程序员!

某站后端代码被“开源”,同时刷遍全网的,还有代码里的那些神注释。 我们这才知道,原来程序员个个都是段子手;这么多年来,我们也走过了他们的无数套路… 首先,产品经理,是永远永远吐槽不完的!网友的评论也非常扎心,说看这些代码就像在阅读程序员的日记,每一页都写满了对产品经理的恨。 然后,也要发出直击灵魂的质问:你是尊贵的付费大会员吗? 这不禁让人想起之前某音乐app的穷逼Vip,果然,穷逼在哪里都是...

2020春招面试了10多家大厂,我把问烂了的数据库事务知识点总结了一下

2020年截止目前,我面试了阿里巴巴、腾讯、美团、拼多多、京东、快手等互联网大厂。我发现数据库事务在面试中出现的次数非常多。

立即提问
相关内容推荐