学习 Python3 中正则表达式的一些疑惑。

在学习 Python3 中正则表达式时对于表达式前的 ’r' 的用法及替换规则产生了疑惑。

s = '汉字word'
s = re.sub('([\u4e00-\u9fa5]+)([0-9a-zA-Z]+)',r'\1',s)
print(s)
s = '汉字word'
s = re.sub('([\u4e00-\u9fa5]+)([0-9a-zA-Z]+)','\1',s)
print(s)

运行结果及报错内容

汉字

我的疑问如下：

‘r' 用来标记 rawstring，在 '\1'前加 ’r‘，难道不应该输出的结果是将匹配到的模式替换成 '\1'这个字符串吗？
'\1' 是引用一次所获取的匹配，将匹配到的内容替换成本身，输出结果不应该是 '汉字word' 本身不变吗？对于以上两次输出的结果都很困惑，恳请不吝讲解。谢谢！
希望能通过正则表达式实现匹配到 "汉字+英文数字" 的模式后在汉字和英文中间添加空格，应该如何实现呢？

再次感谢赐教。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
『Knight』 2022-08-02 11:42
关注
首先说说原始字符r的一些东西

print('\\n') # \n print(r'\n') # \n print('\n') # \n

从上面的代码可以知道python官方定义了很多具有特殊功能的东西比如换行的时候“\n”那我们如何使他们失去这些特殊的功能呢，这个时候就用r"\n"解决使它成为字符串意义上的\n。
再来说说r在正则表达式里面的一些东西

mm = "c:\\a\\b\\c" ret = re.match("c:\\\\", mm).group() # c:\\ print(ret) # print("c:\\") 所以最后输出c:\

ret = re.match("c:\\", mm).group()这行代码里面首先解释器看到了c:\\，我靠它就想""不是特殊字符----转义字符吗，如何两个\输出一个\吗所以最后拿去匹配的时候实际上是c:\,如何你保存为变量ret，接下来输出的时候也被去掉一个""最后输出c:\。而如果你换为一下这个代码

mm = "c:\\a\\b\\c" ret = re.match(r"c:\\", mm).group() # c:\\ print(ret) # c:

你只需要r"c:\"里面c:\就得出来了一样的结果。因为解释器运行到这里的时候发现了r""，然后它就知道里面的东西不要当作特殊符号对待，而应该直接拿去匹配。
好了回归正传你的问题
对于你的第一个问题r"\1"解释器看到这个会认为\1不是特殊字符，那就直接拿去匹配所以“\1”完好无损的到了，然后匹配的时候不是说与第一个分组（也就是第一个括号匹配吗）所以代表这个([\u4e00-\u9fa5]+)，然后sub的确是替换但是他是将s里面满足'([\u4e00-\u9fa5]+)([0-9a-zA-Z]+)'这部分的内容进行和\1替换，而\1分组的结果是([\u4e00-\u9fa5]+)，所以最后不就是将'([\u4e00-\u9fa5]+)([0-9a-zA-Z]+)'替换成([\u4e00-\u9fa5]+)这个了吗，那最后的结果可不就是只有汉字吗？

import re s = '汉字word' s = re.sub(r'([\u4e00-\u9fa5]+)([\da-zA-Z]+)', r'\1 \2', s) print(s)

这个是我写的可以满足你的需求的一个代码
输出：汉字 word
代码讲解：
匹配的时候分了两组，\1和\2分别对应([\u4e00-\u9fa5]+)和([\da-zA-Z]+)然后咱替换的时候用：\1+一个空格+\2不就相当于用([\u4e00-\u9fa5]+)空格([\da-zA-Z]+)去替换了([\u4e00-\u9fa5]+)和([\da-zA-Z]+)吗不就实现了效果吗
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python中正则表达式与模式匹配
2020-12-31 17:02

　在之前找工作过程中，面试时经常被问到会不会python，懂不懂正则表达式。心里想：软件的东西和芯片设计有什么关系？咱也不知道因为啥用这个，咱也不敢问啊！在网上搜索到了一篇关于脚本在ASIC领域中应用的文章...
Python中正则表达式详解
2020-10-19 20:36

### Python中正则表达式详解知识点 #### 正则表达式基础 正则表达式是一种强大的文本处理工具，它利用一套特殊的字符集来定义字符串的匹配规则。在Python中，`re`模块提供了对正则表达式的支持。使用正则表达式...
Python中正则表达式的工作原理及其应用
2024-11-25 17:32

内容概要：本文详细介绍了正则表达式的概念、常用元字符和量词的含义、正则表达式的边界匹配和字符类匹配方法，以及在Python中的实现和应用。文章通过具体的示例讲解了如何使用Python中的re模块进行匹配、查找、替换...
Python中正则表达式的用法总结
2020-10-17 08:57

正则表达式在文本处理方面具有极大的灵活性和实用性，掌握了Python中正则表达式的用法，对于进行字符串搜索、验证、转换等操作都将变得非常高效。这篇文章对Python中的正则表达式用法做了全面的总结，并给出了实用的...
编程新手必看，Python3中正则表达式知识点及语法学习总结（31）
2024-04-29 21:58

知识分享小能手的博客 正则表达式是一个特殊的字符序列，它能帮助你...re 模块使 Python 语言拥有完整的正则表达式功能。本章节主要介绍 Python 中常用的正则表达式处理函数，如果你对正则表达式不了解，可以查看我们的 正则表达式 - 教程。
Python中正则表达式使用的几种方法.zip
2024-11-17 09:16

Python是一种广泛使用的高级编程语言，其强大的功能之一是内置的正则表达式支持。正则表达式是一种用于匹配字符串中字符组合的模式，它提供了一种灵活且高效的方式来处理文本和数据。在Python中，与正则表达式相关的...
【Python编程】Python3正则表达式核心用法
2025-06-03 16:58

使用场景及目标：①掌握Python中正则表达式的各种用法，能够灵活应用于字符串匹配、搜索、替换和分割等任务；②理解正则表达式的语法细节，提升处理复杂文本模式的能力；③学习如何优化正则表达式的性能，确保程序...
python中正则表达式的使用详解
2020-10-25 08:33

例如，如果想提取IP地址，可以使用正则表达式(\d{1,3}\.){3}\d{1,3}来匹配四组由点号隔开的一到三位数字。这里每个括号包围的部分就是一个分组，可以通过分组的索引来引用匹配到的内容。有时候，文本处理任务不...
python中正则表达式 re.findall 用法
2020-10-17 20:16

以上就是本文对Python中正则表达式re模块的findall函数的介绍。通过理解和掌握re模块及其findall函数，开发者可以更有效地对文本进行搜索和处理，提高代码的灵活性和功能性。如果遇到任何问题，欢迎留言讨论，笔者会...
Python中正则表达式小结
2020-12-23 23:09

得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月2日

学习 Python3 中正则表达式的一些疑惑。

在学习 Python3 中正则表达式时对于表达式前的 ’r' 的用法及替换规则产生了疑惑。

运行结果及报错内容

2条回答 默认 最新

问题事件

2条回答默认最新