普通网友 2026-01-04 20:05 采纳率: 98.2%

已采纳

如何用re.sub()替换字符串中所有数字为"*"?

如何使用 `re.sub()` 将字符串中的所有数字替换为星号 `"*"`？在文本处理中，常需对敏感信息或格式进行脱敏操作。例如，给定字符串 `"ID: 12345, Score: 678"`，希望将其中所有数字替换为 `"*"`，得到 `"ID: *****, Score: ***"`。虽然 `re.sub()` 支持正则表达式和替换功能，但初学者常困惑于如何正确编写匹配数字的模式。常见的疑问包括：应使用 `\d` 还是 `[0-9]`？是否需要考虑连续数字的整体匹配？替换时如何确保每个数字位都被单独替换为一个 `"*"`？掌握 `re.sub(r'\d', '*', text)` 的基本用法是关键，同时需理解原始写法为何可能遗漏多位数的逐位替换问题。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

舜祎魂 2026-01-04 20:05

关注

使用 `re.sub()` 将字符串中的所有数字替换为星号

在文本处理、日志脱敏、数据隐私保护等场景中，常常需要将敏感信息如身份证号、电话号码、分数等数字内容进行模糊化处理。Python 的 re 模块提供了强大的正则表达式功能，其中 re.sub() 是实现字符串替换的核心工具之一。

1. 基础用法：匹配单个数字并替换

最直接的方式是使用正则表达式 \d 来匹配任意一个数字字符（0-9），然后将其替换为星号 *。

import re

text = "ID: 12345, Score: 678"
result = re.sub(r'\d', '*', text)
print(result)  # 输出: ID: *****, Score: ***

上述代码中：

r'\d' 是原始字符串表示的正则模式，匹配任意单个数字。
'*' 是替换字符串，每个匹配到的数字都被替换为一个星号。
由于 \d 每次只匹配一个字符，因此连续的多位数会被逐位替换，正好满足“每位变一个星号”的需求。

2. \d 与 [0-9]：选择哪个更合适？

开发者常纠结于使用 \d 还是 [0-9]。虽然两者在 ASCII 范围内效果相同，但存在细微差别：

特性	\d	[0-9]
匹配范围	Unicode 数字字符（如阿拉伯数字、中文数字等）	仅限 ASCII 0-9
性能	略慢（因支持 Unicode）	更快
可读性	高	中
推荐场景	通用文本处理	严格控制输入格式时

对于大多数脱敏任务，建议使用 \d，因其语义清晰且兼容性好。

3. 高级技巧：使用回调函数动态替换

若需根据数字内容执行不同逻辑（如保留首位、按长度生成特定符号），可传入替换函数：

def replace_digit(match):
    return '*' * len(match.group())

result = re.sub(r'\d+', replace_digit, text)

此方式适用于复杂脱敏策略，例如部分隐藏手机号：138****1234。

4. 常见误区分析

初学者容易犯以下错误：

使用 r'\d+' 并替换为单个 '*'，导致整个数字被替换成一个星号。
忽略原始字符串中可能包含负号或小数点，造成不完整匹配。
未使用原始字符串（raw string），导致反斜杠转义问题。

正确做法是确保每次只匹配一个数字位，或通过分组控制替换粒度。

5. 扩展应用：构建通用脱敏流水线

graph TD A[原始文本] --> B{是否含数字?} B -- 是 --> C[re.sub(r'\\d', '*', text)] B -- 否 --> D[返回原字符串] C --> E[输出脱敏结果] D --> E

该流程可用于日志系统、API 响应过滤器等生产环境，结合其他规则（如掩码邮箱、IP 地址）形成完整的数据脱敏中间件。

6. 性能考量与优化建议

在高并发或大数据量场景下，正则替换可能成为瓶颈。优化建议包括：

预编译正则表达式：pattern = re.compile(r'\d')
避免重复调用 re.sub()，批量处理文本流。
考虑使用 str.translate() 对纯 ASCII 数字进行极速替换。

# 使用 translate 实现超高速替换（仅限单字符映射）
translator = str.maketrans('0123456789', '**********')
fast_result = text.translate(translator)

此方法在某些场景下比正则快 5-10 倍。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

python字符串替换re.sub()实例解析
2020-09-18 00:15

其中，`re.sub()`函数是最常用的用于替换字符串中的指定模式的功能。本文将详细介绍`re.sub()`的用法，并通过多个实例来帮助读者更好地理解和掌握这一强大的工具。 #### 二、re.sub()函数简介 `re.sub()`函数的主要...
Python正则替换字符串函数re.sub用法示例
2020-09-21 10:56

### Python正则替换字符串函数re.sub用法详解在Python编程语言中，处理文本和字符串是一项常见的任务。正则表达式作为一种强大的文本处理工具，在Python中的应用极为广泛。`re.sub`函数作为Python标准库`re`模块的...
python re.sub()替换正则的匹配内容方法
2020-09-19 00:20

其中`re.sub()`是一个非常实用的功能，它可以帮助我们根据正则表达式来替换字符串中的某些部分。本文将详细介绍`re.sub()`的基本用法及其高级应用，并通过实例演示如何灵活运用此功能。 #### 二、`re.sub()`基本...
python re.sub替换单词_Python 实现英语单词统计和替换
2020-12-17 21:17

weixin_39952182的博客 Python 实现英语单词统计和替换def count_en(a, word):index = 0times = 0len_str = len(a)len_word = len(word)while True:index = a.find(word, index)if index == -1:break#判断是否为第一个词if index !...
python清除字符串里非数字字符的方法
2020-09-21 22:19

- **re.sub()**: 替换字符串中所有匹配的部分。 #### 三、清除字符串里的非数字字符为了清除字符串中的非数字字符，我们可以使用`re.sub()`函数。该函数的基本语法为： ```python re.sub(pattern, repl, string,...
正则表达式re.sub替换不完整的问题现象及其根本原因
2018-08-27 23:43

weixin_34362991的博客问题描述问题的起因来自于一段正则替换。为了从一段HTML代码里面提取出正文，去掉所有的HTML标签和属性，可以写一个Python函数： ...复制代码这段代码的使用了正则表达式的替换功能re.sub。这个函...
详解Python3中字符串中的数字提取方法
2020-09-21 11:15

利用正则表达式可以非常灵活地查找或替换字符串中的特定模式。 **1.2 使用 `re.sub()` 替换非数字字符** `re.sub()` 函数的基本语法如下： ```python re.sub(pattern, repl, string, count=0, flags=0) ``` - **...
python正则表达式语法 python正则表达式元字符 1. 查找字符串中所有的数字 2. 替换字符串中的特定模式 3. 分割字符串 注意事项——《跟老吕学Python编程》
2024-04-23 00:46

Python老吕的博客这些只是正则表达式的一些基本用法，实际上正则表达式还有许多高级特性和技巧。掌握正则表达式可以帮助我们更加高效地处理文本数据，提高编程效率。...正则表达式是一种用于字符串匹配的强大工具，Python中的。
对python 中re.sub,replace(),strip()的区别详解
2020-09-19 00:20

在Python编程语言中，字符串处理是一项非常常见的任务。对于数据清洗、文本分析等工作而言，熟练掌握字符串操作技巧至关重要。本文旨在深入探讨`re.sub`、`replace()`与`strip()`这三个常用方法的区别及其应用场景，...
将字符串中符合规则的元素替换为指定元素 re.sub()
2023-10-31 06:54

刘经纬老师的博客期待大家提出宝贵改进建议，互相交流，收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址)，刘经纬老师共享知识相关文件下载地址为：...将字符串中符合规则的元素。A选项：hello***
python re.sub_详解Python中re.sub--转载
2020-11-22 20:54

weixin_39975261的博客其中就包括re.sub，实现正则的替换。功能很强大，所以导致用法稍微有点复杂。所以当遇到稍微复杂的用法时候，就容易犯错。所以此处，总结一下，在使用re.sub的时候，需要注意的一些事情。解释具体的注意事项...
Python re模块的sub()方法：高效替换字符串
2023-10-06 09:38

星光璀抱的博客在Python的re模块中，sub()方法是一个强大而灵活的函数，用于在字符串中执行替换操作。...在上述示例中，我们使用re.sub()方法将字符串中的"World"替换为"Python"，并将结果存储在new_string变量中。
Python字符串仅替换首次出现字符的实用方法
2025-07-14 14:25

首先，我们可以通过使用Python内置的`replace()`方法来替换字符串中的特定子串。这个方法接收两个参数，第一个是需要被替换的子串，第二个是用于替换的新子串。`replace()`方法会遍历整个字符串，将所有匹配到的子串...
python的re模块替换文件字符串_python 正则 re模块(详细版)
2020-12-08 13:31

weixin_39622217的博客正则表达式是对字符串(包括普通字符(例如，a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串...
re.sub()用法详解[项目代码]
2025-11-12 17:00

re.sub()函数正是该模块中的一个核心函数，专门用于替换字符串中符合正则表达式模式的部分。 re.sub()函数的基本格式为：re.sub(pattern, repl, string, count=0, flags=0)。其中，pattern参数表示正则表达式的模式...
【Python编程】基于re模块的正则表达式处理：字符串匹配与操作功能详解及应用实例给定的规范
2025-07-02 12:39

4. re.sub()函数：它用于替换字符串中所有匹配正则表达式的部分。这个函数非常适用于进行文本的批量修改。除了上述几个核心函数之外，re模块还支持许多其他功能，比如编译正则表达式、使用正则表达式进行分割等。 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月4日