这段代码是我用来处理excel数据里面的非打印字符的,我的表格中会出现一个ascii码为28的文件分隔符,并且不会被替换掉,非常奇怪,不知道是否有人遇见过类似的情况。你们是如何解决的。
# 正则表达式模式,用于匹配非打印字符(ASCII 控制字符)
pattern = r'[\x00-\x1F\x7F]'
# 遍历所有工作表
for ws in all_worksheets:
# 遍历当前工作表的所有单元格并清洁数据
for row in ws.iter_rows():
for cell in row:
if cell.value:
# 将单元格值转换为字符串
cleaned_value = re.sub(pattern, '*', str(cell.value))
cell.value = cleaned_value