问题遇到的现象和发生背景
如上图,怎么用python 的pandas 把这些数值按正确的格式修正,我有几百个这样的表,每个表里部分列的部分单元格内容都出现了这种错误,我想导入pandas里批量修正。
如上图,怎么用python 的pandas 把这些数值按正确的格式修正,我有几百个这样的表,每个表里部分列的部分单元格内容都出现了这种错误,我想导入pandas里批量修正。
import pandas as pd
import os
file_list=os.listdir()
try:
os.makedirs('./out')
except:
pass
for file in file_list:
if os.path.splitext(file)[1].lower()=='.xlsx':
try:
df = pd.read_excel(file)
df['税额']=df['税额'].str.extract(r'"¥(.*)"')
df.to_excel(f'./out/{os.path.splitext(file)[0]}_changed.xlsx', index=None)
except:
pass
所有excel放在同一个文件夹就能用,自动转化在out文件夹内并重新命名。