Pandas如何处理excel列中数据?
比如a列省份值为:
中国
2安徽
3湖南
武汉
部分值前面有2和3这样的数据,还有一部分前面有空格,请问如何处理掉这些数字和空格,只保留省份这些汉字
Pandas如何处理excel列中数据?
比如a列省份值为:
中国
2安徽
3湖南
武汉
部分值前面有2和3这样的数据,还有一部分前面有空格,请问如何处理掉这些数字和空格,只保留省份这些汉字
可以用replace方法。
import pandas as pd
df=pd.DataFrame({'中国':['2安徽','3湖南',' 武汉']})
df['中国'].replace('\d+',' ',inplace=True,regex=True)
df['中国'].replace('\s+','',inplace=True,regex=True)
print(df)
print(df.loc[2,'中国'])