df['人气']=df['人气'].astype(float)
df=pd.read_excel(r'd:\a4.xls')
df=df.set_index ('人气')
plt.rcParams['font.sans-serif'] = ['SimHei']
df.plot(kind='bar')
plt.show()
数据框画图时,爬的数据有一项是183万的人气,正则应该怎么去除
df['人气']=df['人气'].astype(float)
df=pd.read_excel(r'd:\a4.xls')
df=df.set_index ('人气')
plt.rcParams['font.sans-serif'] = ['SimHei']
df.plot(kind='bar')
plt.show()
数据框画图时,爬的数据有一项是183万的人气,正则应该怎么去除
可以这样写,示例:
import pandas as pd
df=pd.DataFrame({'number':[1,2,3,4],'value':['123人','456万人','789万','']})
print(df.info())
#df.value=df.value.apply(lambda x:re.sub('[^\d]+',"",x))
df.value = df.value.replace('[^\d]+', "",regex=True).replace("",0).astype(int)
print(df)
运行结果:
number value
0 1 123
1 2 456
2 3 789
3 4 0