问题遇到的现象和发生背景
我要将数据进行按照不同变量名分组
比如有a40,b23,c22,c123,
其实这是三个公司从c22和c123是同一个公司的不同名称
我就应该用groupby分三组,但是表格里有四个名称,直接用groupby就会是四组
我该怎么处理另个名字但其实代表一个意思的这种变量
我要将数据进行按照不同变量名分组
比如有a40,b23,c22,c123,
其实这是三个公司从c22和c123是同一个公司的不同名称
我就应该用groupby分三组,但是表格里有四个名称,直接用groupby就会是四组
我该怎么处理另个名字但其实代表一个意思的这种变量
可以这样操作:
import pandas as pd
df=pd.DataFrame({'name':['a40','b23','c22','c123'],'val':[100,110,120,130]})
a=df.groupby([x[0] for x in df['name']])['val'].sum()
print(a)
运行结果:
F:\2022>python -u "f:\2022\pythontest\t1.py"
a 100
b 110
c 250
Name: val, dtype: int64
如有帮助,请点采纳。