问题遇到的现象和发生背景
我需要用python进行分组,分组是基于变量名称的第一个单词
比如下图表格中的情况:
我要把开头都是Apple的分为一组,开头都是baby的分为另一组,同时表格中的变量要保持不变,还要将同组中的B列值求和。我想要的效果大概如下:
我是尝试了用groupby和split函数。split函数先把首词分开,首词创建一个新列,然后基于新列用group.sum()求和,结果就不是我上面想要的效果了。代码如下:
Shipmanager_full_number['Shipmanager 2'] = Shipmanager_full_number['Shipmanager']
Shipmanager_full_number['Shipmanager 2'] = Shipmanager_full_number['Shipmanager 2'].str.split(' ', n=1, expand=True)
Shipmanager_full_number
Shipmanager_alias_number = Shipmanager_full_number.groupby('Shipmanager 2', as_index=False).sum()
想请教一下该怎么实现想要的效果呢?