luzhiweireus 2022-02-11 11:01 采纳率: 75%
浏览 55
已结题

pandas中使用groupby()函数对文本数据进行分类汇总时出现的问题

我现在excel中有全国大学的名称,对应的招生专业(一个单元格可能一个专业,也可能多个专业),和对应的选科要求(例如不限、必选物理、必选物理和化学等等),我现在需要将这三个标签的数据按照学校名称和选科要求进行分组汇总他们的招生专业,如果直接对groupby对象使用sum()函数的话,每个单元格的招生专业就会不带任何符号连接在一起,怎么实现每个单元格招生专业汇总在一起时用顿号(、)连接在一起呢?

  • 写回答

1条回答 默认 最新

  • 此人真菜 2022-02-11 13:12
    关注
    df=pd.DataFrame({'idx':[1,1,2],'a':['张三','李四','wangwu'],'b':['张三','李','wangwu'],'c':['张三','李四','wangwu']})
    df=df.set_index('idx').applymap(lambda x:f'、{x}')
    df=df.groupby('idx').sum().replace(r'、(.*)',r'\1',regex=True)
    

    思路是先把所有的元素变成、开头,可以用applymap或者relpalce,groupyby之后再把开头的、a去掉。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 2月22日
  • 已采纳回答 2月14日
  • 创建了问题 2月11日

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料