luzhiweireus 2022-02-11 11:01 采纳率: 75%
浏览 55
已结题

pandas中使用groupby()函数对文本数据进行分类汇总时出现的问题

我现在excel中有全国大学的名称,对应的招生专业(一个单元格可能一个专业,也可能多个专业),和对应的选科要求(例如不限、必选物理、必选物理和化学等等),我现在需要将这三个标签的数据按照学校名称和选科要求进行分组汇总他们的招生专业,如果直接对groupby对象使用sum()函数的话,每个单元格的招生专业就会不带任何符号连接在一起,怎么实现每个单元格招生专业汇总在一起时用顿号(、)连接在一起呢?

  • 写回答

1条回答 默认 最新

  • 此人真菜 2022-02-11 13:12
    关注
    df=pd.DataFrame({'idx':[1,1,2],'a':['张三','李四','wangwu'],'b':['张三','李','wangwu'],'c':['张三','李四','wangwu']})
    df=df.set_index('idx').applymap(lambda x:f'、{x}')
    df=df.groupby('idx').sum().replace(r'、(.*)',r'\1',regex=True)
    

    思路是先把所有的元素变成、开头,可以用applymap或者relpalce,groupyby之后再把开头的、a去掉。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 2月22日
  • 已采纳回答 2月14日
  • 创建了问题 2月11日

悬赏问题

  • ¥15 做个有关计算的小程序
  • ¥15 MPI读取tif文件无法正常给各进程分配路径
  • ¥15 如何用MATLAB实现以下三个公式(有相互嵌套)
  • ¥30 关于#算法#的问题:运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题 求各位帮我解答一下
  • ¥15 setInterval 页面闪烁,怎么解决
  • ¥15 如何让企业微信机器人实现消息汇总整合
  • ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
  • ¥15 如何用Python爬取各高校教师公开的教育和工作经历
  • ¥15 TLE9879QXA40 电机驱动
  • ¥20 对于工程问题的非线性数学模型进行线性化