jkshen8 2023-03-13 08:54 采纳率: 50%
浏览 26
已结题

Python里pandas库如何实现:根据某一类数据作为索引,将另一列数据剔除重复数据用/连接

在pandas里如何实现以下功能:

img

根据上面图片内容,得到下面图片内容.利用'字母'列作为索引,将'备注'列内容剔除重复值用/连接,新数据放在'合并'列

img

初始代码示例如下:

img

  • 写回答

2条回答 默认 最新

  • 以山河作礼。 新星计划导师 2023-03-13 09:14
    关注

    该回答调用gpt:
    可以使用Pandas库的groupby()和apply()方法来实现根据某一列数据作为索引,将另一列数据剔除重复数据用/连接的功能。示例代码如下:

    import pandas as pd
    
    # 创建一个DataFrame示例
    df = pd.DataFrame({
        'A': ['a', 'a', 'b', 'b', 'c', 'c'],
        'B': [1, 2, 3, 3, 4, 5]
    })
    
    # 使用groupby()方法根据'A'列分组,并使用apply()方法处理'B'列数据
    result = df.groupby('A')['B'].apply(lambda x: '/'.join(x.drop_duplicates().astype(str)))
    
    # 输出结果
    print(result)
    

    在这个示例代码中,首先创建了一个DataFrame示例,其中包含两列数据'A'和'B'。然后使用groupby()方法根据'A'列数据进行分组,并使用apply()方法对每个组中的'B'列数据进行处理,将重复的数据剔除,并用/连接。最后将结果存储在一个Series对象中,并输出结果。

    输出结果为:

    A
    a       1/2
    b         3
    c    4/5.0
    Name: B, dtype: object
    

    在输出结果中,每个组的结果都被存储在一个字符串中,并以/连接。如果有多个重复的数据,只会保留一个,并将其他的数据剔除。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
    jkshen8 2023-03-13 09:53

    感谢感谢,还是得加强基础知识的学习和记忆,灵活运用

    回复
查看更多回答(1条)
编辑
预览

报告相同问题?

问题事件

  • 系统已结题 3月20日
  • 已采纳回答 3月13日
  • 创建了问题 3月13日
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部