jkshen8 2023-03-13 16:54 采纳率: 50%
浏览 26
已结题

Python里pandas库如何实现:根据某一类数据作为索引,将另一列数据剔除重复数据用/连接

在pandas里如何实现以下功能:

img

根据上面图片内容,得到下面图片内容.利用'字母'列作为索引,将'备注'列内容剔除重复值用/连接,新数据放在'合并'列

img

初始代码示例如下:

img

  • 写回答

2条回答 默认 最新

  • 以山河作礼。 新星计划导师 2023-03-13 17:14
    关注

    该回答调用gpt:
    可以使用Pandas库的groupby()和apply()方法来实现根据某一列数据作为索引,将另一列数据剔除重复数据用/连接的功能。示例代码如下:

    import pandas as pd
    
    # 创建一个DataFrame示例
    df = pd.DataFrame({
        'A': ['a', 'a', 'b', 'b', 'c', 'c'],
        'B': [1, 2, 3, 3, 4, 5]
    })
    
    # 使用groupby()方法根据'A'列分组,并使用apply()方法处理'B'列数据
    result = df.groupby('A')['B'].apply(lambda x: '/'.join(x.drop_duplicates().astype(str)))
    
    # 输出结果
    print(result)
    

    在这个示例代码中,首先创建了一个DataFrame示例,其中包含两列数据'A'和'B'。然后使用groupby()方法根据'A'列数据进行分组,并使用apply()方法对每个组中的'B'列数据进行处理,将重复的数据剔除,并用/连接。最后将结果存储在一个Series对象中,并输出结果。

    输出结果为:

    A
    a       1/2
    b         3
    c    4/5.0
    Name: B, dtype: object
    

    在输出结果中,每个组的结果都被存储在一个字符串中,并以/连接。如果有多个重复的数据,只会保留一个,并将其他的数据剔除。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月21日
  • 已采纳回答 3月13日
  • 创建了问题 3月13日

悬赏问题

  • ¥15 想用@vueuse 把项目动态改成深色主题,localStorge里面的vueuse-color-scheme一开始就给我改成了dark,不知道什么原因(相关搜索:背景颜色)
  • ¥20 OPENVPN连接问题
  • ¥15 flask实现搜索框访问数据库
  • ¥15 mrk3399刷完安卓11后投屏调试只能显示一个设备
  • ¥100 如何用js写一个游戏云存档
  • ¥15 ansys fluent计算闪退
  • ¥15 有关wireshark抓包的问题
  • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
  • ¥15 向数据表用newid方式插入GUID问题
  • ¥15 multisim电路设计