jkshen8 2023-03-13 16:54 采纳率: 50%
浏览 26
已结题

Python里pandas库如何实现:根据某一类数据作为索引,将另一列数据剔除重复数据用/连接

在pandas里如何实现以下功能:

img

根据上面图片内容,得到下面图片内容.利用'字母'列作为索引,将'备注'列内容剔除重复值用/连接,新数据放在'合并'列

img

初始代码示例如下:

img

  • 写回答

2条回答 默认 最新

  • 以山河作礼。 新星计划导师 2023-03-13 17:14
    关注

    该回答调用gpt:
    可以使用Pandas库的groupby()和apply()方法来实现根据某一列数据作为索引,将另一列数据剔除重复数据用/连接的功能。示例代码如下:

    import pandas as pd
    
    # 创建一个DataFrame示例
    df = pd.DataFrame({
        'A': ['a', 'a', 'b', 'b', 'c', 'c'],
        'B': [1, 2, 3, 3, 4, 5]
    })
    
    # 使用groupby()方法根据'A'列分组,并使用apply()方法处理'B'列数据
    result = df.groupby('A')['B'].apply(lambda x: '/'.join(x.drop_duplicates().astype(str)))
    
    # 输出结果
    print(result)
    

    在这个示例代码中,首先创建了一个DataFrame示例,其中包含两列数据'A'和'B'。然后使用groupby()方法根据'A'列数据进行分组,并使用apply()方法对每个组中的'B'列数据进行处理,将重复的数据剔除,并用/连接。最后将结果存储在一个Series对象中,并输出结果。

    输出结果为:

    A
    a       1/2
    b         3
    c    4/5.0
    Name: B, dtype: object
    

    在输出结果中,每个组的结果都被存储在一个字符串中,并以/连接。如果有多个重复的数据,只会保留一个,并将其他的数据剔除。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月21日
  • 已采纳回答 3月13日
  • 创建了问题 3月13日

悬赏问题

  • ¥15 Mac系统vs code使用phpstudy如何配置debug来调试php
  • ¥15 目前主流的音乐软件,像网易云音乐,QQ音乐他们的前端和后台部分是用的什么技术实现的?求解!
  • ¥60 pb数据库修改与连接
  • ¥15 spss统计中二分类变量和有序变量的相关性分析可以用kendall相关分析吗?
  • ¥15 拟通过pc下指令到安卓系统,如果追求响应速度,尽可能无延迟,是不是用安卓模拟器会优于实体的安卓手机?如果是,可以快多少毫秒?
  • ¥20 神经网络Sequential name=sequential, built=False
  • ¥16 Qphython 用xlrd读取excel报错
  • ¥15 单片机学习顺序问题!!
  • ¥15 ikuai客户端多拨vpn,重启总是有个别重拨不上
  • ¥20 关于#anlogic#sdram#的问题,如何解决?(关键词-performance)