小白编程笔记
2020-04-16 02:26
采纳率: 25%
浏览 148
已结题

求问大神python排序问题

有这样一个excel文件

abcd_1   41.39    1.00E-08
abcd_1   32.34    5.00E-08
abcd_1   32.34    5.00E-08
abcd_1   32.34    5.00E-08
abcd_2   45.56    5.00E-08
abcd_2   60.56    3.00E-08
abcd_2   32.53    5.00E-08
abcd_3   58.59    2.00E-08
abcd_3   60.65    1.00E-08
abcd_3   58.59    3.00E-08
abcd_4   34.00    2.00E-18
abcd_4   32.56    2.00E-11

第一列代表不同产品,(比如表中列的四个产品abcd_1,abcd_2,abcd_3,abcd_4),因为来自于不同仓库(数据中没用,就没有在表里列出来),所以名字会有相同。第2列代表评分1,该评分越高越好,第3列代表评分2,该评分越低越好。要根据这两个评分,找到每个产品下评分最优的那一行值,并输出为新的excel。

求问大神,python怎么根据产品名称分组,然后组内排序找到最好的一个,然后把每个产品最好的一个的那一行数据输出到新文件中呢?

  • 写回答
  • 好问题 提建议
  • 追加酬金
  • 关注问题
  • 邀请回答

2条回答 默认 最新

  • 正在学C++ 2020-04-16 11:21
    最佳回答
    import pandas as pd
    df = pd.read_excel('product.xlsx',names=['product','score1','score2'],header=None)
    df
    

    图片说明

    df = df.sort_values(by=['score1','score2'],ascending=[False,True])   #False表示降序排序
    df
    

    图片说明

    df = df.groupby('product',as_index=False).first()   
    # as_index=False表示使用原来的索引而不是以分组依据作为索引;first()表示保留第一个数据
    df
    

    图片说明

    df.to_csv(path_or_buf='result.csv',header=None,index=None)
    #headers = None(不保存列名)
    #index = None(不保存索引)
    

    图片说明
    如果对你有帮助,请采纳以鼓励。
    https://blog.csdn.net/qq_46523755/article/details/105553799

    评论
    解决 无用
    打赏 举报
查看更多回答(1条)

相关推荐 更多相似问题