淳于磊 2022-03-21 10:56 采纳率: 50%
浏览 61
已结题

如何用pandas进行双索引数据的条件分组计算?

import pandas as pd
import numpy as np

dict = {
    '店名': ['1店', '2店', '1店', '3店', '1店', '2店', '3店', '3店', '2店', '2店', '1店', '3店'],
    '姓名': ['张三', '李四', '王五', '赵六', '张三', '李四', '赵六', '乔七', '李四', '李四', '王五', '乔七'],
    '销售额': [200, 150, 200, 300, 200, 300, 500, 100, 90, 500, 400, 200],
}

达到下面这个表格的效果

店名姓名销售额大于200的数量销售额大于300的数量
1店张三--
-王五--
2店李四--
3店赵六--
-乔七--
  • 写回答

3条回答 默认 最新

  • 陈年椰子 2022-03-21 15:03
    关注
    
    import pandas as pd
    import numpy as np
    
    dict = {
        '店名': ['1店', '2店', '1店', '3店', '1店', '2店', '3店', '3店', '2店', '2店', '1店', '3店'],
        '姓名': ['张三', '李四', '王五', '赵六', '张三', '李四', '赵六', '乔七', '李四', '李四', '王五', '乔七'],
        '销售额': [200, 150, 200, 300, 200, 300, 500, 100, 90, 500, 400, 200],
    }
    
    df1 = pd.DataFrame(dict)
    # print(df1)
    df1['销售额大于200的数量'] = df1['销售额'].apply(lambda x : 1 if x>200 else 0)
    df1['销售额大于300的数量'] = df1['销售额'].apply(lambda x : 1 if x>300 else 0)
    # print(df1)
    
    df2 = df1[['店名','姓名','销售额大于200的数量','销售额大于300的数量']]
    
    df3 = df2.groupby(['店名','姓名']).sum()
    print(df3)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 3月29日
  • 已采纳回答 3月21日
  • 修改了问题 3月21日
  • 创建了问题 3月21日

悬赏问题

  • ¥15 如何用stata画出文献中常见的安慰剂检验图
  • ¥15 c语言链表结构体数据插入
  • ¥40 使用MATLAB解答线性代数问题
  • ¥15 COCOS的问题COCOS的问题
  • ¥15 FPGA-SRIO初始化失败
  • ¥15 MapReduce实现倒排索引失败
  • ¥15 ZABBIX6.0L连接数据库报错,如何解决?(操作系统-centos)
  • ¥15 找一位技术过硬的游戏pj程序员
  • ¥15 matlab生成电测深三层曲线模型代码
  • ¥50 随机森林与房贷信用风险模型