淳于磊 2022-03-21 10:56 采纳率: 50%
浏览 61
已结题

如何用pandas进行双索引数据的条件分组计算?

import pandas as pd
import numpy as np

dict = {
    '店名': ['1店', '2店', '1店', '3店', '1店', '2店', '3店', '3店', '2店', '2店', '1店', '3店'],
    '姓名': ['张三', '李四', '王五', '赵六', '张三', '李四', '赵六', '乔七', '李四', '李四', '王五', '乔七'],
    '销售额': [200, 150, 200, 300, 200, 300, 500, 100, 90, 500, 400, 200],
}

达到下面这个表格的效果

店名姓名销售额大于200的数量销售额大于300的数量
1店张三--
-王五--
2店李四--
3店赵六--
-乔七--
  • 写回答

3条回答 默认 最新

  • 陈年椰子 2022-03-21 15:03
    关注
    
    import pandas as pd
    import numpy as np
    
    dict = {
        '店名': ['1店', '2店', '1店', '3店', '1店', '2店', '3店', '3店', '2店', '2店', '1店', '3店'],
        '姓名': ['张三', '李四', '王五', '赵六', '张三', '李四', '赵六', '乔七', '李四', '李四', '王五', '乔七'],
        '销售额': [200, 150, 200, 300, 200, 300, 500, 100, 90, 500, 400, 200],
    }
    
    df1 = pd.DataFrame(dict)
    # print(df1)
    df1['销售额大于200的数量'] = df1['销售额'].apply(lambda x : 1 if x>200 else 0)
    df1['销售额大于300的数量'] = df1['销售额'].apply(lambda x : 1 if x>300 else 0)
    # print(df1)
    
    df2 = df1[['店名','姓名','销售额大于200的数量','销售额大于300的数量']]
    
    df3 = df2.groupby(['店名','姓名']).sum()
    print(df3)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 3月29日
  • 已采纳回答 3月21日
  • 修改了问题 3月21日
  • 创建了问题 3月21日

悬赏问题

  • ¥15 ecplise在连接数据库时显示加载驱动成功但是数据库连接失败
  • ¥15 visionmaster启动失败,提示为“机器不满足授权而被禁用”
  • ¥50 用logisim设计16位单时钟周期cpu
  • ¥15 IDEA中圈复杂度如何具体设置
  • ¥50 labview采集不了数据
  • ¥15 请上面代码做什么处理或什么混淆
  • ¥15 英雄联盟自定义房间置顶
  • ¥15 W5500网线插上无反应
  • ¥15 如何用字典的Key,显示在WPF的xaml中
  • ¥15 weautomate读取Excel表格信息然后填写到网页一直报错,如何解决?