淳于磊 2022-03-20 21:23 采纳率: 50%
浏览 31
已结题

如何用pandas进行条件分组计算?

import pandas as pd
import numpy as np

dict = {
'姓名': ['张三','李四','王五','赵六'],
'1月':['100','150','200','300'],
'2月':['150','250','300','400'],
'3月':['200','250','300','500'],
'4月':['150','300','200','400'],
'5月':['200','100','300','200'],
'6月':['200','100','300','200'],
'7月':['200','100','300','200'],
}

上面这个如何进行分组计算达到下面这个表格的效果

姓名销售额大于200的月份数量销售额大于300的月份数量
张三--
李四--
王五--
赵六--
  • 写回答

2条回答 默认 最新

  • CSDN专家-HGJ 2022-03-20 22:04
    关注

    可这样操作:

    import pandas as pd
    import numpy as np
     
    dict = {
    '姓名': ['张三','李四','王五','赵六'],
    '1月':['100','150','200','300'],
    '2月':['150','250','300','400'],
    '3月':['200','250','300','500'],
    '4月':['150','300','200','400'],
    '5月':['200','100','300','200'],
    '6月':['200','100','300','200'],
    '7月':['200','100','300','200'],
    }
    df=pd.DataFrame(dict).set_index('姓名')
    df=df.astype(int)
    #print(df)
    df['销售额大于200的月份数量']=df[df>200].count(axis=1)
    df['销售额大于300的月份数量']=df[df>300].count(axis=1)
    df=df.iloc[:,[-2,-1]]
    print(df)
    

    运行结果:

    F:\2022\pythontest>t7
        销售额大于200的月份数量  销售额大于300的月份数量
    姓名
    张三              0              0
    李四              3              0
    王五              5              0
    赵六              4              3
    
    

    如有帮助,请点采纳。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月29日
  • 已采纳回答 3月21日
  • 修改了问题 3月20日
  • 创建了问题 3月20日

悬赏问题

  • ¥15 matlab中使用gurobi时报错
  • ¥15 WPF 大屏看板表格背景图片设置
  • ¥15 这个主板怎么能扩出一两个sata口
  • ¥15 不是,这到底错哪儿了😭
  • ¥15 2020长安杯与连接网探
  • ¥15 关于#matlab#的问题:在模糊控制器中选出线路信息,在simulink中根据线路信息生成速度时间目标曲线(初速度为20m/s,15秒后减为0的速度时间图像)我想问线路信息是什么
  • ¥15 banner广告展示设置多少时间不怎么会消耗用户价值
  • ¥16 mybatis的代理对象无法通过@Autowired装填
  • ¥15 可见光定位matlab仿真
  • ¥15 arduino 四自由度机械臂