带眼镜的老鹰 2021-10-26 17:31 采纳率: 66.7%
浏览 805
已结题

Python中pandas怎么实现分组去重统计和求和

原数据:

img

想要的结果:

img

sql实现逻辑:

select 
大区,
count(distinct  用户编码)  as 用户数,
count(distinct  订单编码)  as 订单数,
sum(数量) as 数量,
sum(金额) as 金额
from order_table
group by  大区

我现在想到的是Python方法是分别计算,然后进行组合:

df1 = order_table.groupby('大区')['数量','金额'].sum()
df2 = order_table.groupby('大区')['用户编码','订单编码'].unique()

result = pd.merge( df1 , df2 ,how = 'left' ,on = '大区')

现在的问题Python有没有更简单的方法,直接用一个语句实现

  • 写回答

3条回答 默认 最新

  • 我叫啥呢 2021-10-26 18:07
    关注
        result = order_able.groupby('大区').agg({'数量': 'sum', '金额': 'sum', '用户编码': 'unique', '订单编码': 'unique'})
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 11月3日
  • 已采纳回答 10月26日
  • 创建了问题 10月26日

悬赏问题

  • ¥50 深度学习运行代码直接中断
  • ¥15 关于#单片机#的问题,请各位专家解答!
  • ¥15 关于#单片机#的问题,请各位专家解答!
  • ¥20 需要完整的共散射点成像代码
  • ¥15 编写vba代码实现数据录入工作
  • ¥15 做过TCL海信电视小米电视相关影视会员软件私我
  • ¥15 Mapreduce是正常的,在运行其他jar包时并没有任何问题,只是在做LogCount.jar 时出的问题。如图所示
  • ¥15 ImportError: DLL load failed while importing _iterative: 找不到指定的模块。
  • ¥15 如何通过交互分析得出某高危患者对放疗获益更多
  • ¥15 相关性分析中,p<0.05, r=0.29,怎么评价相关性呢