SharkQL 2021-08-30 20:04 采纳率: 75%
浏览 143
已结题

为什么group by多了一个条件后,count(*)总数变多了?

用的hive
本来是select A,B,count()as C
group by A,B from X
现在想加一列D
select A,B,count(
) as C,D
From X
group by A,B,D
为什么两个count(*)as C 跑出来的 总数会不一样呢?因为多了一个分组D,我理解每个C项会变 但总的加起来应该不变啊?
如果想保证C的总量不变,加上相应的D 应该如何添加呢?
求解!万分感谢!

  • 写回答

1条回答 默认 最新

  • CSDN专家-sinJack 2021-08-30 20:08
    关注

    变多是因为你分组更深了,所以组数会越多。
    你想加上另外的字段,可以用关联查询。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 9月1日
  • 已采纳回答 8月30日
  • 创建了问题 8月30日