我想要对如下的表按照file-name字段去重后,再统计file-size的和。
我查到了去重常用的distinct方法,但是只能去重,不能进行统计,如下图。
然后我又查到查重统计的方法,通过group by 和having,但是也不太符合我的要求,如下图所示。
另外,不能删除库内的数据,所以也不能删掉重复数据后查询。
根据图一中的数据,我如果进行统计file-size的话,应该是7k,而不是15k。
请问,对于去重统计的需求,应该用什么方法呢?
我想要对如下的表按照file-name字段去重后,再统计file-size的和。
我查到了去重常用的distinct方法,但是只能去重,不能进行统计,如下图。
然后我又查到查重统计的方法,通过group by 和having,但是也不太符合我的要求,如下图所示。
另外,不能删除库内的数据,所以也不能删掉重复数据后查询。
根据图一中的数据,我如果进行统计file-size的话,应该是7k,而不是15k。
请问,对于去重统计的需求,应该用什么方法呢?
select sum(tt.file_size) from (select distinct(file_name),file_size from data_source) tt