Hive如何实现跨行两两分组相加?

我有这么一张 game 表..
想求两两分组三三分组四四分组时, AMT之和
例如

两两一组
  AB,(29.33+19.22)
  AC,(29.33+25.81)
.....
  BC,(19.22+25.81)
....
  CD,(25.81+16.79)
....
  EF,(20.78+25.32)

三三一组
    ABC,(29.33+19.22+25.81)
    ABD,(29.33+19.22+25.81)
   .....
    ACD,(29.33+25.81+16.79)
   .....
    BCD,(19.22+25.81+16.79)
   .....

剩下的四四一组就不写了..
可以不重复.. 比如说 BBC,(19.22+19.22+25.81)
注意.. 括号里面的是要结果.. 前面这列可以是其他别名

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

只是甲 2021-04-06 09:51

关注

-- 3个 
select t1.gname,t2.gname,t3.gname,concat(t1.gname,'+',t2.gname,'+',t3.gname,'=',t1.amt + t2.amt + t3.amt)
  from test_20210402 t1
 join test_20210402 t2
 join test_20210402 t3
 where t1.gname < t2.gname
   and t2.gname < t3.gname
order by t1.gname,t2.gname,t3.gname;


-- 4个
select t1.gname,t2.gname,t3.gname,t4.gname,concat(t1.gname,'+',t2.gname,'+',t3.gname,'+',t4.gname,'=',t1.amt + t2.amt + t3.amt + t4.amt)
  from test_20210402 t1
 join test_20210402 t2
 join test_20210402 t3
 join test_20210402 t4
 where t1.gname < t2.gname
   and t2.gname < t3.gname
   and t3.gname < t4.gname
order by t1.gname,t2.gname,t3.gname,t4.gname;

测试过程:

hive> 
    > 
    > select t1.gname,t2.gname,t3.gname,concat(t1.gname,'+',t2.gname,'+',t3.gname,'=',t1.amt + t2.amt + t3.amt)
    >   from test_20210402 t1
    >  join test_20210402 t2
    >  join test_20210402 t3
    >  where t1.gname < t2.gname
    >    and t2.gname < t3.gname
    > order by t1.gname,t2.gname,t3.gname;
Warning: Map Join MAPJOIN[13][bigTable=t1] in task 'Stage-1:MAPRED' is a cross product
Query ID = root_20210406094633_9629ee26-61a7-4407-a105-812b168a8d83
Total jobs = 2
Launching Job 1 out of 2
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapreduce.job.reduces=<number>
Running with YARN Application = application_1616576763401_0002
Kill Command = /opt/cloudera/parcels/CDH-6.3.1-1.cdh6.3.1.p0.1470567/lib/hadoop/bin/yarn application -kill application_1616576763401_0002
Hive on Spark Session Web UI URL: http://hp4:33610

Query Hive on Spark job[0] stages: [0]
Spark job[0] status = RUNNING
--------------------------------------------------------------------------------------
          STAGES   ATTEMPT        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  FAILED  
--------------------------------------------------------------------------------------
Stage-0 ........         0      FINISHED      2          2        0        0       0  
--------------------------------------------------------------------------------------
STAGES: 01/01    [==========================>>] 100%  ELAPSED TIME: 6.10 s     
--------------------------------------------------------------------------------------
Spark job[0] finished successfully in 6.10 second(s)
Spark Job[0] Metrics: TaskDurationTime: 5895, ExecutorCpuTime: 1005, JvmGCTime: 272, BytesRead / RecordsRead: 9028 / 12, BytesReadEC: 0, ShuffleTotalBytesRead / ShuffleRecordsRead: 0 / 0, ShuffleBytesWritten / ShuffleRecordsWritten: 0 / 0
Launching Job 2 out of 2
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapreduce.job.reduces=<number>
Running with YARN Application = application_1616576763401_0002
Kill Command = /opt/cloudera/parcels/CDH-6.3.1-1.cdh6.3.1.p0.1470567/lib/hadoop/bin/yarn application -kill application_1616576763401_0002
Hive on Spark Session Web UI URL: http://hp4:33610

Query Hive on Spark job[1] stages: [1, 2]
Spark job[1] status = RUNNING
--------------------------------------------------------------------------------------
          STAGES   ATTEMPT        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  FAILED  
--------------------------------------------------------------------------------------
Stage-1 ........         0      FINISHED      1          1        0        0       0  
Stage-2 ........         0      FINISHED      1          1        0        0       0  
--------------------------------------------------------------------------------------
STAGES: 02/02    [==========================>>] 100%  ELAPSED TIME: 2.02 s     
--------------------------------------------------------------------------------------
Spark job[1] finished successfully in 2.02 second(s)
Spark Job[1] Metrics: TaskDurationTime: 1160, ExecutorCpuTime: 834, JvmGCTime: 32, BytesRead / RecordsRead: 8646 / 6, BytesReadEC: 0, ShuffleTotalBytesRead / ShuffleRecordsRead: 302 / 20, ShuffleBytesWritten / ShuffleRecordsWritten: 302 / 20
OK
A       B       C       A+B+C=6
A       B       D       A+B+D=7
A       B       E       A+B+E=8
A       B       F       A+B+F=9
A       C       D       A+C+D=8
A       C       E       A+C+E=9
A       C       F       A+C+F=10
A       D       E       A+D+E=10
A       D       F       A+D+F=11
A       E       F       A+E+F=12
B       C       D       B+C+D=9
B       C       E       B+C+E=10
B       C       F       B+C+F=11
B       D       E       B+D+E=11
B       D       F       B+D+F=12
B       E       F       B+E+F=13
C       D       E       C+D+E=12
C       D       F       C+D+F=13
C       E       F       C+E+F=14
D       E       F       D+E+F=15
Time taken: 29.681 seconds, Fetched: 20 row(s)

hive> 
    > 
    > 
    > select t1.gname,t2.gname,t3.gname,t4.gname,concat(t1.gname,'+',t2.gname,'+',t3.gname,'+',t4.gname,'=',t1.amt + t2.amt + t3.amt + t4.amt)
    >   from test_20210402 t1
    >  join test_20210402 t2
    >  join test_20210402 t3
    >  join test_20210402 t4
    >  where t1.gname < t2.gname
    >    and t2.gname < t3.gname
    >    and t3.gname < t4.gname
    > order by t1.gname,t2.gname,t3.gname,t4.gname;
Warning: Map Join MAPJOIN[15][bigTable=t1] in task 'Stage-1:MAPRED' is a cross product
Query ID = root_20210406094947_0124d39d-d808-4510-b438-637a9d18c119
Total jobs = 2
Launching Job 1 out of 2
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapreduce.job.reduces=<number>
--------------------------------------------------------------------------------------
          STAGES   ATTEMPT        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  FAILED  
--------------------------------------------------------------------------------------
Stage-6 ........         0      FINISHED      3          3        0        0       0  
--------------------------------------------------------------------------------------
STAGES: 01/01    [==========================>>] 100%  ELAPSED TIME: 1.00 s     
--------------------------------------------------------------------------------------
Spark job[4] finished successfully in 1.00 second(s)
Spark Job[4] Metrics: TaskDurationTime: 501, ExecutorCpuTime: 139, JvmGCTime: 0, BytesRead / RecordsRead: 15855 / 18, BytesReadEC: 0, ShuffleTotalBytesRead / ShuffleRecordsRead: 0 / 0, ShuffleBytesWritten / ShuffleRecordsWritten: 0 / 0
Launching Job 2 out of 2
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapreduce.job.reduces=<number>
--------------------------------------------------------------------------------------
          STAGES   ATTEMPT        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  FAILED  
--------------------------------------------------------------------------------------
Stage-7 ........         0      FINISHED      1          1        0        0       0  
Stage-8 ........         0      FINISHED      1          1        0        0       0  
--------------------------------------------------------------------------------------
STAGES: 02/02    [==========================>>] 100%  ELAPSED TIME: 1.00 s     
--------------------------------------------------------------------------------------
Spark job[5] finished successfully in 1.01 second(s)
Spark Job[5] Metrics: TaskDurationTime: 231, ExecutorCpuTime: 92, JvmGCTime: 25, BytesRead / RecordsRead: 9623 / 6, BytesReadEC: 0, ShuffleTotalBytesRead / ShuffleRecordsRead: 265 / 15, ShuffleBytesWritten / ShuffleRecordsWritten: 265 / 15
WARNING: Spark Job[5] Spent 11% (25 ms / 231 ms) of task time in GC
OK
A       B       C       D       A+B+C+D=10
A       B       C       E       A+B+C+E=11
A       B       C       F       A+B+C+F=12
A       B       D       E       A+B+D+E=12
A       B       D       F       A+B+D+F=13
A       B       E       F       A+B+E+F=14
A       C       D       E       A+C+D+E=13
A       C       D       F       A+C+D+F=14
A       C       E       F       A+C+E+F=15
A       D       E       F       A+D+E+F=16
B       C       D       E       B+C+D+E=14
B       C       D       F       B+C+D+F=15
B       C       E       F       B+C+E+F=16
B       D       E       F       B+D+E+F=17
C       D       E       F       C+D+E+F=18
Time taken: 2.268 seconds, Fetched: 15 row(s)
hive>

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

Hive如何实现跨行两两分组相加? nosql sql
2021-03-31 14:53

回答 2 已采纳 -- 3个 select t1.gname,t2.gname,t3.gname,concat(t1.gname,'+',t2.gname,'+',t3.gname,'=',t1.amt + t2.
关于#hive#的问题，如何解决？ hive
2022-12-16 16:43

回答 2 已采纳你看一下MySQL的版本，如果是8，驱动需要修改一下 <property> <name>javax.jdo.option.ConnectionDriverNam
如何优化hive动态分区写入速度？ hadoop hive 大数据
2022-05-21 17:53

回答 1 已采纳查询最后加上distribute by ORDERDATEsort by ORDERDATE distribute by按照指定的字段将数据划分到不同的输出reduce中，可以保证每个reduce处理
大数据 hive 实战数据
2022-04-07 14:10

包含video user数据
关于#大数据#的问题，如何解决？ hive java 大数据
2023-02-21 09:58

回答 2 已采纳你去看一下这个job的日志报的什么错误
Hbase 和 hive 有什么区别？hive 与 hbase 的底层存储是什么？hive 是产生的原因是什么？habase 是为了弥补 hadoop 的什么缺陷? hadoop hbase hive 有问必答
2021-11-06 11:30

回答 1 已采纳 大数据之hadoop / hive / hbase 的区别是什么？有什么应用场景？_RunFromHere的博客-CSDN博客文章目录1
问一个hive查询方面的问题，如果字段里面存的是json字符串，hive可以根据这个查询么？ hadoop hive java json 大数据
2018-03-16 06:04

回答 1 已采纳 ``` select get_json_object('{"store":{"fruit":[{"weight":8,"type":"apple"},{"weight":9,"type":
大数据hive实现原理.zip_hive中怎么更新数据
2021-01-07 11:07

大数据hive实现原理.zip
大数据hive分区表导入数据的问题 hive 大数据
2018-01-07 12:34

回答 5 已采纳 http://blog.csdn.net/fjssharpsword/article/details/64919412
hive怎么拼接单引号 hive sql 大数据
2022-08-02 12:01

回答 7 已采纳不能用拼接，拼接之后用不了in，in是判断左边的字段是否在右边内容(集合)中，拼接的是一个字符串整体，不是集合。 SELECT sku_key,warehouse_key,SUM(quantity)
Hive如何获取一周前分区的数据？ hive sql
2022-06-14 09:52

回答 1 已采纳 select date_sub('2022-06-02',7) select date_sub(concat_ws('-','2022','6','2'),7) select day(date_sub
大数据面试题：说下为什么要使用Hive？Hive的优缺点？Hive的作用是什么？
2022-03-07 16:41

蓦然_的博客说下为什么要使用Hive？Hive的优缺点？Hive的作用是什么？
大数据平台和HiveSQL.md
2024-04-20 08:12

40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md40.大数据平台和HiveSQL.md...
什么是Hive？为什么要用Hive？
2022-10-14 16:59

我想去吃ya的博客 Hive一个可以将结构化的数据文件映射为一张数据库表并提供类SQL查询功能的数据仓库工具，而且它是基于Hadoop的。因此，从本质上来看，Hive是将SQL转换为。
大数据技术之Hive-v3.1.2.docx
2022-10-06 09:12

大数据技术之Hive-v3.1.2.docx大数据技术之Hive-v3.1.2.docx大数据技术之Hive-v3.1.2.docx大数据技术之Hive-v3.1.2.docx大数据技术之Hive-v3.1.2.docx大数据技术之Hive-v3.1.2.docx大数据技术之Hive-v3.1.2.docx...
没有解决我的问题, 去提问

悬赏问题

¥15 R语言Rstudio突然无法启动
¥15 关于#matlab#的问题：提取2个图像的变量作为另外一个图像像元的移动量，计算新的位置创建新的图像并提取第二个图像的变量到新的图像
¥15 改算法，照着压缩包里边，参考其他代码封装的格式写到main函数里
¥15 用windows做服务的同志有吗
¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法
¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值

码龄粉丝数原力等级 --

Hive如何实现跨行两两分组相加?

2条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

Hive如何实现跨行两两分组相加?

2条回答 默认 最新

悬赏问题

2条回答默认最新