如何使用hive sql 取两个时间?(详见问题描述)

数据片段如下

需要求出红框中的间隔

id time 状态 102 2019-02-24 17:18:18 1 102 2019-02-24 17:23:19 1 102 2019-02-24 17:28:19 1 102 2019-02-24 17:33:20 1 102 2019-02-24 17:38:20 1 102 2019-02-24 17:43:21 0 102 2019-02-24 17:48:21 0 102 2019-02-24 17:53:22 0 102 2019-02-24 17:58:22 1 102 2019-02-24 18:03:23 1 102 2019-02-24 18:08:23 1 102 2019-02-24 18:13:24 1 102 2019-02-24 18:18:24 0 102 2019-02-24 18:23:24 0 102 2019-02-24 18:28:25 0 102 2019-02-24 18:33:25 0 102 2019-02-24 18:38:26 0 102 2019-02-24 18:43:26 1 102 2019-02-24 18:48:27 1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

Keifei 2019-02-27 16:09

关注

如果可以的话，我建议您用UDF更加方便，如果非要用hql呢，下面是我的想法

首先，这是我准备的测试数据，如图，当中，方便计算，我就把时间那一列改了成了‘天’的粒度。

然后，我增加一个自增序列的字段，别名是 num，如图

在这个基础上呢，我取出状态是‘0’的数据，如图

再在这个基础上，再增加一个自增序列字段，别名是 num2，如图

数据处理到这里，帅哥，你是否有一点想法了呢？
那我继续，再增加一个字段，别名是 groups，意为分组，逻辑就是 num - num2 ！如图

现在感觉怎么样？接下来就按照这个groups分组，取每组最大值和最小值相减，interval，完活！最后再来个图

drop table test190227;
create table test190227
(
id int,
time date,
state char(1)
);

set hive.exec.mode.local.auto=true;
insert into test190227 select 102,to_date('2019-02-24'),'1';
insert into test190227 select 102,to_date('2019-02-26'),'1';
insert into test190227 select 102,to_date('2019-02-27'),'1';
insert into test190227 select 102,to_date('2019-03-02'),'1';
insert into test190227 select 102,to_date('2019-03-04'),'0';
insert into test190227 select 102,to_date('2019-03-08'),'0';
insert into test190227 select 102,to_date('2019-03-11'),'0';
insert into test190227 select 102,to_date('2019-03-14'),'1';
insert into test190227 select 102,to_date('2019-03-19'),'1';
insert into test190227 select 102,to_date('2019-03-22'),'1';
insert into test190227 select 102,to_date('2019-03-23'),'1';
insert into test190227 select 102,to_date('2019-03-24'),'0';
insert into test190227 select 102,to_date('2019-03-25'),'0';
insert into test190227 select 102,to_date('2019-03-28'),'0';
insert into test190227 select 102,to_date('2019-03-29'),'0';
insert into test190227 select 102,to_date('2019-03-31'),'0';
insert into test190227 select 102,to_date('2019-04-05'),'1';
insert into test190227 select 102,to_date('2019-04-09'),'1';

SELECT
 t.id,
 t.state,
 t.groups,
 datediff(max(t.time), min(t.time)) INTERVAL
FROM
 (
  SELECT
   z.*, z.num - z.num2 groups
  FROM
   (
    SELECT
     p.*, row_number () over () num2
    FROM
     (
      SELECT
       a.*, row_number () over () num
      FROM
       test190227 a
      ORDER BY
       num DESC
     ) p
    WHERE
     p.state = '0' 
   ) z
 ) t
GROUP BY
 t.id,
 t.state,
 t.groups;

报告相同问题？

关注问题

Hive SQL问题，如何汇总当前日期所在月已经完成的总量？ hive python sql 有问必答
2021-10-11 20:14

回答 1 已采纳可以通过开窗函数sum() over (partition by xxx order by xxx )来实现，具体使用方法可以网上查下，有很多资料
hive sql 行列转置问题 hive sql 数据仓库有问必答
2022-01-15 13:24

回答 2 已采纳右边的6个列每2个列一组，加一个静态的职位字段，一共三个列，用union all拼接起来，再用字符串聚合把职位拼起来。这个方法应该是可用的。至于用lateral view explode进行行列转换的
hive编写sql命令查询统计百分比 hive mysql sql
2022-05-03 00:42

回答 2 已采纳首先两张表关联起来，然后计算Lenovo订单数量，再除以总数量就可以了 select (select count(1) from orders o join items i on o.item_id
大数据技术之Hive
2022-11-13 19:56

Red-P的博客干穿 Hive ，从概念到调优，零基础学Hive ，一篇就够
hive sql 使用问题 hive 有问必答
2022-01-04 17:07

回答 2 已采纳你第一个sql只是拼出一个字符串，并不是表名，当然不能直接代替表使用。像这种字符串拼接出来sql叫动态sql，不能直接作为sql执行，必须以程序化命令，比如存储过程、shell之类的，先拼出来完整的s
hive slq 计算两个日期的月份差，并向上取整 sql
2021-04-26 16:17

回答 1 已采纳 SELECT (year('2021-03-02')-year('2021-02-25'))*12+(month('2021-03-02')-month('2021-02-25')) ;
新手入门，一个关于hive sql ,case 的提问 hive sql
2021-09-13 09:34

回答 1 已采纳第二种写法省略了=，但是里面必须是一个值，不能写表达式第一种写法相当于高级语言里的if,then,else第二种写法相当于switch,case你不能在case里面再写大于小于，只能写一些固定的值-=
【大数据Hive】hive select 语法使用详解
2023-10-14 09:37

逆风飞翔的小叔的博客 hive 查询语法使用详解
hive sql 查询问题 hive
2022-04-27 18:15

回答 3 已采纳 select t1.xno as 产品编码, t1.name as 项目名称, sum(Case when t2.plevel="A" then 1 else
hive sql 正则提取问题 hive python sql
2022-05-04 15:30

回答 5 已采纳试下这个 import re texts = [ "A037.08.151.1.12", "G037.08.157", "Z03.08.152.1", "Q1037.
hive sql连接问题 hive mysql sql
2022-05-10 22:14

回答 3 已采纳 SELECT count(DISTINCT CASE WHEN p.user_id IS NOT NULL and p.add_date >=t.add_date THEN p.user_id
【大数据】Hive入门➕安装（尚硅谷大数据Hive 3.1.3教程）
2023-08-27 23:26

欧叶冲冲冲的博客 hive尚硅谷面试刷题网站✍命令行客户端beeline是Apache Hive提供的一个交互式工具，用于与Hive进行交互式的数据库操作和查询。具体来说，beeline允许用户通过命令行界面连接到Hive服务器，并在该界面下执行Hive SQL...
hive sql 填充数据的问题 hive sql 数据库
2022-01-15 15:13

回答 2 已采纳 hive有个函数Lag，取前n条，你可以指定取前一条，然后判断，如果本身是null或空，就取lag的前一条，否则就用本身。当然这个函数有个条件，是你得指定至少一个排序字段，否则无法判断哪个是上一条
Hive SQL中的 lateral view 与 explode（列转行）以及行转列
2021-03-28 10:23

卖山楂啦prss的博客行转列：将多个列中的数据在一列中输出列转行：将某列一行中的数据拆分成多行 Explode炸裂函数将hive某列一行中复杂的 array 或 map 结构拆分成多行（只能输入array或map）语法 explode(col) select explode...
大数据Hive数据操纵语言DML
2021-03-27 17:05

赵广陆的博客动态分区插入5 insert + directory导出数据6 Hive Transaction事务6.1 Hive事务背景知识6.2 Hive事务表局限性6.3 案例：创建使用Hive事务表7. DML-Update、Delete更新、删除数据
没有解决我的问题, 去提问

悬赏问题

¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试
¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元

码龄粉丝数原力等级 --

如何使用hive sql 取两个时间?(详见问题描述)

1条回答

码龄粉丝数原力等级 --

如果可以的话，我建议您用UDF更加方便，如果非要用hql呢，下面是我的想法

悬赏问题