hive怎么实现类似于python的range(n,m)功能 5C

比如字段为
uid , 2,10

变成
uid,2
uid,3
uid,4
uid,5
uid,6
uid,7
uid,8
uid,9
uid10

实际上比这个复杂,所以不要用join辅助列来完成,最好是有什么函数,反正百度了一下不太知道

2个回答

Hive作为map-reduce的上层可能是做不了这种事情的。不如你详细说一下你要完成的任务,也许可以找到其它的workaround呢。

就是这个需求,我要做一个分拆时间的统计,每天86400 每5分钟,是288,假如某一个id在 10 - 30 等于我要把他所处的时间遍历出来单独去统计,就这样

ldy414
ldy414 回复weixin_42325834: 不一定是每秒都产生,就是在时间内随机产生,我们在分析时,早期是把数据汇总成每天,也就是所谓的日报,然后目前的需求就是变成每5分钟,看看更低粒度的数据,5分钟主要是用来join别的表形成汇总数据,不聚合成5分钟就是秒级别,那没有join的必要了
一年多之前 回复
weixin_42325834
书香门第 你的意思是你的数据每秒产生一条,然后你要把他们分成组,每5分钟为一组,是这个意思吗?
一年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!