无脑小松鼠 2020-04-13 11:49 采纳率: 50%
浏览 826
已采纳

hive 将两列按所在位置同时拆分成多行

hive中有2个列表字段valuelist和sourcelist,形如:

[7fjv56lqblm6jhd, zm91ry6rctntum8, bqyvs09wsfnymts, 227206400, 2gq2tsqu993gi0i, kn7jk6npfmgejif]     [腾讯视频, 腾讯视频, 腾讯视频, 爱奇艺视频, 腾讯视频, 腾讯视频]

我要怎么样才能把它拆分成这样的格式:

7fjv56lqblm6jhd 腾讯视频
zm91ry6rctntum8 腾讯视频
bqyvs09wsfnymts 腾讯视频
....
kn7jk6npfmgejif 腾讯视频

我自己试过LATERAL VIEW explode但得到的结果却是这样的:

7fjv56lqblm6jhd tencent
7fjv56lqblm6jhd  tencent
7fjv56lqblm6jhd  tencent
7fjv56lqblm6jhd  iqiyi
7fjv56lqblm6jhd  tencent
7fjv56lqblm6jhd  tencent
 zm91ry6rctntum8    tencent
 zm91ry6rctntum8     tencent
 zm91ry6rctntum8     tencent
 zm91ry6rctntum8     iqiyi
 zm91ry6rctntum8     tencent
 zm91ry6rctntum8     tencent
 bqyvs09wsfnymts    tencent
 bqyvs09wsfnymts     tencent
 bqyvs09wsfnymts     tencent
 bqyvs09wsfnymts     iqiyi
 bqyvs09wsfnymts     tencent
 bqyvs09wsfnymts     tencent
 227206400  tencent
 227206400   tencent
 227206400   tencent
 227206400   iqiyi
 227206400   tencent
 227206400   tencent
 2gq2tsqu993gi0i    tencent
 2gq2tsqu993gi0i     tencent
 2gq2tsqu993gi0i     tencent
 2gq2tsqu993gi0i     iqiyi
 2gq2tsqu993gi0i     tencent
 2gq2tsqu993gi0i     tencent
 kn7jk6npfmgejif    tencent
 kn7jk6npfmgejif     tencent
 kn7jk6npfmgejif     tencent
 kn7jk6npfmgejif     iqiyi
 kn7jk6npfmgejif     tencent
 kn7jk6npfmgejif     tencent

这是我的查询语句:

select value_list,regexp_replace(regexp_replace(regexp_replace(regexp_replace(source_list,'腾讯视频','tencent'),'优酷视频','youku'),'爱奇艺视频','iqiyi'),'芒果视频','manguo') 
from tv_ai_voice_h 
LATERAL VIEW explode(split(regexp_replace(regexp_replace(valuelist,'\\[',''),']',''),','))myTable1 as value_list 
LATERAL VIEW explode(split(regexp_replace(regexp_replace(sourcelist,'\\[',''),']',''),','))myTable2 as source_list 
limit 140;
  • 写回答

1条回答 默认 最新

  • 德玛洗牙 2020-04-13 14:41
    关注

    何不将两个字段分开做lateral view作为两个子查询然后对每行用row_number() over()进行编号再根据编号做连接呢

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 运筹学中在线排序的时间在线排序的在线LPT算法
  • ¥30 求一段fortran代码用IVF编译运行的结果
  • ¥15 深度学习根据CNN网络模型,搭建BP模型并训练MNIST数据集
  • ¥15 lammps拉伸应力应变曲线分析
  • ¥15 C++ 头文件/宏冲突问题解决
  • ¥15 用comsol模拟大气湍流通过底部加热(温度不同)的腔体
  • ¥50 安卓adb backup备份子用户应用数据失败
  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
  • ¥30 python代码,帮调试,帮帮忙吧