首先我在Hbase中建了一张空表t1;
在hive中新建一张**外部分区表**使用HBaseStorageHandler与表t1映射起来;
hive中插入一条分区数据,hive中存在1条数据,Hbase中一条;
hive中插入第2,3,4,5条分区数据,**hive中存在25条数据,Hbase中5条**;why?
另外hive中select查询带第一个分区条件查询数据竟然显示全部数据??所以分区表和映射表同时使用无意义??
Hbase在hive中的映射表作为分区表查询障碍
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- sccemstanford 2017-12-07 09:57关注
同问啊,我们现在遇到了一个类似场景,hbase中有需要用到的数据,但是另一个系统Kylin只能从hive中获取,为此,我准备Hbase中的表映射到hive中来,
如果这样Hive中就没办法分区了,以后数据量增大了,就不好弄了,如果我自己同步数据到hive中,就有两份数据,冗余了,伤脑经解决 无用评论 打赏 举报