你好杰米 2018-06-20 09:59 采纳率: 88.9%
浏览 10331
已采纳

[HIVE]中的insert into操作为什么非常慢

例如如下语句

 insert into table1 partition(xxx=xxx) select * from table2

即使数据只有两三条,也要2分钟,这是为什么?

  • 写回答

3条回答 默认 最新

  • 书香门第 2018-06-21 01:54
    关注

    你可以这样查看hive的执行计划:

         > explain insert into t2 select value from t;
    OK
    Plan optimized by CBO.
    
    Stage-3
      Stats-Aggr Operator
        Stage-0
          Move Operator
            table:{"name:":"default.t2"}
            Stage-2
              Dependency Collection{}
                Stage-1
                  Map 1
                  File Output Operator [FS_2]
                    table:{"name:":"default.t2"}
                    Select Operator [SEL_1] (rows=3 width=1)
                      Output:["_col0"]
                      TableScan [TS_0] (rows=3 width=1)
                        default@t,t,Tbl:COMPLETE,Col:NONE,Output:["value"]
    
    

    Hive的执行要转化成若干步map-reduce的过程,而且可能要在多个节点间通信,所以即便很少的数据可能也是费了半天劲才执行出来的。就是说hive是为了处理大数据的,对于小数据的处理并不是优势。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

悬赏问题

  • ¥15 关于#vscode#的问题:ESP32开发板对接MQTT实现小灯泡的开关
  • ¥15 TMC2209串口模式下读取不到寄存器的值串口助手蓝色字体是发过去的消息,绿色字体是收到的消息,第二行发送读取寄存器的指令但是没有读取到寄存器的值串口助手如下图:接线如下图,如何解决?
  • ¥15 高通安卓11提取完整线刷包软件,或者优博讯dt50顺丰刷机包
  • ¥20 C,有个译码器,换了信道就跑不出原来数据
  • ¥15 MIMIC数据库安装问题
  • ¥60 基于JTag协议开发Fpga下载器上位机,哪位大🐂有偿指导?
  • ¥20 全书网Java爬取数据
  • ¥15 怎么获取红包封面的原始链接,并且获取红包封面序列号
  • ¥100 微信小程序跑脚本授权的问题
  • ¥100 房产抖音小程序苹果搜不到安卓可以付费悬赏