[HIVE]中的insert into操作为什么非常慢

例如如下语句

 insert into table1 partition(xxx=xxx) select * from table2

即使数据只有两三条，也要2分钟，这是为什么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
书香门第 2018-06-21 01:54
关注
你可以这样查看hive的执行计划：

> explain insert into t2 select value from t; OK Plan optimized by CBO. Stage-3 Stats-Aggr Operator Stage-0 Move Operator table:{"name:":"default.t2"} Stage-2 Dependency Collection{} Stage-1 Map 1 File Output Operator [FS_2] table:{"name:":"default.t2"} Select Operator [SEL_1] (rows=3 width=1) Output:["_col0"] TableScan [TS_0] (rows=3 width=1) default@t,t,Tbl:COMPLETE,Col:NONE,Output:["value"]

Hive的执行要转化成若干步map-reduce的过程，而且可能要在多个节点间通信，所以即便很少的数据可能也是费了半天劲才执行出来的。就是说hive是为了处理大数据的，对于小数据的处理并不是优势。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

[HIVE]中的insert into操作为什么非常慢 hadoop hive java sql 大数据
2018-06-20 09:59

回答 3 已采纳你可以这样查看hive的执行计划： ``` > explain insert into t2 select value from t; OK Plan optimi
救命，hive中使用insert into 不能插入数据，别的语句都行，求解（着急） hadoop hive java
2018-03-12 05:34

回答 2 已采纳你有abc这张表吗，我看你的图片好像没有
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
请帮我列举hive中insert into的用法
2023-02-09 03:22

贫僧法号止尘的博客 Hive中的insert into有以下几种用法：向Hive表中插入数据： INSERT INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement; 向已有表中插入数据，并创建一个新的分区： INSERT ...
请问大家为什么我连接hive无法执行插入语句呀 hive 大数据数据库
2023-03-14 10:08

回答 1 已采纳 job的执行错误，看下你的脚本代码，去掉可能出错的部分再试试看
hive脚本中AND EXISTS改为左连接left join hive sql 大数据
2022-04-29 10:57

回答 1 已采纳 SELECT A.*, ERROR_TWO_TYPE FROM SRBZ_HIVE.TMP_YWJH_ZQZRR_DW_02 A left join
为什么SparkSQL，dbeaver，hive命令行使用相同的语句操作hive表的结果不一样 hive spark sql 有问必答
2022-03-27 14:34

回答 2 已采纳把情景一改成这样试试spark.sql(""" INSERT INTO hive_test_one.djia_table(date, open, high, low, close, volume,
Hive中 insert into 和 insert overwrite的区别
2023-11-20 14:50

服软⁵²º₅₂₁的博客 insert into 和 insert overwrite 都是往表中插入数据的。
hive中字符串类型的日期为什么能够进行比较？ hadoop hive java sql 大数据
2018-06-19 01:09

回答 5 已采纳如果你的字段‘import_date_day’是string类型，那么比较应该是按照string比的，但是该字段的format可以支持类似于日期的比较，因为年在前，月在当中，日在最后。这样按照字符串比
关于hive上NOT IN改为左连接left join hive sql 大数据
2022-04-28 23:51

回答 1 已采纳 DROP TABLE IF EXISTS TMP_YWJH_YKDZ_04;CREATE TABLE TMP_YWJH_YKDZ_04 ASSELECT A.*, B.LNX_NUM LNX_NUMF
为什么搭建不成功hive啊 hadoop hive
2022-11-26 21:57

回答 3 已采纳他提示了你的hive-site.xml文件，应该是你这个配置文件中的什么地方写错了，你在仔细检查检查
Hive那些事儿之八-大数据踩过的坑——Hive insert
2021-01-07 11:13

Hive那些事儿之八-大数据踩过的坑——Hive insert 我在对Hive表数据清洗后，使用了如下SQL将结果集插入到新表中: insert into db_name.table_name_1 ( col_1,col2,col3 ) with temp_table_1 as ( select id,col_2 ...
hive脚本中NOT EXISTS改为左连接left join hive sql 数据库
2022-04-29 11:33

回答 1 已采纳 SELECT A.*, ERROR_TWO_TYPEFROM SRBZ_HIVE.TMP_YWJH_ZQZRR_DW_02 Aleft join DIC_INT.INT_ODS_USER_AGENT_
【Hive】insert into 与 insert overwrite的区别
2022-09-06 14:54

郝少的博客 insert into 和 insert overwrite区别
Hive Sql优化之一次from查询多次insert into操作
2023-04-23 18:28

Avarice912的博客优化点：一次map多个reduce，有效节省了map操作。
没有解决我的问题, 去提问

悬赏问题

¥15 运筹学中在线排序的时间在线排序的在线LPT算法
¥30 求一段fortran代码用IVF编译运行的结果
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 lammps拉伸应力应变曲线分析
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试，帮帮忙吧

[HIVE]中的insert into操作为什么非常慢

3条回答 默认 最新

悬赏问题

3条回答默认最新