[HIVE]中的insert into操作为什么非常慢

例如如下语句

 insert into table1 partition(xxx=xxx) select * from table2

即使数据只有两三条，也要2分钟，这是为什么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
书香门第 2018-06-21 01:54
关注
你可以这样查看hive的执行计划：

> explain insert into t2 select value from t; OK Plan optimized by CBO. Stage-3 Stats-Aggr Operator Stage-0 Move Operator table:{"name:":"default.t2"} Stage-2 Dependency Collection{} Stage-1 Map 1 File Output Operator [FS_2] table:{"name:":"default.t2"} Select Operator [SEL_1] (rows=3 width=1) Output:["_col0"] TableScan [TS_0] (rows=3 width=1) default@t,t,Tbl:COMPLETE,Col:NONE,Output:["value"]

Hive的执行要转化成若干步map-reduce的过程，而且可能要在多个节点间通信，所以即便很少的数据可能也是费了半天劲才执行出来的。就是说hive是为了处理大数据的，对于小数据的处理并不是优势。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

[HIVE]中的insert into操作为什么非常慢 hadoop hive java sql 大数据
2018-06-20 09:59

回答 3 已采纳你可以这样查看hive的执行计划： ``` > explain insert into t2 select value from t; OK Plan optimi
救命，hive中使用insert into 不能插入数据，别的语句都行，求解（着急） hadoop hive java
2018-03-12 05:34

回答 2 已采纳你有abc这张表吗，我看你的图片好像没有
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
Hive那些事儿之八-大数据踩过的坑——Hive insert
2021-01-07 11:13

Hive那些事儿之八-大数据踩过的坑——Hive insert 我在对Hive表数据清洗后，使用了如下SQL将结果集插入到新表中: insert into db_name.table_name_1 ( col_1,col2,col3 ) with temp_table_1 as ( select id,col_2 ...
请问大家为什么我连接hive无法执行插入语句呀 hive 大数据数据库
2023-03-14 10:08

回答 1 已采纳 job的执行错误，看下你的脚本代码，去掉可能出错的部分再试试看
hive脚本中AND EXISTS改为左连接left join hive sql 大数据
2022-04-29 10:57

回答 1 已采纳 SELECT A.*, ERROR_TWO_TYPE FROM SRBZ_HIVE.TMP_YWJH_ZQZRR_DW_02 A left join
为什么SparkSQL，dbeaver，hive命令行使用相同的语句操作hive表的结果不一样 hive spark sql 有问必答
2022-03-27 14:34

回答 2 已采纳把情景一改成这样试试spark.sql(""" INSERT INTO hive_test_one.djia_table(date, open, high, low, close, volume,
Hive中 insert into 和 insert overwrite的区别
2023-11-20 14:50

服软⁵²º₅₂₁的博客 insert into 和 insert overwrite 都是往表中插入数据的。
hive中字符串类型的日期为什么能够进行比较？ hadoop hive java sql 大数据
2018-06-19 01:09

回答 5 已采纳如果你的字段‘import_date_day’是string类型，那么比较应该是按照string比的，但是该字段的format可以支持类似于日期的比较，因为年在前，月在当中，日在最后。这样按照字符串比
关于hive上NOT IN改为左连接left join hive sql 大数据
2022-04-28 23:51

回答 1 已采纳 DROP TABLE IF EXISTS TMP_YWJH_YKDZ_04;CREATE TABLE TMP_YWJH_YKDZ_04 ASSELECT A.*, B.LNX_NUM LNX_NUMF
为什么搭建不成功hive啊 hadoop hive
2022-11-26 21:57

回答 3 已采纳他提示了你的hive-site.xml文件，应该是你这个配置文件中的什么地方写错了，你在仔细检查检查
请帮我列举hive中insert into的用法
2023-02-09 03:22

贫僧法号止尘的博客 Hive中的insert into有以下几种用法：向Hive表中插入数据： INSERT INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement; 向已有表中插入数据，并创建一个新的分区： INSERT ...
hive脚本中NOT EXISTS改为左连接left join hive sql 数据库
2022-04-29 11:33

回答 1 已采纳 SELECT A.*, ERROR_TWO_TYPEFROM SRBZ_HIVE.TMP_YWJH_ZQZRR_DW_02 Aleft join DIC_INT.INT_ODS_USER_AGENT_
大数据实验六实验报告：熟悉Hive的基本操作
2022-06-20 17:26

在本实验报告中，我们关注的是大数据处理工具Hive的基础操作，主要涵盖了创建表、导入数据以及使用Hive进行数据管理。Hive是基于Hadoop的数据仓库工具，它允许通过SQL-like查询语言（HQL）对分布式存储的大数据集...
【Hive】insert into 与 insert overwrite的区别
2022-09-06 14:54

郝少的博客 insert into 和 insert overwrite区别
没有解决我的问题, 去提问

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

[HIVE]中的insert into操作为什么非常慢

3条回答 默认 最新

悬赏问题

3条回答默认最新