hive on spark

hive on spark 执行时报错

hive (default)> create table student(id int, name string);
OK
Time taken: 0.988 seconds
hive (default)> insert into table student values(1,'abc');
Query ID = gll_20240731111535_f648d005-c670-4844-a448-cc85b8738715
Total jobs = 1
Launching Job 1 out of 1
In order to change the average load for a reducer (in bytes):
 set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
 set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
 set mapreduce.job.reduces=<number>
Failed to execute spark task, with exception 'org.apache.hadoop.hive.ql.metadata.HiveException(Failed to create Spark client for Spark session 104a45b0-4189-4048-8290-f5cfbc4008d0)'
FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. Failed to create Spark client for Spark session 104a45b0-4189-4048-8290-f5cfbc4008d0

在调了yarn的内存后就好使了根本不是版本的问题我最大的问题是 insert into table student values(1,'abc'); 就执行这么一条语句要我集群yarn内存调到了5G 是为什么

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

20条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-皆知 2024-07-31 12:14
关注
获得0.30元问题酬金
引自免费微信小程序：皆我百晓生：

遇到这个问题，主要是因为在尝试通过Hive on Spark执行插入操作时，Spark客户端未能成功创建。错误信息显示了SASL（Simple Authentication and Security Layer）协商失败，客户端在SASL认证完成之前关闭。这可能是由多种原因造成的，包括但不限于配置错误、网络问题、权限问题等。以下是一些解决步骤：

1. 检查Hive与Spark的集成配置

确保Hive配置正确地指定了Spark作为执行引擎，并且Spark配置文件（如spark-defaults.conf）中包含了必要的设置，特别是对于安全集群，要确保spark.authenticate和相关SASL配置正确。

2. 验证Hadoop和Spark的用户权限

确认当前执行Hive命令的用户具有访问HDFS和YARN的权限，并且Spark服务也是以该用户或有足够权限的用户身份运行。可以检查HDFS和YARN的ACL设置。

3. 网络和防火墙检查

确保集群内的所有节点之间的网络通信没有被防火墙或其他安全策略阻断，尤其是涉及到RPC通信的端口。

4. Spark配置与版本兼容性

确认Hive和Spark的版本兼容。不兼容的版本组合可能会导致各种预料之外的问题。查看Hive和Spark的官方文档，确认所使用的版本是否相互支持。

5. 检查SASL配置

由于错误信息提到了SASL协商失败，需要特别关注与SASL相关的配置。在Hadoop和Spark的配置文件中，检查是否有正确的SASL配置，例如yarn-site.xml中的yarn.nodemanager.principal、yarn.nodemanager.keytab等，以及Spark配置中的spark.authenticate.enableSaslEncryption等设置。

6. 查看日志和追踪详情

根据错误信息提供的链接（http://slave1:8088/cluster/app/application_1722394836770_0001），深入查看YARN应用管理器的日志，特别是AM容器的日志，以获取更详细的错误信息。这将帮助定位具体的问题点。

7. 重新尝试并监控

在进行上述检查和调整后，尝试再次执行相同的Hive命令。同时，监控集群的健康状况和日志输出，以便及时发现新的错误或异常。

示例配置调整（仅供参考）

如果你需要手动调整一些关键配置项，例如在Hive的hive-site.xml中设置Spark引擎：

<property> <name>hive.execution.engine</name> <value>spark</value> </property> <property> <name>hive.spark.client.connect.timeout</name> <value>60s</value> </property> <property> <name>hive.spark.client.server.connect.timeout</name> <value>60s</value> </property> <property> <name>spark.yarn.queue</name> <value>your-yarn-queue</value> </property>

确保这些配置与你的集群环境相匹配。

如果问题依然存在，可能需要更详细的集群配置和日志分析来进一步诊断。希望上述步骤能帮助你解决问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hive on spark运行sql报错 hive spark 有问必答
2021-09-28 16:58

回答 2 已采纳该问题由hive与spark两者版本不兼容导致的，具体的解释，在官网是有说明的：Hive on Spark is only tested with a specific version of Spar
hive on spark 打开文件过多错误 hadoop hive spark
2022-05-19 19:51

回答 3 已采纳你用的beeline方式连接的吧 beeline连接是有限的当连接超出的时候就会出问题你尝试一下直接连接hivecli 应该会好一点
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
大数据Spark纯净版安装包，用于快速集成Hive on Spark
2024-03-26 15:01

Spark纯净版安装包是一个用于安装Apache Spark的软件包，该软件包提供了Spark的基本功能和组件，但不包含任何额外的扩展或依赖项。纯净版安装包旨在提供一个轻量级、简单易用的Spark安装选项，适用于用户希望快速...
Hive on Spark配置问题 hive spark
2022-12-08 11:36

回答 3 已采纳 hive-seit.xml文件里面必须要添加设置执行引擎为spark
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
基于CDH 6.3.0 搭建 Hive on Spark 及相关配置和调优
2022-05-25 09:57

### 基于CDH 6.3.0 搭建 Hive on Spark 及相关配置和调优 #### 概述随着大数据技术的发展，Hadoop生态系统不断成熟与完善，其中Apache Hive作为数据仓库工具，支持通过SQL语句进行查询、分析存储在Hadoop文件系统...
hive中无法查看spark创建的表 hadoop hive spark 有问必答
2021-06-25 12:55

回答 1 已采纳你切到对应的数据库吗，xshell只是远程工具。
spark与hive版本问题? 本机正常运行,服务器上报错. hive java spark
2021-07-30 17:14

回答 1 已采纳可参考：https://blog.csdn.net/zt15732625878/article/details/85245731看客户端的 hive-jdbc的version 和hive Server
hive怎么拼接单引号 hive sql 大数据
2022-08-02 12:01

回答 7 已采纳不能用拼接，拼接之后用不了in，in是判断左边的字段是否在右边内容(集合)中，拼接的是一个字符串整体，不是集合。 SELECT sku_key,warehouse_key,SUM(quantity)
Hive on Spark调优（大数据技术3）
2023-05-17 07:30

菜鸟Octopus的博客在将NodeManager的总内存平均分配给每个Executor，最后再将单个Executor的内存按照大约10:1的比例分配到spark.executor.memory和spark.executor.memoryOverhead。动态分配可根据一个Spark应用的工作负载，动态的调整...
关于spark 的执行有问题求教。 hive spark 大数据
2017-11-07 09:17

回答 3 已采纳我觉得你有点大材小用了，，而且太麻烦了，，首先，spark有原生的sparkSQL可以直接调用，没必要hive 我觉得你对大数据的计算框架没理解透彻， spark和hadoop都是一样的，计算
Hive on Spark调优（大数据技术6）
2023-05-19 23:30

菜鸟Octopus的博客相关文章： Hive on Spark调优（大数据技术1） Hive on Spark调优（大数据技术2） Hive on Spark调优（大数据技术3） Hive on Spark调优（大数据技术4） Hive on Spark调优（大数据技术5） Hive on Spark调优...
大数据最佳实践-hive on spark
2022-11-27 19:22

WakeUpCcc的博客目录 Hive on Spark与SparkSQLSpark 内存配置spark动态分配Hive Hive on Spark与SparkSQL Hive是Hadoop中的标准SQL引擎，也是最古老的引擎之一。H...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金15元 7月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月31日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

hive on spark

20条回答 默认 最新

1. 检查Hive与Spark的集成配置

2. 验证Hadoop和Spark的用户权限

3. 网络和防火墙检查

4. Spark配置与版本兼容性

5. 检查SASL配置

6. 查看日志和追踪详情

7. 重新尝试并监控

示例配置调整（仅供参考）

问题事件

悬赏问题

20条回答默认最新