spark2.3.3跨集群读取hive2.4.2

问题描述：

旧集群为spark2.1.0，hive2.4.2。新集群为cdh的spark2.3.3+hive3.0.0。hdfs不在一起。我尝试用spark2.3.3去读旧集群的hive2.4.2。在spark-submit的时候--files添加了 hive-site.xml。里面定义了

spark.sql.warehouse.dir=hdfs://master:9000/apps/hive/warehouse

hive.metastore.uris=thrift://master:9083

这里的master为旧集群的地址。

当我将依赖包打进要执行的jar的时候执行抛出如下异常:

 class org.apache.hadoop.hdfs.web.HftpFileSystem cannot access its superinterface org.apache.hadoop.hdfs.web.TokenAspect$TokenManagementDelegator

而当我仅执行original的jar包，
依赖包选择spark-submit --jars的方式引入时，则抛出这个异常


 org.apache.thrift.TApplicationException: Invalid method name: 'get_all_functions'

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
你知我知皆知 2024-08-07 18:28
关注
以下回答参考 皆我百晓生、券券喵儿 等免费微信小程序相关内容作答，并由本人整理回复。

这个问题是由于Spark与Hadoop之间存在版本不兼容引起的。Spark2.3.x版本与Hadoop 3.x版本之间存在一些不兼容性。你提到的hive-site.xml文件中的配置可能无法正常工作。

解决方法：

在Spark 2.3.3中，你需要更新你的spark-hive2-connector.properties文件以支持Hive 3.x版本。

spark.sql.warehouse.dir=/path/to/your/spark/warehouse hive.metastore.client.factory.class=com.google.cloud.hadoop.metastore.HiveClientFactory

这个配置可以确保Hive 3.x能够正确连接到HDFS仓库。

将你的spark-hive2-connector.properties文件保存为.properties文件，并将其复制到新的Hadoop集群中。

确保你的Hadoop集群已经安装了最新的Hive 3.x版本。如果你使用的是CDH（Cloudera Distribution of Hadoop），你可以通过运行以下命令来检查：

hdp -V | grep Hive

如果以上步骤都不能解决问题，请提供更多的关于你的环境和具体的问题细节，以便于我们更好地帮助您解决问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Android Studio2.3.3真机调试安装失败 android-studio
2017-10-08 13:37

回答 2 已采纳看看你的as这个页面我标出来的那个地方是不是打着勾呢![图片说明](https://img-ask.csdn.net/upload/201710/09/1507510280_998054.png)
在Doctrine 2.3.3中放置docblock注释的位置 php
2013-04-09 12:12

回答 1 已采纳 No matter where you place your annotations, Doctrine is not programmed to recognise them. It only
android源码2.3.3怎么升级到2.3.4？ android
2011-08-03 10:42

回答 2 已采纳你是要升级sdk 还是要下载源码？？？如果要升级sdk 在eclipse中点那个avd manage 可以升级· 如果要获得源码，那必须得单独下载、
Hive on spark 配置
2020-06-19 16:58

BenHahaha的博客 2.3 Spark应用程序卡着 2.3.1 现象集群资源呗Spark应用占据 2.3.2 原因同时运行多个Hive on Spark会话可能会发生这种情况 2.3.3 解决进入YARN服务页面；点击“Applications”标签；选择包含Hive on Spark的应用...
node运行nom run dev提示数据库连接失败异常 javascript npm vue.js
2022-08-31 16:11

回答 5 已采纳那是你连接的数据库的账号密码不对，修改 .env.development 文件下 #database部分的配置把数据库地址，数据库名，账号，密码等改成自己的，就可以了
glibc高版本回退 linux
2022-09-26 09:42

回答 1 已采纳关于该问题，我找了一篇非常好的博客，你可以看看是否有帮助，链接：查看glibc版本及解决差异
Ubuntu 下配置Ruby1.9.1,Rails2.3.3出错
2009-09-02 23:41

回答 3 已采纳那应该不是 iconv 的问题，先把 iconv-pure 删了吧 …… [code="sh"]sudo gem uninstall luikore-iconv-pure[/code] wr
spark sql原理及使用基本使用mysql hive rdd转为dataframe
2021-01-20 16:03

uniqueliang的博客一、spark SQL概述 1.1 什么是spark SQL Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。类似于hive的作用。 1.2 spark SQL的特点 1、...
Mybatis-Plus 空指针异常 java mysql
2022-02-14 14:13

回答 4 已采纳 java.lang.IllegalStateException: Failed to load ApplicationContext 现在是这个问题
springcloud 自学，eureka服务启动不了，不知道哪里出错了，大家指导一下 eureka java spring cloud
2021-12-31 13:14

回答 2 已采纳换个端口试试
maven工程在父工程中用tomcat7插件报错 UserController is not a Servlet java maven
2021-11-16 20:41

回答 1 已采纳跟这没关系，你那报错说的很清楚，UserController is not a Servlet，你配置对不对
Spark 环境搭建阿善没用
2021-01-05 09:06

okbin1991的博客 Spark环境搭建学习目标 1.了解Spark发展史 2.完成Spark环境搭建 3.掌握Spark入门案例-WordCount 4.完成将Spark任务提交到Yarn 1. 课程说明 1.1 课程安排整个Spark 框架课程分为如下9个部分，如下图所示：第1章：...
Android Studio layout 目录下文件夹报错 android ide
2021-09-29 09:00

回答 1 已采纳先排除一下缓存问题1、clean与rebuild2、Invalidate and Restart如果还是不行的话，尝试升级gradle吧
01_大数据技术之Spark入门（2.1）
2020-11-09 09:37

okbin1991的博客第1章 Spark概述1.1 什么是SparkSpark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。1.2 Spark历史 1.3 Spark内置模块 Spark Core：实现了Spark的基本功能，包含任务调度、内存管理、错误恢复、与...
[Hive]一、大数据技术之Hive
2024-05-22 01:09

墨尔本、晴的博客 Hive是由Facebook开源，基于Hadoop... （1）Hive中每张表的数据存储在HDFS （2）Hive分析数据底层的实现是MapReduce（也可以配置为Spark或者Tez引擎）（3）执行程序运行在Yarn上（1）Hive客户端：CLI（command-line i
大数据技术之Hive
2023-03-16 22:58

茶叶蛋xq的博客大数据技术之Hive
Hive学习---1、Hive入门、Hive 安装
2023-05-30 10:45

星光下的赶路人star的博客 Hive学习---1、Hive入门、Hive 安装
Spark离线开发指南(详细版)
2024-06-25 17:05

Evan2OO1的博客必填，文件路径支持本地，支持HDFS，也支持一些比如S3协议参数2：可选，表示最小分区数量注意：参数2话语权不足，spark有自己的判断，在它的允许的范围内，参数2才有效果，超出spark允许的范围，参数2就失效读取本地...
没有解决我的问题, 去提问

悬赏问题

¥15 有两个非常“自以为是”烦人的问题急期待大家解决！
¥30 STM32 INMP441无法读取数据
¥100 求汇川机器人IRCB300控制器和示教器同版本升级固件文件升级包
¥15 用visualstudio2022创建vue项目后无法启动
¥15 x趋于0时tanx-sinx极限可以拆开算吗
¥500 把面具戴到人脸上，请大家贡献智慧
¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。
¥15 各位帮我看看如何写代码，打出来的图形要和如下图呈现的一样，急
¥30 c#打开word开启修订并实时显示批注
¥15 如何解决ldsc的这条报错/index error

spark2.3.3跨集群读取hive2.4.2

1条回答 默认 最新

悬赏问题

1条回答默认最新