spark-shell查询hive外部表报错

2024-08-28 15:51:52,704 ERROR mapreduce.PhoenixInputFormat: Failed to get the query plan with error [No suitable driver found for jdbc:phoenix:hadoop001,hadoop002,hadoop003:2181:/hbase;]
java.lang.RuntimeException: java.sql.SQLException: No suitable driver found for jdbc:phoenix:hadoop001,hadoop002,hadoop003:2181:/hbase;
  at org.apache.phoenix.hive.mapreduce.PhoenixInputFormat.getQueryPlan(PhoenixInputFormat.java:252)
  at org.apache.phoenix.hive.mapreduce.PhoenixInputFormat.getSplits(PhoenixInputFormat.java:114)
  at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:205)
  at org.apache.spark.rdd.RDD.$anonfun$partitions$2(RDD.scala:300)
  at scala.Option.getOrElse(Option.scala:189)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:296)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:49)
  at org.apache.spark.rdd.RDD.$anonfun$partitions$2(RDD.scala:300)
  at scala.Option.getOrElse(Option.scala:189)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:296)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:49)
  at org.apache.spark.rdd.RDD.$anonfun$partitions$2(RDD.scala:300)
  at scala.Option.getOrElse(Option.scala:189)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:296)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:49)
  at org.apache.spark.rdd.RDD.$anonfun$partitions$2(RDD.scala:300)
  at scala.Option.getOrElse(Option.scala:189)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:296)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:49)
  at org.apache.spark.rdd.RDD.$anonfun$partitions$2(RDD.scala:300)
  at scala.Option.getOrElse(Option.scala:189)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:296)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:49)
  at org.apache.spark.rdd.RDD.$anonfun$partitions$2(RDD.scala:300)
  at scala.Option.getOrElse(Option.scala:189)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:296)
  at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:442)
  at org.apache.spark.sql.execution.SparkPlan.executeTake(SparkPlan.scala:425)
  at org.apache.spark.sql.execution.CollectLimitExec.executeCollect(limit.scala:47)
  at org.apache.spark.sql.Dataset.collectFromPlan(Dataset.scala:3696)
  at org.apache.spark.sql.Dataset.$anonfun$head$1(Dataset.scala:2722)
  at org.apache.spark.sql.Dataset.$anonfun$withAction$1(Dataset.scala:3687)
  at org.apache.spark.sql.execution.SQLExecution$.$anonfun$withNewExecutionId$5(SQLExecution.scala:103)
  at org.apache.spark.sql.execution.SQLExecution$.withSQLConfPropagated(SQLExecution.scala:163)
  at org.apache.spark.sql.execution.SQLExecution$.$anonfun$withNewExecutionId$1(SQLExecution.scala:90)
  at org.apache.spark.sql.SparkSession.withActive(SparkSession.scala:772)
  at org.apache.spark.sql.execution.SQLExecution$.withNewExecutionId(SQLExecution.scala:64)
  at org.apache.spark.sql.Dataset.withAction(Dataset.scala:3685)
  at org.apache.spark.sql.Dataset.head(Dataset.scala:2722)
  at org.apache.spark.sql.Dataset.take(Dataset.scala:2929)
  at org.apache.spark.sql.Dataset.getRows(Dataset.scala:301)
  at org.apache.spark.sql.Dataset.showString(Dataset.scala:338)
  at org.apache.spark.sql.Dataset.show(Dataset.scala:825)
  at org.apache.spark.sql.Dataset.show(Dataset.scala:784)
  at org.apache.spark.sql.Dataset.show(Dataset.scala:793)
  ... 47 elided
Caused by: java.sql.SQLException: No suitable driver found for jdbc:phoenix:hadoop001,hadoop002,hadoop003:2181:/hbase;
  at java.sql.DriverManager.getConnection(DriverManager.java:689)
  at java.sql.DriverManager.getConnection(DriverManager.java:208)
  at org.apache.phoenix.hive.util.PhoenixConnectionUtil.getConnection(PhoenixConnectionUtil.java:99)
  at org.apache.phoenix.hive.util.PhoenixConnectionUtil.getInputConnection(PhoenixConnectionUtil.java:62)
  at org.apache.phoenix.hive.mapreduce.PhoenixInputFormat.getQueryPlan(PhoenixInputFormat.java:233)
  ... 91 more

使用查询语句scala> sql("SELECT * FROM s_dept").show()查询hive中的外部表(hive映射在phoenix中的表），报错没有合适的驱动，但是没有关闭这个shell的时候再次进行查询却能够成功查询，并且再次关闭打开第一次查询时又会报错没有该驱动。


scala> sql("SELECT * FROM s_dept").show()
+------+----------+------+                                                      
|deptno|     dname|   loc|
+------+----------+------+
|    10|ACCOUNTING|1700.0|
|    20|  RESEARCH|1800.0|
|    30|     SALES|1900.0|
|    40|OPERATIONS|1700.0|
+------+----------+------+

这是什么原因？如何解决每次打开shell的第一次查询hive外部表都会报错的问题？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

spark与hive版本问题? 本机正常运行,服务器上报错. hive java spark
2021-07-30 17:14

回答 1 已采纳可参考：https://blog.csdn.net/zt15732625878/article/details/85245731看客户端的 hive-jdbc的version 和hive Server
Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
hive创建外部表导入csv数据格式出错 hadoop hive 大数据
2022-06-06 17:18

回答 2 已采纳在window用excel把csv改成\t 分割,建表分割符改成\t
spark-shell启动spark报错
2019-11-05 14:33

rong_code的博客 spark-shell启动spark报错前言　离线安装好CDH、Coudera Manager之后，通过Coudera Manager安装所有自带的应用，包括hdfs、hive、yarn、spark、hbase等应用，过程很是波折，此处就不抱怨了，直接进入主题。 ...
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
Hive on Spark配置问题 hive spark
2022-12-08 11:36

回答 3 已采纳 hive-seit.xml文件里面必须要添加设置执行引擎为spark
hive on spark运行sql报错 hive spark 有问必答
2021-09-28 16:58

回答 2 已采纳该问题由hive与spark两者版本不兼容导致的，具体的解释，在官网是有说明的：Hive on Spark is only tested with a specific version of Spar
Spark -- Spark3.2.2集成Hudi 0.11.1并同步Hive 3.1.3
2022-07-21 11:55

TheBiiigBlue的博客 Spark、Hudi、Hive
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
hive on spark 打开文件过多错误 hadoop hive spark
2022-05-19 19:51

回答 3 已采纳你用的beeline方式连接的吧 beeline连接是有限的当连接超出的时候就会出问题你尝试一下直接连接hivecli 应该会好一点
hive中无法查看spark创建的表 hadoop hive spark 有问必答
2021-06-25 12:55

回答 1 已采纳你切到对应的数据库吗，xshell只是远程工具。
spark 访问hive表报错
2018-10-25 18:08

根哥的博客的博客 spark访问hive表：在spark/conf目录下：引入hive配置文件 ln -sf /soft/hive/conf/hive-site.xml /soft/spark/conf/ 错误1： Hive Schema version 1.2.0 does not match metastore’s schema version 2.3.0 原因：...
hive查询，使用where子查询没有返回结果 hive 大数据
2021-12-18 21:13

回答 1 已采纳 where中又使用了一次emloyees表,和上面的emloyees表没有任何关联关系,你要根据80000.0来定位数据的话,应该是像下面这样写 select name, salary, deduct
hive报错 spark_Spark保存数据到hive,在hive里查询报错
2020-12-20 09:33

weixin_39840111的博客我的原创地址：hive查询报错:java.io.IOException:org.apache.parquet.io.ParquetDecodingExceptiondongkelun.com前言本文解决如标题所述的一个hive查询异常，详细异常信息为：Failed with exception java.io....
Windows平台运行spark-shell 报“java.lang.NullPointerException, not found: value sqlContext“ error 解决办法
2020-11-16 14:09

javachen__的博客在spark 官网下载 spark的安装版：spark-1.6.3-bin-hadoop2.6.tgz，然后解压，配好环境变量，在window下CMD下运行spark-shell,启动spark失败（本地模式）。然后搜索了一下，发现中文基本找不到什么参考资料，不过在...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 9月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月28日

悬赏问题

¥15 R语言卸载之后无法重装，显示电脑存在下载某些较大二进制文件行为，怎么办
¥15 java 的protected权限，问题在注释里
¥15 这个是哪里有问题啊？
¥15 关于#vue.js#的问题：修改用户信息功能图片无法回显，数据库中只存了一张图片（相关搜索：字符串）
¥15 texstudio的问题，
¥15 spaceclaim模型变灰色
¥15 求一份华为esight平台V300R009C00SPC200这个型号的api接口文档
¥15 字符串比较代码的漏洞
¥15 欧拉系统opt目录空间使用100%
¥15 ul做导航栏格式不对怎么改？

spark-shell查询hive外部表报错

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新