hive on spark 和 spark sql 有啥区别？

hive on spark 和 spark sql 都是用spark引擎计算，个人觉得没啥区别。
网友说：
hive on spark 是cloudera公司开发的，spark sql是spark开发的，这个算是区别吗？
写法不同？

请大神解答。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
zhanjr 2017-06-24 06:10
关注
SparkSQL和Hive On Spark都是在Spark上实现SQL的解决方案。Spark早先有Shark项目用来实现SQL层，不过后来推翻重做了，就变成了SparkSQL。这是Spark官方Databricks的项目，Spark项目本身主推的SQL实现。Hive On Spark比SparkSQL稍晚。Hive原本是没有很好支持MapReduce之外的引擎的，而Hive On Tez项目让Hive得以支持和Spark近似的Planning结构（非MapReduce的DAG）。所以在此基础上，Cloudera主导启动了Hive On Spark。这个项目得到了IBM，Intel和MapR的支持（但是没有Databricks）。
结构上Hive On Spark和SparkSQL都是一个翻译层，把一个SQL翻译成分布式可执行的Spark程序。需要理解的是，Hive和SparkSQL都不负责计算，它们只是告诉Spark，你需要这样算那样算，但是本身并不直接参与计算。
Spark官方Databricks本身是不愿意承认Hive On Spark的正统地位的。Shark, Spark SQL, Hive on Spark, and the future of SQL on Spark从它们官博上可以看出他们对Hive On Spark的定位更像是小三而不是正房。所以你看到Apache Hive On Spark的各种努力，并没有得到最重要的Spark Vendor，Databricks的多少支持。SQL是面对用户最直接的一个层面，如果Databricks能控制这个层面，各种功能添加都由自己做主，就不用受制于Hive的社区，这也是很直接的好处，而且我觉得引擎就位之后几个厂商拼的都是上层，要搞出数据仓库还有很多东西要做，但是如果把不住SQL这层，就很难办。但Hive毕竟有辣嘛多厂商支持，D社是否能拿到主控权，还不好说。D社已经有废掉Shark的前科，所以我不是很看好SparkSQL。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hive on spark运行sql报错 hive spark 有问必答
2021-09-28 16:58

回答 2 已采纳该问题由hive与spark两者版本不兼容导致的，具体的解释，在官网是有说明的：Hive on Spark is only tested with a specific version of Spar
hive on spark 打开文件过多错误 hadoop hive spark
2022-05-19 19:51

回答 3 已采纳你用的beeline方式连接的吧 beeline连接是有限的当连接超出的时候就会出问题你尝试一下直接连接hivecli 应该会好一点
Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
【Hive进阶】-- Hive SQL、Spark SQL和 Hive on Spark SQL
2023-03-13 11:46

往事随风ing的博客 Hive由Facebook开发，用于解决海量结构化日志的数据统计，于2008年贡献给 ...Spark SQL主要用于结构型数据处理，它的前身为Shark，在Spark 1.3.0版本后才成长为正式版，可以彻底摆脱之前Shark必须依赖HIVE的局面。
spark与hive版本问题? 本机正常运行,服务器上报错. hive java spark
2021-07-30 17:14

回答 1 已采纳可参考：https://blog.csdn.net/zt15732625878/article/details/85245731看客户端的 hive-jdbc的version 和hive Server
为什么SparkSQL，dbeaver，hive命令行使用相同的语句操作hive表的结果不一样 hive spark sql 有问必答
2022-03-27 14:34

回答 2 已采纳把情景一改成这样试试spark.sql(""" INSERT INTO hive_test_one.djia_table(date, open, high, low, close, volume,
关于spark 的执行有问题求教。 hive spark 大数据
2017-11-07 09:17

回答 3 已采纳我觉得你有点大材小用了，，而且太麻烦了，，首先，spark有原生的sparkSQL可以直接调用，没必要hive 我觉得你对大数据的计算框架没理解透彻， spark和hadoop都是一样的，计算
大数据Spark纯净版安装包，用于快速集成Hive on Spark
2024-03-26 15:01

该安装包通常包含Spark的核心组件，如Spark Core、Spark SQL、Spark Streaming等，以及一些基本的工具和库。用户可以根据自己的需求选择合适的安装方式，例如通过二进制文件安装、通过包管理器安装或者通过源代码...
spark sql的执行顺序是什么样的 hadoop hive spark
2022-12-26 21:08

回答 2 已采纳 Spark SQL 的执行顺序通常分为以下几步：解析 SQL 语句：Spark SQL 会先将 SQL 语句解析成内部的表达式树，以便对其进行更好的优化。优化表达式树：在解析后，Spark SQL 会
spark通过jdbc读取hive的表报错，我是在zeppelin里运行的 hive spark
2017-06-06 08:21

回答 1 已采纳在目前Hive 1.2的JDBC版本里面，使用它会报错：`java.sql.SQLException: Method not supported at org.apache.hive.jdbc.Hiv
Error while instantiating 'org.apache.spark.sql.hive.HiveSessionState' eclipse intellij-idea java java-ee scala
2019-08-09 21:16

回答 3 已采纳这个问题我已经解决，我发现是仔细看了一下，后面的错误是Exception in thread "main"java.lang.UnsatisfiedLinkError，我本地的hadoop版本是2.7
大数据最佳实践-hive on spark
2022-11-27 19:22

WakeUpCcc的博客目录 Hive on Spark与SparkSQLSpark 内存配置spark动态分配Hive Hive on Spark与SparkSQL Hive是Hadoop中的标准SQL引擎，也是最古老的引擎之一。H...
Spark实验统计信息缺失个数报错，如何解决？(语言-scala) hive scala spark
2022-05-17 10:42

回答 1 已采纳 target字段转数字失败，你看一下数据对应的该字段是不是有非数字的值
hive on spark 还是 spark on hive?
2022-08-31 23:45

一生要强的查数姑的博客在运行sql的时候，hive on spark 还是 spark on hive 到底是什么呢？它们是一个东西吗？区别是什么？
浅谈spark sql、hive on spark、spark on hive
2021-09-16 11:44

一只菜狗的博客主要讨论spark sql、hive on spark、spark on hive的区别
没有解决我的问题, 去提问

悬赏问题

¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题

hive on spark 和 spark sql 有啥区别？

1条回答 默认 最新

悬赏问题

1条回答默认最新