spark（自带hive）不能读取主子表的数据

【问题详细描述】
spark（自带hive）读取不了主子表的数据，非主表的数据可以读取。spark版本：spark-1.3.0-bin-hadoop2.4
使用的jar包：
spark-sequoiadb-1.12.jar
sequoiadb-driver-1.12.jar
hadoop-sequoiadb-1.12.jar
hive-sequoiadb-1.12.jar
postgresql-9.4-1201-jdbc41.jar
查询主表错误如下：
select * from test201607_cs.tb_order limit 1 ;

Error: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 16.0 failed 4 times, most recent failure: Lost task 0.3 in stage 16.0 (TID 362, sdb-223.3golden.hq): com.sequoiadb.exception.BaseException: errorType:SDB_DMS_CS_NOTEXIST,Collection space does not exist
Exception Detail:test201607_cs
at com.sequoiadb.base.Sequoiadb.getCollectionSpace(Sequoiadb.java:598)
at com.sequoiadb.hive.SdbReader.(SdbReader.java:145)
at com.sequoiadb.hive.SdbHiveInputFormat.getRecordReader(SdbHiveInputFormat.java:120)
at org.apache.spark.rdd.HadoopRDD$anon$1.(HadoopRDD.scala:236)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:212)
复制代码

查询非主表结果：
select * from test201607_cs.test_hive limit 1 ;

+----------+
| shop_id |
+----------+
| 10048 |
+----------+

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
巨杉数据库SequoiaDB 企业官方账号 2017-09-06 08:30
关注
可以使用spark的连接器：

CREATE table st_order ( shop_id string, date string) using com.sequoiadb.spark OPTIONS ( host 'localhost:11810', collectionspace 'test201607_cs', collection 'st_order');
复制代码

注意date这种关键字需要使用``括起来。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Spark 读取 Hive 数据报错 NoSuchMethodError : org.apache.spark.sql.catalyst.catalog.SessionCatalog hive spark 大数据
2022-12-15 15:54

回答 1 已采纳 22/12/15 15:32:44 INFO SparkContext: Invoking stop() from shutdown hook集群资源不足，且动态资源分配申请的executors、内存
hive中无法查看spark创建的表 hadoop hive spark 有问必答
2021-06-25 12:55

回答 1 已采纳你切到对应的数据库吗，xshell只是远程工具。
hive用select*from查看不到表数据 centos hadoop hive
2022-03-17 20:47

回答 1 已采纳参考一下这篇文章 hive表删除分区后，重新插入，查询不到数据问题_雾岛与鲸的博客-CSDN博客_hive 重新分区 1、选择一张分区表（本
sqoop建表_sqoop导入数据到hive表中的相关操作
2020-12-20 14:28

weixin_39745345的博客 1.使用sqoop创建表并且指定对应的hive表中的字段的数据类型,同时指定该表的分区字段名称sqoop create-hive-table --connect "jdbc:oracle:thin:@192.168.13.1:1521/test" --username root --password 12345 --table ...
hive创建外部表导入csv数据格式出错 hadoop hive 大数据
2022-06-06 17:18

回答 2 已采纳在window用excel把csv改成\t 分割,建表分割符改成\t
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
大数据hive分区表导入数据的问题 hive 大数据
2018-01-07 12:34

回答 5 已采纳 http://blog.csdn.net/fjssharpsword/article/details/64919412
阿里云云原生一体化数仓 - 数据安全能力解读
2022-08-04 14:34

阿里云云栖号的博客云原生一体化数仓数据安全能力基于MaxCompute与DataWorks的组合能力，包括数据分级机制、敏感数据识别算法、用户权限级别和数据安全级别自动映射、数据脱敏、审批和权限回收流程、审计机制、开发生产环境隔离等安全...
数据仓库 大数据 apachhive hive 大数据数据仓库
2023-02-24 15:51

回答 1 已采纳是的，Apache Hive的分层就是指把不同维度的数据抽取出来，并根据不同的维度进行分类存放。通过这种方式，可以更好的管理数据，便于后续的查询和分析处理。
spark与hive版本问题? 本机正常运行,服务器上报错. hive java spark
2021-07-30 17:14

回答 1 已采纳可参考：https://blog.csdn.net/zt15732625878/article/details/85245731看客户端的 hive-jdbc的version 和hive Server
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
JVM 上数据处理语言的竞争：Kotlin, Scala 和 SPL
2022-07-30 16:54

m0_67394006的博客 ?作者简介??云计算领域优质创作者??新星计划第三季python赛道TOP1...本文的适用场景设定为项目开发中常见的数据处理和业务逻辑，以结构化数据为主，大数据和高性能不作为重点，也不涉及消息流、科学计算等特殊场景。...
JVM上数据处理语言的竞争：Kotlin, Scala 和 SPL
2022-09-08 13:59

鸨哥学JAVA的博客基于 JVM 的开源数据处理语言主要有 Kotlin、Scala、SPL，下面对三者...本文的适用场景设定为项目开发中常见的数据处理和业务逻辑，以结构化数据为主，大数据和高性能不作为重点，也不涉及消息流、科学计算等特殊场景。
润乾报表CookBook与使用
2021-05-31 16:40

润乾软件的博客 1. 数据源相关 1.1 报表工具连接文本数据 1.2 报表工具连接非关系数据库（待补充） 1.3 报表异构数据源关联混算 1.4 报表工具 json 数据源 1.5 报表工具连 sap hana 1.6 报表工具连 Mongondb Mongondb 计算 ...
ClickHouse教程 — 第二章 ClickHouse快速入门
2022-11-22 16:24

西木Qi的博客 Hive的126倍 MySQL的429倍 Greenplum的10倍 Spark的1倍 Clickhouse的缺点：不支持事务（这其实也是大部分OLAP数据库的缺点）。稀疏索引使得它不适合通过主键进行单行的查询。所以它不适用于需要快速查询单行数据的...
没有解决我的问题, 去提问

悬赏问题

¥15 用verilog实现tanh函数和softplus函数
¥15 Hadoop集群部署启动Hadoop时碰到问题
¥15 求京东批量付款能替代天诚
¥15 slaris 系统断电后，重新开机后一直自动重启
¥15 QTableWidget重绘程序崩溃
¥15 谁能帮我看看这拒稿理由啥意思啊阿啊
¥15 关于vue2中methods使用call修改this指向的问题
¥15 idea自动补全键位冲突
¥15 请教一下写代码，代码好难
¥15 iis10中如何阻止别人网站重定向到我的网站

spark（自带hive）不能读取主子表的数据

1条回答 默认 最新

悬赏问题

1条回答默认最新