spark+hbase范围查询比传统数据库慢么？

同样的一条sql，传统数据库在建立索引的情况下，耗时2s，但是spark+hbase 耗时10+分钟。

SELECT
    t1.bsm,
    bt2.bsm 
FROM
    testtable t1
    JOIN testtable t2 ON t1.LEFT BETWEEN t2.LEFT 
    AND t2.RIGHT 
    AND (
    t1.top BETWEEN t2.top 
    AND t2.bottom 
    OR t1.bottom BETWEEN t2.top 
    AND t2.bottom

请问各位。是我这边少了些什么嘛？还是说spark+hbase范围查询就是这么慢的。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
星空*秋雨 2021-12-09 12:21
关注
你这个表有多大，在数据量不大的情况下，肯定是传统的数据库快，spark还要一些启动过程啥。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大数据Hadoop+HBase+Spark+Hive集群搭建教程(七月在线)1
2022-08-03 16:50

在构建大数据处理环境时，Hadoop、HBase、Spark和Hive是四个核心组件，它们协同工作以实现高效的数据存储、处理和分析。本教程将详细介绍如何在Ubuntu系统上搭建这些组件的集群。 1. **Hadoop**：Hadoop是Apache...
Spark + HBase 大数据实战指南（上）
2024-11-26 22:56

桥路丶的博客通过以上介绍，我们已经详细探讨了如何利用 Spark 和 HBase 解决大规模数据处理的问题。希望本篇文章能够为您提供有价值的参考和启示，如果您有任何疑问或建议，欢迎随时交流讨论。1、目前星球内，环境一键安装教程...
Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署
2022-06-22 10:10

Spark的优势在于它的内存计算能力，允许快速处理数据，比传统的MapReduce更快。安装Spark时，需要与Hadoop版本兼容，并配置相关环境变量。 Hive是基于Hadoop的数据仓库工具，它可以将结构化的数据文件映射为一张...
不懂大数据分布式？Spark+Hbase+Hadoop+微服务+Netty教你学
2024-12-02 15:11

程序员高级码农.的博客今天分享的就特别有趣了，总共分为五大实战技术文档：Spark、Hadoop、Hbase、Netty、还有微服务分布式。第一部分，就先介绍Hadoop实战吧作为云计算所青睐的分布式架构，Hadoop 是一个用Java语言实现的软件框架，...
基于Spark的实时日志分析及异常检测系统 Flume + Kafka + Hbase + Spark-Streaming
2024-03-14 16:13

3. **HBase**：HBase 是一个基于 Google Bigtable 架构的开源非关系型数据库，运行在 Hadoop 文件系统之上。在这个系统中，HBase 作为数据持久化存储层，用于存储经过分析后的日志数据。由于 HBase 支持实时读写和...
大数据实习hdfs+flume+kafka+spark+hbase+hive项目.zip
2025-01-01 20:28

此项目集成了Hadoop分布式文件系统（HDFS）、Flume、Kafka、Spark、HBase和Hive，这些是当前大数据处理中广泛使用的工具。通过该项目，实习人员能够深入理解并应用这些工具在实际大数据处理中的协同工作流程。首先...
大数据基础+Hadoop+HDFS+HBase+Hive+MapReduce+Spark
2025-01-10 23:51

HBase特别适合用来实现大数据的实时查询和存储，能够处理超过10亿行和数百万列的数据。在本课程文件中，提供了HBase的安装和编程实践指南，帮助学生和工程师掌握如何在Hadoop生态系统中部署和使用HBase。 Hive则是...
基于spark streaming+flume+kafka+hbase的实时日志处理分析系统.zip
2024-03-14 16:12

与传统的流处理框架相比，Spark Streaming利用Spark的核心能力，提供了高吞吐量、容错性和可伸缩性。在本系统中，Spark Streaming负责接收来自Flume的数据流，进行实时处理和分析，如聚合、过滤、窗口操作等，从而...
大数据开发-大数据自动化部署-包括hadoop+hive+hbase+spark+storm等组件.zip
2024-04-02 17:09

本资料主要涵盖了大数据开发以及自动化部署相关的技术，包括Hadoop、Hive、HBase、Spark和Storm等关键组件。这些组件构成了一个全面的大数据处理生态系统，各自承担着不同的职责。 Hadoop是Apache基金会的一个开源...
Spark + HBase 数据处理和存储实验
2022-05-06 09:23

zyw2002的博客文章目录实验三: Spark + HBase 数据处理和存储实验1. 实验目的2. 实验环境3. 实验内容3.1 Spark3.1.0 Spark简介3.1.1 功能实现3.1.1.1 创建RDD3.1.1.2 持久化操作3.1.1.3 数据读取与保存3.1.2 WordCount实验3.1.3 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月9日

spark+hbase范围查询比传统数据库慢么？

1条回答 默认 最新

问题事件

1条回答默认最新