weixin_48484941 2021-12-09 10:28 采纳率: 62.5%
浏览 19
已结题

spark+hbase范围查询比传统数据库慢么?

同样的一条sql,传统数据库在建立索引的情况下,耗时2s,但是spark+hbase 耗时10+分钟。

SELECT
    t1.bsm,
    bt2.bsm 
FROM
    testtable t1
    JOIN testtable t2 ON t1.LEFT BETWEEN t2.LEFT 
    AND t2.RIGHT 
    AND (
    t1.top BETWEEN t2.top 
    AND t2.bottom 
    OR t1.bottom BETWEEN t2.top 
    AND t2.bottom

请问各位。是我这边少了些什么嘛?还是说spark+hbase范围查询就是这么慢的。

  • 写回答

1条回答 默认 最新

  • 星空*秋雨 2021-12-09 12:21
    关注

    你这个表有多大,在数据量不大的情况下,肯定是传统的数据库快,spark还要一些启动过程啥。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月22日
  • 已采纳回答 12月14日
  • 创建了问题 12月9日

悬赏问题

  • ¥50 深度学习运行代码直接中断
  • ¥15 关于#单片机#的问题,请各位专家解答!
  • ¥15 关于#单片机#的问题,请各位专家解答!
  • ¥20 需要完整的共散射点成像代码
  • ¥15 编写vba代码实现数据录入工作
  • ¥15 做过TCL海信电视小米电视相关影视会员软件私我
  • ¥15 Mapreduce是正常的,在运行其他jar包时并没有任何问题,只是在做LogCount.jar 时出的问题。如图所示
  • ¥15 ImportError: DLL load failed while importing _iterative: 找不到指定的模块。
  • ¥15 如何通过交互分析得出某高危患者对放疗获益更多
  • ¥15 相关性分析中,p<0.05, r=0.29,怎么评价相关性呢