大数据项目技术选型问题请教

我们有一个项目，采集了全国各地运营车辆的相关信息，如gps定位，油耗，车速等。

车辆每10秒上报一次数据，全国车辆每天上报的数据量约为一亿条左右，占用存储约150g/天。

数据上报上来后，并不会对这些数据进行修改，主要用于对数据进行离线分析，另外也对某个具体的车辆轨迹在地图上进行轨迹查询回放。

离线分析一般是按日，周，月，季，年进行离线分析，统计完了放到rdbms就是死数据，对数据实时性要求并不高。

系统的用户数约有5000人。

技术选型：
由于数据量比较大，担心用传统RDBMS存储的话分析性能太差，计划用flume+hbase+spark框架实现，心里一直担忧几个问题：

这种场景适合用大数据吗？用hbase+spark是不是杀鸡用牛刀了？
数据量虽然比较大，但用户规模比较小，在线用户数才500人，用hbase进行存储合适吗？用hbase对单车的明细轨迹数据进行查询速度快吗？

3.数据上报上来后存储到某个目录，统计时有简单聚合操作，也有计算平均值和同环比分析，用以下哪种方式合适？
a. flume->spark（数据清洗)->hbase->spark(离线分析)->mysql
b. flume->kafka->spark streaming（数据清洗)->hbase->spark (离线分析)->mysql。
c.flume->kafka->spark streaming （数据清洗和聚合统计)->hbase->spark (离线分析，均值，同环比，年报月报)->mysql

麻烦各位前辈指点指点，越详细越好，谢了

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

大数据领域数据产品的技术选型指南
2025-10-02 17:27

AI量化价值投资入门到精通的博客本文的目的就是为大家提供一个详细的技术选型指南，涵盖大数据存储、处理、分析等方面的技术，帮助大家在开发数据产品时做出明智的决策。本文首先介绍大数据技术的核心概念，包括存储技术、处理技术等；然后详细讲解...
项目中怎样做技术选型
2021-11-09 22:35

编程一生的博客引出四个维度工作快十五年了，从十年前开始经常会有新项目，需要从头开始做方案和设计。做技术选型很少成为我的难题。不是因为这方面我多有方法，而通常是很少有选择。在做技术选型的场景下基本有以下四...
别再盲目地堆砌技术了！大部份大数据项目的失败，都是因为架构设计没做对！
2025-11-21 15:28

六边形架构的博客需建立数据采集、存储、处理、服务和治理分层架构，遵循业务导向、成熟稳定、可扩展性和团队适配原则进行技术选型。实施应先评估规划，通过试点验证，再全面推广，循序渐进，持续优化，重视数据质量和成本控制。
招联金融研发总监姜良雷做客选型宝亲身讲述大数据平台选型历程
2019-07-12 17:23

选型宝的博客 2014年，参与了招联金融（招行与联通的合资公司）的筹建，主导了招联大数据平台的选型和实施的全过程。本期的访谈，将从姜总的选型故事开始讲起…… PART1 提问招联金融姜良雷殷勇（选型宝CEO）：首先请姜...
2018 大数据面试
2018-10-02 16:01

Simple_Zz的博客 大数据工程师(开发)面试 1.HBase和Hive都是基于Hadoop，为什么Hive查询起来非常慢，但HBase不是？ Hive是类SQL引擎，其查询都需要遍历整张表，跑MapReduce自然很慢，但HBase是一种NoSQL的列式数据库，基于Key/...
大数据面试题总结
2020-12-28 16:20

鸭梨山大哎的博客介绍一下最近的项目？目前在研究什么技术？如何判定一个表是事实表还是维度表？数据建模过程说一下？三范式知道吗，说一下？数据仓库模型建设可以使用范式建模吗，你是怎么看的？缓慢变化维处理...
3种思维方式助你成为顶级大数据开发工程师【职场进阶指南】
2024-08-10 19:15

数据小羊的博客本文深入探讨如何培养至少三种解决问题的方法，平衡技术深度与广度。从Spark到Flink，从批处理到流处理，掌握多样化技能让你在竞争中脱颖而出。通过实践案例、专家洞见和自我评估，助你成为跨界创新的数据工程师。...
从码农到技术Leader：5大核心能力、3个关键动作，帮你一年内跨越大厂P6→P7生死线
2025-07-14 00:03

数据与算法架构提升之路的博客想一年跃升P7？先跳出代码，盯业务指标、带4人小队、向上同步风险与资源需求，深耕一技术领域成内部权威，用量化结果说话，让领导省心，让团队高效，商业洞察+技术深度+领导力三线并进，晋升水到渠成。
Hadoop核心技术分布式
2024-12-17 10:29

黄静雯•ᴗ•的博客咱们就来深入学习 Hadoop 伪分布式部署，这可是掌握 Hadoop 技术的重要一步哦。 1、SSH 免密登录配置（一）远程登录方式在机器之间进行远程控制时，SSH 是常用的安全通信协议。比如，在机器 1 上远程控制机器 2，...
C 快速切入看懂项目
2025-04-16 16:16

_沧浪之水_的博客查看单元测试（Unit Tests）、集成测试（Integration Tests）...向项目负责人或资深开发者请教，了解项目的背景、技术选型和设计思路。查看注释：代码中的注释可能包含关键信息，比如函数的作用、参数说明和调用逻辑。
没有解决我的问题, 去提问

码龄粉丝数原力等级 --

大数据项目技术选型问题请教

0条回答默认最新

大数据项目技术选型问题请教

0条回答 默认 最新

0条回答默认最新