关于某大数据项目技术选型的问题请教

我们有一个项目，采集了全国各地运营车辆的相关信息，如gps定位，油耗，车速等。

车辆每10秒上报一次数据，全国车辆每天上报的数据量约为一亿条左右，占用存储约150g/天。

数据上报上来后，并不会对这些数据进行修改，主要用于对数据进行离线分析，另外也对某个具体的车辆轨迹在地图上进行轨迹查询回放。

离线分析一般是按日，周，月，季，年进行离线分析，统计完了放到rdbms就是死数据，对数据实时性要求并不高。

系统的用户数约有5000人。

技术选型：
由于数据量比较大，担心用传统RDBMS存储的话分析性能太差，计划用flume+hbase+spark框架实现，心里一直担忧几个问题：

这种场景适合用大数据吗？用hbase+spark是不是杀鸡用牛刀了？

数据量虽然比较大，但用户规模比较小，在线用户数才500人，用hbase进行存储合适吗？用hbase对单车的明细轨迹数据进行查询速度快吗？

3.数据上报上来后存储到某个目录，统计时有简单聚合操作，也有计算平均值和同环比分析，用以下哪种方式合适？
a. flume->spark（数据清洗)->hbase->spark(离线分析)->mysql
b. flume->kafka->spark streaming（数据清洗)->hbase->spark (离线分析)->mysql。
c.flume->kafka->spark streaming （数据清洗和聚合统计)->hbase->spark (离线分析，均值，同环比，年报月报)->mysql

麻烦各位前辈指点指点，越详细越好，谢了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

报告相同问题？

关注问题

大数据视频项目的架构选型问题，急急急急急急急急急急急急急急急大数据架构
2015-11-24 04:00

回答 2 已采纳前端用flex，后端用流媒体服务器就可以了。如果是双向实时授课，也可以用现成的网络会议软件。没必要自己做。
android与j2ee交互技术选型问题
2013-10-17 17:11

回答 2 已采纳使用Spring MVC 提供RestFul的api给andorid app调用;
关于element ui 选型改造的问题讨论越多还是越少？ html5 vue.js
2021-05-28 17:04

回答 3 已采纳 1.最好不要剪掉element-ui的api因为很多都是依赖其他的api 2.讲实话现在不是大量数据操作，根本对性能没有影响 3.element-ui作为vue最受欢迎的组件库，其api强大和性能
大数据面试题总结
2020-12-28 16:20

鸭梨山大哎的博客介绍一下最近的项目？目前在研究什么技术？如何判定一个表是事实表还是维度表？数据建模过程说一下？三范式知道吗，说一下？数据仓库模型建设可以使用范式建模吗，你是怎么看的？缓慢变化维处理...
请教：关于技术选型
2009-07-13 00:30

回答 4 已采纳淘宝是用java 框架用到 apache+jboss spring iBATIS 自己开发类似STRUTS的MVC框架 oracle + mysql 缓存:
开发Windows原生桌面应用程序的技术选型 asp.net c# microsoft visual studio
2019-03-05 09:40

回答 3 已采纳 1. 有JavaScript基础，该如何入门C# 基础语法差不多，面向对象的思想js也会遇到。快速入门的方法，个人觉得有2个：
关于JSP构建大型建材商务网站的框架选型问题
2011-10-21 16:24

回答 2 已采纳这些服务器都可以，关键是你会不会了。做网站前台ext不考虑
面经Java开发
2024-03-18 20:16

你比人间更美好的博客问公司人员架构，问公司技术架构或者问你自己工作中遇到的问题，当然也可以虚心请教刚才面试中没打出来的问题每日物流一面： 14、Redis删除策略及区别？惰性删除定期删除 16、主从读写的原理？ 17、索引失效？ ...
求助 Java模块之间无侵入式设计解决方案 java java-ee spring
2019-09-05 14:20

回答 3 已采纳提供一个思路：利用spring aop机制，定义一个注解，如@AddPoint，注解的拦截处理类中实现积分的相关操作，将注解加在需要处理积分的方法（如登录模块的方法）上就可以了。具体实现去网上
java做开发一般用什么做缓存？ java
2020-05-07 16:37

回答 2 已采纳 3.2、分布式缓存(Redis、Memcached等nosql) 服务端的应用数据，一般考虑放在分布式缓存Redis中
求推荐项目管理系统框架 java vue.js
2021-09-07 14:21

回答 3 已采纳这个 Bladex 也是个相对不错的选择（前面那个 Jeecg 太贵了...） BladeX 快速开发平台,官方网站,基于SpringBoot,SpringCloud的微
【总结】1038- 校招前端在字节跳动一年的收获
2021-08-03 08:20

pingan8787的博客很幸运能在刚毕业的时候就有机会自主对一个C端组件库从技术选型到开发落地，当时调研了公司内外的C端组件库技术方案，结合我们业务的特点整理了一套技术方案。除了实现组件库本身，也适当“折腾”了一下，比如...
规则引擎方案选型，大佬们给出你专业的意见 java
2019-02-21 15:47

回答 1 已采纳规则引擎我推荐：aviator；原因是已经用于生产，并且是作用于规则引擎类型的系统中，可以支持很多复杂的规则表达式，以及自定义函数（计数，唯一计数，中位数等函数实现）；首先用规则引擎，它首先一个是
在北京做Java开发如何月薪达到两万，需要技术水平达到什么程度？
2018-05-06 21:38

HD243608836的博客觉得没有目标的时候看一看大家讨论到的技术点，就知道欠缺在哪了。共勉吧！转载自:https://www.zhihu.com/question/39890405在北京做Java开发如何月薪达到两万，需要技术水平达到什么程度？请具体一点说要会什么技术...
2018 大数据面试
2018-10-02 16:01

Simple_Zz的博客 大数据工程师(开发)面试 1.HBase和Hive都是基于Hadoop，为什么Hive查询起来非常慢，但HBase不是？ Hive是类SQL引擎，其查询都需要遍历整张表，跑MapReduce自然很慢，但HBase是一种NoSQL的列式数据库，基于Key/...
没有解决我的问题, 去提问

悬赏问题

¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建
¥15 数据可视化Python
¥15 要给毕业设计添加扫码登录的功能！！有偿
¥15 kafka 分区副本增加会导致消息丢失或者不可用吗？
¥15 微信公众号自制会员卡没有收款渠道啊
¥100 Jenkins自动化部署—悬赏100元
¥15 关于#python#的问题：求帮写python代码
¥20 MATLAB画图图形出现上下震荡的线条
¥15 关于#windows#的问题：怎么用WIN 11系统的电脑克隆WIN NT3.51-4.0系统的硬盘

码龄粉丝数原力等级 --

关于某大数据项目技术选型的问题请教

0条回答默认最新

悬赏问题

关于某大数据项目技术选型的问题请教

0条回答 默认 最新

悬赏问题

0条回答默认最新