2 siegecat siegecat 于 2016.05.01 15:43 提问

以前认为数据库就是一层,但现在学习的Hbase,HDFS的数据库,怎么感觉是多层?应怎样理解?

以前学习数据库时,就只知道MySql,就这一个东西就是数据库。
但现在学习大数据,了解到
Titan graph数据库建立在HBase数据库之上,而HBase又要建立在HDFS之上。
这里就把数据库分成了三层,最顶层是Titan, 中间是HBase,下面是HDFS,
问题就是:
1.它们每层应该叫什么名字啊?顶层叫数据库框架吗?中间层叫后端数据库?底层叫分布式文件系统数据库?
2.它们各个组件(层次)之间的关系应该怎样理解更好?
3.MySql一个数据库是不是将上面几个层次的功能都包含了,比如包含了HBase对表的约束定义等功能,也包含了类似HDFS将数据最终怎样存放到磁盘上的功能?

1个回答

caozhy
caozhy   Ds   Rxr 2016.05.01 23:47

之所以分层,有两个目的,一个是简化某一块代码的复杂度,另一个是代码的复用,比如说同样的负载平衡,后面可以搭配不同的数据库,反之亦然。
至于叫什么名字这个无所谓,你可以按照层实现的功能叫它一个名字呗。

siegecat
siegecat 谢谢你的回答。但我的问题可能没说明白,你说到负载均衡,这个一般是由某些资源调度工具实现,比如zookeeper.调度工具的后面自然可以搭配不同的数据库。但我的问题是,这个titan称为数据库,而Hbase也称为数据库,数据库建立在数据库之上,这种重复就感觉有点让人迷惑了。能麻烦你解释一下吗?
大约 2 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
HBase与MongDB等NoSQL数据库对比
转载请注明出处:  jiq•钦's technical Blog - 季义钦 一、开篇 淘宝之前使用的存储层架构一直是MySQL数据库,配合以MongDB,Tair等存储。 MySQL由于开源,并且生态系统良好,本身拥有分库分表等多种解决方案,因此很长一段时间内都满足淘宝大量业务的需求。但是由于业务的多样化发展,有越来越多的业务系统的需求开始发生了变化。一般来说有以下几类变化
HBase是什么?
HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。 HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统(HDFS)提供的容错能力。 它是Hadoop的生态系统,提供对数据的随机实时读/写访问,是Hadoop文件系统的一部分。 人们可以直接或通过HBase的存储HDFS数
NoSQL数据库:MongoDB与Hbase的区别
1.Mongodb bson文档型数据库,整个数据都存在磁盘中,hbase是列式数据库,集群部署时每个familycolumn保存在单独的hdfs文件中。 2.Mongodb 主键是“_id”,主键上面可以不建索引,记录插入的顺序和存放的顺序一样,hbase的主键就是row key,可以是任意字符串(最大长度是 64KB,实际应用中长度一般为 10-100bytes),在hbase内部,
HBase学习总结(2):HBase介绍及其基本操作
(HBase是一种数据库:Hadoop数据库,它是一种NoSQL存储系统,专门设计用来快速随机读写大规模数据。在已成功安装并正常启动的前提下,本文介绍HBase的基本操作。) 一、HBase简介 什么是HBase(Hadoop Database)呢?有以下两种常见的说法: 第一,它是一种稀疏的、分布式的、持久化的、多维有序映射,它基于行键(row key)、列键(column key)和时间戳
hbase技术介绍
关于hbase的入门知识.hbase是基于hdfs建立的数据库,可扩展性强。
HBase (分布式的、面向列的开源数据库) 基础概念
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
关系型数据库的理解
1.关系型数据库简单的可以理解为二维数据库,表的格式就如Excel,有行有列。常用的关系数据库有Oracle,SqlServer,Informix,MySql,SyBase等。(也即是我们平时看到的数据库,都是关系型数据库) 2.所谓关系型数据库,是指采用了关系模型来组织数据的数据库。关系模型是在1970年由IBM的研究员E.F.Codd博士首先提出,在之后的几十年中,关系模型的概念得到了充分的
Hbase数据迁移
HBase 数据迁移方案(集群互通) Export and Import 方法(1) 在旧集群上把hbase数据库中的表导出。 使用:hbase org.apache.hadoop.hbase.mapreduce.Export HbaseTable hdfs://newclusteriP:8020/user/data/HbaseTable. 其中HbaseTable 是hbase数据表名。把Hbas
强制格式化hadoop,清除HBase数据
自己配置的Hadoop+Hbase集群,之前正常运作,向集群中导入了120G的数据;隔了一段时间在此往里面导入数据,各种出错,最明显的就是某个节点的regionserver自动关闭,随之而来的就是其他节点也相继自动关闭,但HMaster运作正常。作为新手,日志看不懂,百度google不到问题所在,无奈之下,只能强制格式化hadoop,清除HBase数据,从零开始: 1、删除各个节点中hdfs目录
突然感觉自己就像是井底之蛙!
偶然间看了一些博友的文章,让我很惭愧,也很有危机感,初步工作的日子很累, 没有继续学习的决心,再这样下去,迟早会被淘汰的,IT行业更新的实在是太快,太快了