为什么大数据都喜欢用nosql?
在我的理解看来,类似于hbase之类的数据库,与传统的mysql比较,他们的优势在于分布式,灵活性,以及基于hdfs,可以储存海量的数据并且提供查询,mysql如果说数据量到一定程度之后就崩了?还有没有其他的原因大数据使用nosql的原因呢?
为什么大数据都喜欢用nosql?
在我的理解看来,类似于hbase之类的数据库,与传统的mysql比较,他们的优势在于分布式,灵活性,以及基于hdfs,可以储存海量的数据并且提供查询,mysql如果说数据量到一定程度之后就崩了?还有没有其他的原因大数据使用nosql的原因呢?
nosql和sql并不是一个对立的概念。
大数据其实不光使用nosql的数据库,也使用传统关系型数据库。
hbase和mysql最终要的一个差别就是存储上hbase是按列存储,mysql是按行存储。
大数据的很多问题都是基于单列去进行统计,那么按列存储的数据格式在这方面的优势就体现出来了,只要读取需要的数据就能轻松的做MapReduce,没有冗余。而对于按行存储的数据结构,你如果想读他的列,必须读取他的一整行。这就是场景差异导致了选型差异。