HDFS分布式和Hbase region 分区疑惑

今天看Hbase分区的文章看到这样一句话：
HBase通过将region切分在许多机器上实现分布式。也就是说，你如果有16GB的数据，只分了2个region，你却有20台机器，有18台就浪费了。

然后产生疑惑：
Hbase是用HDFS来存储数据的，HDFS是分布式的（将数据放到不同机器上），既然这样的话，为啥文章中说会浪费？

这就好比是：
分布式*分布式
分布式* 非分布式
前面试HDFS造成的分布，后面是Hbase造成的分布

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
天下一瓢 2020-05-21 17:08
关注
看到浏览245 ，看来有很多人有我一样的疑惑，即是Hbase的region存入hdfs底层到底是如何实现的？以我所知，
hdfs写入数据并不能指定由哪台datenode来存贮，一切皆由namenode来分配，你只能指定逻辑文件夹路径。
而Hbase明确说明每个region放入一台 region server，那么问题来了，到底这里发生了什么？有没有深入Hbase
底层的大神来解答一下。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么用Java调用hdfs的时候不需要密码 hadoop java 有问必答
2022-03-10 21:07

回答 2 已采纳其实hdfs是可以给用户配置密码的。要是有需求就去搞个kerberos认证，或者去装个sentry、ranger。再一个一般来讲hdfs服务都是在内网环境部署，也不太需要更强的安全性。
hdfs本地查看器java java
2022-11-01 14:56

回答 4 已采纳用绝对路径看看你最好把异常完全打印，你这样没法排查问题的
前端传过来的图片，怎么存储到hbase中 hbase hdfs java 有问必答
2021-08-08 21:47

回答 1 已采纳图片肯定放到一个指定的路径下面，然后数据库里面存储图片的地址，比如图片上传到本地 public Map<String,Object> upload(MultipartFile myIm
分布式数据库HBase的架构设计详解（有彩蛋）
2021-08-18 19:00

叶涛网站推广优化的博客　原标题：分布式数据库HBase的架构设计详解(有彩蛋) 　本文根据DBAplus社群第99期线上分享整理而成，文末还有好书送哦~ 　讲师介绍　　陈鸿威　云财经大数据CTO 　曾任百度高级工程师，现主持设计开发云...
hive分区表数据备份到HDFS hive 有问必答
2021-08-02 14:12

回答 1 已采纳有了有了，谢谢大家，是我自己疏忽了。导入HDFS本地文件系统也是需要加local的，我以为本地文件系统是计算机文件系统正确代码:insert overwrite local directory。一定要
直接将hbase数据存磁盘和存hdfs的区别是什么？ hbase
2021-07-08 10:38

回答 2 已采纳 hdfs和磁盘的区别在于 hdfs从设计上存在分布式高可用可控副本数，Block块等特别，磁盘目前还无法满足，且生态上目前都是兼容hdfs而不是磁盘。存储的设计底层还是数据结构不一样，可以从这方向思
怎么在hdfs上下载文件传给前端 hdfs java spring
2023-01-05 14:13

回答 9 已采纳 String fileName = "xxx"; response.reset(); response.setContentType("application/x-msdownload
大数据技术原理与应用第二篇大数据存储与管理（一）分布式文件系统HDFS和分布式数据库HBase
2022-11-12 11:18

月望曦的博客大数据技术原理与应用第二篇大数据存储与管理中 分布式文件系统HDFS和分布式数据库HBase 知识点总结与理解
java hdfs krb5 怎么跳过krb5 java
2020-05-14 16:22

回答 1 已采纳 https://blog.csdn.net/c5113620/article/details/104051030
使用hdfs上传文件报错org.apache.hadoop.hdfs.CannotObtainBlockLengthExceptio hadoop hdfs java
2022-08-15 11:47

回答 6 已采纳信息不足不是很好判断，找了下源码，报错的方法如下： /** Read the block length from one of the datanodes. */ private long rea
在Ubuntu Hadoop集群执行分布式实例，hdfs没有输出结果也没有报错 hadoop hdfs ubuntu
2022-09-24 18:25

回答 2 已采纳 input目录里是不是没有文件呢？ cp $HADOOP_HOME/etc/hadoop/*.xml ./input
分布式数据库HBase
2022-02-16 13:30

取个名字真难啊啊的博客 分布式数据库HBase概述BigTableHBase简介HBase与传统关系型数据库的对比分析HBase数据模型数据模型相关概念数据坐标概念视图物理视图面向列的存储HBase的实现原理HBase的功能组件表和regionRegion的定位HBase运行...
客户端去操作hdfs时，出现异常 hadoop hdfs java 大数据
2018-10-17 11:52

回答 2 已采纳 https://issues.apache.org/jira/browse/HADOOP-14586 是不是用了java9版本，java版本降低一下试试
HBase Region原理总结归纳
2020-09-01 15:46

闻香识代码的博客 HBase Region原理总结 1. 环境准备基于Hadoop 3.2.1 基于zookeeper 3.4.6 基于Hbase 2.2.5 资料来源：官网http://hbase.apache.org/2.2/book.html 网络博客、视频等资料 2.HBase数据存储概述 2.1 hbase概述 ...
HBase Region 简介和建议数量&大小
2022-10-26 16:26

Mumunu-的博客建议分配合理的region数量，根据写请求量的情况，一般20-200个之间，可以提高集群稳定性，排除很多不确定的因素，提升读写性能。所以，如果一个HRegion中Memstore过多，而且大部分都频繁写入数据，每次flush的开销...
没有解决我的问题, 去提问

悬赏问题

¥15 cgictest.cgi文件无法访问
¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。

HDFS分布式和Hbase region 分区疑惑

1条回答 默认 最新

悬赏问题

1条回答默认最新