Hadoop如何实现将计算逻辑分发到各个子节点上的

在研究了一段hadoop后，对hadoop的分布式架构有了一定的了解，都知道移动计算比移动数据效率更高，那么hadoop是如何将计算移动到各个节点上进行计算的呢？我猜想是将计算的逻辑和其依赖的包都分发到了各个节点上，然后再在各自的节点上进行计算，不知道是不是这样，希望大家能把细节补充的更完善。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
flyfoxs 2014-08-12 14:21
关注
Hadoop 的NameNode 知道集群的计算资源分布,数据存储分布.

在分布任务的时候,需要对数据进行切分,然后进行计算. 这个时候分配就需要考虑数据的存储位置.

Hadoop会尽量将计算分布到数据存储的节点上.
如果存储的节点没用资源,比如CPU完全被占用.那会尽量将计算分布到数据存贮节点相同机架上的节点进行计算.
最后如果还是没办法做到,那就只能随机的选取一个节点了.

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

大数据技术之Hadoop(五)——Zookeeper
2023-01-09 01:17

雨诺风的博客 "><a href="#%EF%BC%885%EF%BC%89%E4%BF%AE%E6%94%B9hadoop02.bgd01%E3%80%81hadoop03.bgd01%20%E4%B8%8A%E7%9A%84myid%E6%96%87%E4%BB%B6%E5%86%85%E5%AE%B9">（5）修改hadoop02.bgd01、hadoop03.bgd01 上的myid...
Hadoop生态圈 大数据文档
2021-12-01 09:45

BigData_XiaoBai的博客文档基于介绍基于Hadoop的大数据生态圈。介绍下图每一个组件的使用场景及使用方法，同时还对每一个组件有更深入的介绍。 ...
关于大数据系统及Hadoop系统中的概念
2022-10-18 16:10

盛者无名的博客理论上讲，单台计算机可以处理任意规模的数据，对于超过单台计算机存储量的海量数据，可以存放到类似网络附属存储(network attached storage,NAS)这样的共享存储设备中，然后输入到单台计算机去计算处理。...
分布式计算框架Hadoop核心组件
2022-10-22 20:03

wql2008的博客分布式计算框架Hadoop核心组件分布式计算框架Hadoop核心组件
大数据领域Hadoop的故障排查与解决方法
2026-01-03 02:02

AI软件工程实践的博客 Hadoop作为Apache顶级项目，已成为企业级大数据平台的"标配"。但分布式系统的天然复杂性（跨节点通信、多组件协作、硬件异构）导致故障排查难度极高。本文聚焦Hadoop 2.x/3.x版本，覆盖HDFS（分布式文件系统）和YARN...
揭秘大数据领域Hadoop的作业调度机制
2025-09-22 21:13

AI 搜索引擎技术的博客在分布式计算领域，Hadoop作为开源大数据处理平台的标杆，其作业调度机制直接影响集群资源利用率和任务执行效率。本文旨在揭示Hadoop调度系统的核心设计原理，通过对YARN（Yet Another Resource Negotiator）架构的...
基于hadoop集群的交通大数据信息采集系统设计（支持资料参考_相关定制）
2025-05-22 18:51

d1_189的博客本文以交通信息和数据分析为研究目标，以Hadoop大数据平台为研究工具，以街道交通采集为研究和系统设计的实际问题。首先，根据大数据分析的需要，建立了大数据采集数据采集与分析系统，以实现对基本道路信息，时间...
猿创征文｜Hadoop大数据技术
2022-09-06 08:00

啊Q老师的博客 Hadoop大数据技术
大数据领域分布式计算的技术峰会亮点
2025-05-11 15:41

光子AI的博客分布式计算作为大数据处理的核心基础设施，其技术演进直接影响着企业数据价值的挖掘效率。全球顶级技术峰会（如...本文以“技术演进主线+行业实践”为逻辑，首先梳理分布式计算的核心概念与峰会关注的技术方向；
大数据面试宝典
2025-03-12 15:25

_admin_12138的博客集成了SQL、Hadoop、Hive等面试内容的核心问题点
没有解决我的问题, 去提问

Hadoop如何实现将计算逻辑分发到各个子节点上的

4条回答 默认 最新

4条回答默认最新