hadoop比spark的优势?

最近入门spark，但是网上都是说spark的优势，速度快。可是现在很多企业是hadoop结合spark，说明hadoop也有他的优势面？
所以hadoop比spark优势，更擅长什么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CJEQ 2014-12-04 17:20
关注
spark确实在一定方面比mapreduce快，比如机器学习的迭代过程，spark是把中间的数据保存在内存中，在每次迭代的时候直接从内存中提取，而mapreduce一直是IO传输，速度比spark慢。但是在相对的比较大，长时间处理与存储的数据来说，还是hadoop相对来说有可取的地方，所以很多企业都是结合起来用，或者更改源代码来获得更大效率

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hadoop和大数据、spark的关系该怎么理解？ hadoop spark 大数据
2022-06-23 13:55

回答 1 已采纳 Hadoop和Spark都是处理大数据的框架。就象你说关系型数据库，这只是一个概念，但是代表了一系列的含意，比如数据是结构化的，基于关系模型存储的。而MySQL、Oracle、SqlServer这些就
spark hadoop 怎么多人协作开发？ hadoop spark
2022-06-07 00:40

回答 3 已采纳这取决于你需要解决什么问题，如果只是临时跑一下批处理任务用到spark大可local模式跑跑完了，真要构建完整的hadoop生态你这一台云服务器够呛，内存低了甚至跑不起来全部组件
Hadoop和spark hadoop spark
2023-03-01 10:46

回答 2 已采纳 Hadoop中的MR中每个map/reduce task都是一个java进程方式运行，好处在于进程之间是互相独立的，每个task独享进程资源，没有互相干扰，监控方便，但是问题在于task之间不方便共享
Hadoop与Spark是什么？
2022-06-20 17:48

星光落入你灰蒙蒙的眼的博客 hadoop：存储和处理大数据； spark：只处理大数据。
关于hadoop和spark大数据开发大数据
2016-06-12 05:52

回答 2 已采纳你好本人刚在大数据库处理方面学习对此有以下理解 1，大数据处理看到的注重点是对数据处理，字段与字段在oracle与oracle ，oracle与mysql，oracle与mariadb等数据
spark和hadoop hadoop spark 大数据
2022-12-23 16:57

回答 2 已采纳集群还在启动吧，还是在安全模式，无法创建文件夹，稍等一会儿集群完全启动成功后就可以了。
大数据、Hadoop hadoop 大数据
2022-12-19 16:44

回答 1 已采纳 format只需要对NameNode做，如果你在node3做了也没关系，删除node3上的、hdfs-site.xml中配置的NameNode对应的目录即可，然后在node1上也删除相同的目录后，重新
大数据：Spark与Hadoop有哪些区别？
2021-04-14 17:58

传智教育的博客 Hadoop与Spark都是大数据计算框架，但是两者各有自己的优势，Spark与Hadoop的区别主要有以下几点。 1、编程方式 Hadoop的MapReduce在计算数据时，计算过程必须要转化为Map和Reduce两个过程，从而难以描述复杂的数据...
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
spark yarn需要部署多个spark吗？ spark
2021-07-04 22:12

回答 2 已采纳如果任务推送至yarn上，实际的工作节点为 nodeManager节点。与hive道理相同，hive默认跑mapreduce，单节点的hql查询也是推送任务至yarn上，工作节点为nodeManage
推荐系统&spark和hadoop hadoop python spark
2022-04-22 23:16

回答 1 已采纳 spark：主要用于海量数据的统计计算，跟做不做大屏没关系，比如进行机器学习。hadoop：主要用到的就是数据的分布式存储，海量的数据和日志，如果想留存，就用它来存储吧。做大屏统计是比较直观的数据结果
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）
2022-12-17 20:06

showswoller的博客【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）
hadoop hdfs dfs没有任何反应？ hadoop hdfs 大数据
2022-10-04 19:13

回答 1 已采纳不是没有反应，而是目录下没有文件，所以ls后没有内容可以显示，可以试试ls /
大数据篇（一） Spark简介以及和hadoop的对比
2021-07-25 14:22

林木森^~^的博客 Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 2.和Hadoop的关系 Hadoop Hadoop 是由 java 语言编写的，在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架作为 Hadoop ...
GBase UP对比Hadoop/Spark社区的大数据平台的优势
2022-05-17 15:53

kevin爸的博客优势体现在以下几点：（1）不局限于HDFS存储，可以防止HDFS存储上局限性，综合OLTP，MPP，Hadoop等各个引擎优势，将各种数据存储到最合适...（4）对于SQL操作，MPP的综合能力优于SQL on Hadoop 和SQL on Spark。 ...
没有解决我的问题, 去提问

悬赏问题

¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 HLs设计手写数字识别程序编译通不过
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。
¥15 TYPCE母转母，插入认方向

hadoop比spark的优势?

1条回答 默认 最新

悬赏问题

1条回答默认最新