Hadoop 提交任务到执行任务耗时变长，该如何处理

问题遇到的现象和发生背景

YARN.NODEMANAGER.RESOURCE.CPU-VCORES=88;
YARN.NODEMANAGER.RESOURCE.MEMORY-MB=360G;
YARN.SCHEDULER.MINIMUM-ALLOCATION-MB=2G;
YARN.SCHEDULER.MINIMUM-ALLOCATION-VCORES=1;

CDH 6.3.2(Hadoop 3.0)集群上执行一个HIVE SQL或SPARK SQL，如下图日志所示，从任务提交到执行MR任务，需要70-80秒，正常情况下，只需5-6秒。任务能正常执行
完毕。执行时，指定了队列且队列资源（CPU & 内存）均较为空闲。请问，调整哪些参数，可以将时间缩短至正常范畴内？

问题相关代码，请勿粘贴截图

00:56:10 Starting Job = job_123456789,Tracking URL=http://MY_NAMENODE.8088/proxy/application_9876543210
00:56:10 Kill Command = /opt/cloudera/parcels/CDH-6.3.2-1/./bin/hadoop job -kill job_123456789
00:57:18 Hadoop job information for Stage-1: number of mappers:1; number of reduces: 0

运行结果及报错内容

我的解答思路和尝试过的方法

调整MR APPLICATION MASTER的OPT参数，调整为850M，内存为2G.

我想要达到的结果

将时间缩短至正常5-6秒

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
陈猿解码 2022-01-08 08:40
关注
建议先分析是哪里慢了？
执行SQL 到MR任务提交到yarn耗时多少?
MR任务从提交到yarn，到任务变成running状态耗时多少？
MR任务执行时间又是耗时多少？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【Hadoop】执行任务时出现resource.ResourceUtils: Unable to find 'resource-types.xml'. hadoop 大数据
2022-06-18 17:55

回答 1 已采纳如果没有用到GPU、FPGA可以不关注这个，不影响正常使用如果要使用gpu、fpga，需要通过这个文件指定gpu、fpga作为调度的一种资源例如： yarn.resource-t
上传文件到hadoop出问题 hadoop
2022-03-29 08:31

回答 3 已采纳先看这样能不能传 hadoop fs -put README.txt /input
Hadoop找不到命令 hadoop hdfs linux
2022-07-04 08:55

回答 1 已采纳被注释了
hadoop入门到精通
2020-01-26 14:07

laogooooog的博客 1、判断文件是否存在（判断该目录下是否有文件存在） hdfs dfs -test -e hdfs路径 if [ $? -eq 0 ] ;then echo ‘exist’ else echo ‘Error! Directory is not exist Or Zero bytes in size’ fi ...
搭建Hadoop出现以下问题怎么处理？ hadoop
2022-11-01 17:32

回答 1 已采纳你这个是问下配置有问题你的core. site.xml文件里边的内容写错了，你再去检查检查，。有错的文件都会提醒你的，因为你截图截的只有一部分，你再去看看其他有没有提示其他文件也有错的。
hadoop和大数据、spark的关系该怎么理解？ hadoop spark 大数据
2022-06-23 13:55

回答 1 已采纳 Hadoop和Spark都是处理大数据的框架。就象你说关系型数据库，这只是一个概念，但是代表了一系列的含意，比如数据是结构化的，基于关系模型存储的。而MySQL、Oracle、SqlServer这些就
hadoop version在执行后会自己增加两个路径 hadoop linux 大数据有问必答
2021-07-28 14:35

回答 2 已采纳需要重新设置jdk的路径,我猜想你没有进行配置,在hadoop下(在etc下)**找到hadoop-env.sh文件，用编译器打开这个文件.修改JAVA_HOME的路径为这种格式,配置Java环境时j
大数据Hadoop、Hive、Kafka、Hbase、Spark等框架面经
2021-12-05 15:47

For Coding的博客大数据Hadoop、Hive、Kafka、Hbase、Spark等框架面经
Hadoop格式化后找不到配置文件如何解决？ hadoop
2022-10-30 18:41

回答 1 已采纳你的core-site.xml 文件里边的内容写错了，你再去检查yixiaq还有就是你的免密没有配置，提示了没有主机路由，你要保证你的这三台主机的IP都是在同一个网段，然后在从新配置一下免密，
配置hadoop出现权限不够 hadoop
2022-10-28 17:28

回答 2 已采纳 sudo vim ./core-site.xml
hadoop中，reduce运行到33%卡不住不动 hadoop 大数据有问必答
2021-11-09 17:48

回答 1 已采纳有可能datanode有多处磁盘损坏了，你可以尝试关闭其中那个有问题的节点继续测试
Hadoop
2020-01-08 16:32

时ˇ移的博客 Hadoop大数据生态系统实验教程第1章欢迎来到大数据的世界 1.1 拥抱大数据当今的社会，是一个信息大爆炸的社会，社会在高速发展，科技发达，信息流通，人们之间的交流越来越密切，生活也越来越方便，大量的数据在...
在Ubuntu Hadoop集群执行分布式实例，hdfs没有输出结果也没有报错 hadoop hdfs ubuntu
2022-09-24 18:25

回答 2 已采纳 input目录里是不是没有文件呢？ cp $HADOOP_HOME/etc/hadoop/*.xml ./input
Hadoop大数据平台安装
2019-05-09 23:21

topduke的博客实验一：Hadoop大数据平台安装 16281002 杜永坤 1、实验目的在大数据时代，存在很多开源的分布式数据采集、计算、存储技术，本实验将熟悉并搭建几种常用的大数据采集、处理分析技术环境。《大数据技术》实验一...
hadoop生态圈知识总结
2020-11-26 15:06

sj天问的博客 Linux&Shell相关总结 Linux常用命令序号命令命令解释 1 top 查看内存 2 df -h 查看磁盘存储情况 ...查看报告系统运行时长及平均负载 7 ps -aux 查看进程 Shell常用工具 1）awk、sed、cut、
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月7日

悬赏问题

¥20 双层网络上信息-疾病传播
¥50 paddlepaddle pinn
¥15 Stata 面板数据模型选择
¥20 idea运行测试代码报错问题
¥15 网络监控：网络故障告警通知
¥15 django项目运行报编码错误
¥15 请问这个是什么意思？
¥15 STM32驱动继电器
¥15 Windows server update services
¥15 关于#c语言#的问题：我现在在做一个墨水屏设计，2.9英寸的小屏怎么换4.2英寸大屏

Hadoop 提交任务到执行任务 耗时变长，该如何处理