hadoop单词统计报错Job job_1581768459583_0001 failed

3个节点hadoop01、hadoop02、hadoop03
hadoop01是主节点
hadoop01、hadoop02、hadoop03是从节点，目前集群已搭建好，jps查看三个节点运行都很正常，而且UI也能正常显示，但是使用hadoop自带的hadoop-mapreduce-examples-2.7.4.jar的wordcount进行单词统计时报错如下，请高人指点，看不懂呀：

```[root@hadoop01 mapreduce]# hadoop jar hadoop-mapreduce-examples-2.7.4.jar wordcount /wordcount/input /wordcount/output
20/02/15 20:14:25 INFO client.RMProxy: Connecting to ResourceManager at hadoop01/192.168.233.132:8032
20/02/15 20:14:27 INFO input.FileInputFormat: Total input paths to process : 1
20/02/15 20:14:27 INFO mapreduce.JobSubmitter: number of splits:1
20/02/15 20:14:28 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1581768459583_0001
20/02/15 20:14:28 INFO impl.YarnClientImpl: Submitted application application_1581768459583_0001
20/02/15 20:14:28 INFO mapreduce.Job: The url to track the job: http://hadoop01:8088/proxy/application_1581768459583_0001/
20/02/15 20:14:28 INFO mapreduce.Job: Running job: job_1581768459583_0001
20/02/15 20:15:38 INFO mapreduce.Job: Job job_1581768459583_0001 running in uber mode : false
20/02/15 20:15:38 INFO mapreduce.Job: map 0% reduce 0%
20/02/15 20:15:38 INFO mapreduce.Job: Job job_1581768459583_0001 failed with state FAILED due to: Application application_1581768459583_0001 failed 2 times due to Error launching appattempt_1581768459583_0001_000002. Got exception: java.io.IOException: Failed on local exception: java.io.IOException: java.io.IOException: Connection reset by peer; Host Details : local host is: "hadoop01.com/79.124.78.101"; destination host is: "79.124.78.101":43276;
at org.apache.hadoop.net.NetUtils.wrapException(NetUtils.java:776)
at org.apache.hadoop.ipc.Client.call(Client.java:1480)
at org.apache.hadoop.ipc.Client.call(Client.java:1413)
at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:229)
at com.sun.proxy.$Proxy83.startContainers(Unknown Source)
at org.apache.hadoop.yarn.api.impl.pb.client.ContainerManagementProtocolPBClientImpl.startContainers(ContainerManagementProtocolPBClientImpl.java:96)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:191)
at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:102)
at com.sun.proxy.$Proxy84.startContainers(Unknown Source)
at org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher.launch(AMLauncher.java:119)
at org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher.run(AMLauncher.java:250)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Caused by: java.io.IOException: java.io.IOException: Connection reset by peer
at org.apache.hadoop.ipc.Client$Connection$1.run(Client.java:688)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:422)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1746)
at org.apache.hadoop.ipc.Client$Connection.handleSaslConnectionFailure(Client.java:651)
at org.apache.hadoop.ipc.Client$Connection.setupIOstreams(Client.java:738)
at org.apache.hadoop.ipc.Client$Connection.access$2900(Client.java:376)
at org.apache.hadoop.ipc.Client.getConnection(Client.java:1529)
at org.apache.hadoop.ipc.Client.call(Client.java:1452)
... 16 more
Caused by: java.io.IOException: Connection reset by peer
at sun.nio.ch.FileDispatcherImpl.read0(Native Method)
at sun.nio.ch.SocketDispatcher.read(SocketDispatcher.java:39)
at sun.nio.ch.IOUtil.readIntoNativeBuffer(IOUtil.java:223)
at sun.nio.ch.IOUtil.read(IOUtil.java:197)
at sun.nio.ch.SocketChannelImpl.read(SocketChannelImpl.java:380)
at org.apache.hadoop.net.SocketInputStream$Reader.performIO(SocketInputStream.java:57)
at org.apache.hadoop.net.SocketIOWithTimeout.doIO(SocketIOWithTimeout.java:142)
at org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:161)
at org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:131)
at java.io.FilterInputStream.read(FilterInputStream.java:133)
at java.io.BufferedInputStream.fill(BufferedInputStream.java:246)
at java.io.BufferedInputStream.read(BufferedInputStream.java:265)
at java.io.DataInputStream.readInt(DataInputStream.java:387)
at org.apache.hadoop.security.SaslRpcClient.saslConnect(SaslRpcClient.java:367)
at org.apache.hadoop.ipc.Client$Connection.setupSaslConnection(Client.java:561)
at org.apache.hadoop.ipc.Client$Connection.access$1900(Client.java:376)
at org.apache.hadoop.ipc.Client$Connection$2.run(Client.java:730)
at org.apache.hadoop.ipc.Client$Connection$2.run(Client.java:726)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:422)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1746)
at org.apache.hadoop.ipc.Client$Connection.setupIOstreams(Client.java:726)
... 19 more
. Failing the application.
20/02/15 20:15:38 INFO mapreduce.Job: Counters: 0

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
m0_73571101 2023-10-31 10:44
关注
从提供的错误日志中，可以看到以下几点信息：

有关于连接被对方重置（Connection reset by peer）的错误。
错误发生在与ResourceManager的连接上，特别是在尝试设置SASL连接时。
出现了Java的IOException。
基于这些信息，以下是可能的解决方案：

防火墙或安全组规则：确保没有任何防火墙或安全组规则阻止节点间的通信。Hadoop需要多个端口开放，以支持各种服务之间的通信。确保所有需要的端口都是开放的，并且各个节点之间可以互相通信。

/etc/hosts文件：检查所有节点上的/etc/hosts文件，确保它们正确地指向了每个节点的IP地址。如果您在/etc/hosts中使用了主机名，确保它们是全限定域名（FQDN），并且YARN和Hadoop的配置文件中也使用了相同的名称。

SASL配置：确保您的集群中的SASL配置是正确的。Hadoop的安全模式（Kerberos身份验证）需要正确的SASL配置。如果您不使用安全模式，确保相关的配置是关闭的。

版本不兼容：尽管这是一个较小的可能性，但某些Hadoop组件版本可能不兼容。确保您使用的所有组件版本都是互相兼容的。

日志文件：查看ResourceManager和NodeManager的详细日志文件，这可能会为您提供更多关于问题的线索。尤其是看看是否有与权限、身份验证或网络相关的错误。

资源问题：确保您的集群上有足够的资源（如内存、CPU、磁盘空间等）来运行作业。资源不足可能会导致任务失败。

重启服务：有时简单地重启Hadoop服务可能会解决问题。

总之，这种类型的问题通常涉及网络、配置或资源问题。建议按照上述步骤逐一检查，并密切关注相关日志以获取更多线索。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Job job_local1138799368_0001 failed with state FAILED due to: NA报错我的解决过程
2022-02-21 13:13

BigData_OldBird的博客前几天运行mapreduce包了错，搞了好久都没明白是怎么回事，去找解决方法，说Job job_local1138799368_0001 failed with state FAILED due to: NA报错是权限问题要给root权限，试了不行，还有说代码错误，输入输出的...
Hive运行任务报错：Ended Job = job_1685266933359_0001 with errors Error during job, obtaining debugging info
2023-05-28 18:45

执着与它共情的博客 Ended Job = job_1685266933359_0001 with errors Error during job, obtaining debugging info 原因是namenode内存空间不够，jvm不够新job启动导致。
关于sqoop把数据从hive导出到 mysql报错：Job job_1606700530042_12034 failed with state FAILED due to: Task failed
2021-03-06 10:38

Khalil Fang@1010的博客从日志信息中，看不出来什么东西,所以要定位到hadoop的yarn中调度的这个任务点击查看历史信息中的 logs 中的 full log, 仔细查看后发现： mysql 中这个字段值类型设置了不能为 Null，而数据中有部分数据是 null...
解决执行MapReduce代码是报如下错误: Job job_1607082280342_0001 failed with state FAILED due to: Task failed task_
2021-03-20 14:50

坏孩子充电自习室的博客 Error: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class cn.itcast.mapreduce.WordCountMapper not found 错因： 1.忘记导入jar 包路径 ...2.导包错误添加链接描述 3.解决问题最根本的方案，...
【Hadoop】Hadoop运行Mapreduce程序一直卡在mapreduce.Job: Running job: job_1617678192164_0001
2021-04-06 11:19

飝鱻.的博客重启，发现没有用于是又换了一种方法：更改mapred-site.xml 将下面的 <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> 改为 <property> <name>mapreduce.job.tracker</name> ...
练习mapreduce的案例出现错误Job job_local2058909726_0001 failed with state FAILED due to: NA
2020-03-06 14:30

weixin_43728831的博客在练习mapreduce自定义inputformat的...2020-03-06 14:20:21,068 INFO [org.apache.hadoop.mapreduce.Job] - Job job_local2058909726_0001 running in uber mode : false 2020-03-06 14:20:21,068 INFO [org.apach...
INFO mapreduce.Job: Job job_1609687269347_0001 failed with state FAILED due to: Task failed task_160
2021-01-03 23:59

荔枝zj的博客当遇到job错误时，可以打开job，查看错误再解决 21/01/03 10:24:54 INFO mapreduce.Job: map ...21/01/03 10:24:58 INFO mapreduce.Job: Job job_1609687269347_0001 failed with state FAILED due to: Task failed ta
hadoop词频统计报错,没解决
2017-08-21 19:59

wsow的博客 Caused by: java.io.FileNotFoundException: D:/tmp/hadoop-qw%20song/mapred/local/localRunner/qw%20song/jobcache/job_local1813302185_0001/attempt_local1813302185_0001_m_000000_0/output/file.out.index ...
hadoop job java_java编译通过，但是在hadoop上运行卡在jobrunning，然后报错timeout，是为什么呢？...
2021-03-07 22:48

柯南大夫的博客 hadoop jar load.jar caivbslist /user/ip/public/cbill_ticket_cdma_voice/201608/20160805 /user/ip/public/cbill_ticket_ivpn/201608/20160805 /user/ffcs_sales/private/output/load_interface/2016080...
hadoop集群部署上后，在服务器中运行hadoop自带的jar包中的实例报错
2024-10-07 17:32

微风&浅影的博客 HADOOP_MAPRED_HOME=${full path of your hadoop distribution directory}（将这一串红字用得到的classpath代替）
没有解决我的问题, 去提问

hadoop单词统计报错Job job_1581768459583_0001 failed

1条回答 默认 最新

1条回答默认最新