hadoop的第一练习，wordcount出错了。。。不知道这是怎么回事求指教。。

有没有hadoop的前辈帮看看怎么回事，编译啊打包啊，都没错，就在最后用hadoop jar只想的时候报了错，我也看不太懂是哪里出的问题。源代码是在网上找的。

 import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

public class WordCount {
    public static class WordCountMap extends
            Mapper<LongWritable, Text, Text, IntWritable> {
        private final IntWritable one = new IntWritable(1);
        private Text word = new Text();

        public void map(LongWritable key, Text value, Context context)
                throws IOException, InterruptedException {
            String line = value.toString();
            StringTokenizer token = new StringTokenizer(line);
            while (token.hasMoreTokens()) {
                word.set(token.nextToken());
                context.write(word, one);
            }
        }
    }

    public static class WordCountReduce extends
            Reducer<Text, IntWritable, Text, IntWritable> {
        public void reduce(Text key, Iterable<IntWritable> values,
                Context context) throws IOException, InterruptedException {
            int sum = 0;
            for (IntWritable val : values) {
                sum += val.get();
            }
            context.write(key, new IntWritable(sum));
        }
    }

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        Job job = new Job(conf);
        job.setJarByClass(WordCount.class);
        job.setJobName("wordcount");
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        job.setMapperClass(WordCountMap.class);
        job.setReducerClass(WordCountReduce.class);
        job.setInputFormatClass(TextInputFormat.class);
        job.setOutputFormatClass(TextOutputFormat.class);
        FileInputFormat.addInputPath(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));
        job.waitForCompletion(true);
    }
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Exploring1024 2016-02-18 13:17
关注
1、WordCount依赖的几个类没找到导致的。

2、像hadoop相关开发，可以先在eclipse或是netbean开发，

打成jar包后，布署到linux上就可以了。 3、如果一定要在linux上开发并布署也可以，但必须要对linux上的类库加载与异常处理很熟悉。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

hadoop的第一练习，wordcount出错了。。。不知道这是怎么回事求指教。。 hadoop
2016-02-18 09:36

回答 2 已采纳 1、WordCount依赖的几个类没找到导致的。 2、像hadoop相关开发，可以先在eclipse或是netbean开发，打成jar包后，布署到linux上就可以了。 3、如果一定要
hadoop 运行wordcount出错 hadoop
2021-10-01 19:28

回答 3 已采纳 Container [pid=7204,containerID=container_1607355221856_0001_01_000002] is running b
hadoop第一个程序WordCount出现的问题 hadoop hdfs 大数据
2018-11-07 13:10

回答 2 已采纳 sum += value.get(); -> sum = 1; break;
大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc
2021-12-06 12:24

大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc
hadoop启动失败，不知道怎么回事 hadoop hbase sql
2022-04-18 21:06

回答 2 已采纳是不是hadoop的core-site.xml 或者 hdfs-site.xml 里的主机名配置错了？
大数据、Hadoop hadoop 大数据
2022-12-19 16:44

回答 1 已采纳 format只需要对NameNode做，如果你在node3做了也没关系，删除node3上的、hdfs-site.xml中配置的NameNode对应的目录即可，然后在node1上也删除相同的目录后，重新
hadoop集群测试pi实例出错 hadoop
2022-04-24 18:59

回答 1 已采纳你好，我之前测试成功过，如有帮助，请采纳！然后进入到etc/hadoop 目录下，使用命令vim mapred-site.xml将路径添加到<property></property
【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境（复杂版的WordCount）
2021-01-07 16:06

【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境（复杂版的WordCount）前言环境清单创建SpringBoot项目创建包创建yml添加集群主机名映射hadoop配置文件环境变量HADOOP_HOME编写代码添加hadoop依赖jar包...
虚拟机里启动hive出错这是哪里出了问题，还是Hadoop没有全部启动的问题，求解答？ hadoop hive
2021-11-20 15:08

回答 2 已采纳 hive的元数据没起，你在博客搜起hive元数据的命令，然后jps以后出现runjar，在起hive
Hadoop格式化出错是为什么😭 hadoop 有问必答
2022-04-10 21:19

回答 3 已采纳你这个错误是不是注解名和ip地址没有做好映射所导致的，你在hdfs-site.xml配置了主机名吧？有没有做好ip映射呢 vim /etc/hosts ip hadoop 修改后重启虚拟机rebo
Hadoop wordcount 错误 hadoop 有问必答
2021-10-01 14:09

回答 1 已采纳不至于吧，很明显已经给你提示了hdfs://master:8020/user/root/wcinput不存在，你仔细检查hdfs上这个路径是否存在，另外这是输入，你为啥写文件夹，而不是精确到文件？
大数据hadoop在windows中wordcount的实现
2020-10-27 09:01

本下载源于网络搜索，仅用于方面下载，其用于hadoop在windows中wordcount的实现，仅用于交流，勿喷
大数据框架中的hadoop和hive spark presto tez是什么关系 hadoop hive spark
2022-12-24 10:29

回答 1 已采纳 Hadoop是一个分布式计算框架，可以在大数据集上运行分布式应用程序。它由许多组件组成，包括HDFS（分布式文件系统）和MapReduce（分布式计算引擎）。Hive是一个基于Hadoop的数据仓库系
Hadoop大数据开发基础.rar
2023-10-14 21:51

├── 第1章 │ └── Hadoop基础 -01简介及架构.ppt ├── 第2章 │ ├── 1. 安装配置虚拟机.ppt │ ├── 2. 安装Java.ppt │ └── 3. 搭建Hadoop完全分布式集群.ppt ├── 第3章 │ └── Hadoop基础...
大数据开发之Windows10上运行第一个hadoop实例wordcount
2022-12-16 14:36

茅草屋的屋的博客本文主要介绍了如何在在window 10上运行第一个hadoop程序wordcount
没有解决我的问题, 去提问

悬赏问题

¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog
¥15 Excel发现不可读取的内容
¥15 关于#stm32#的问题：CANOpen的PDO同步传输问题