Hadoop运行WordCount程序有输入，不生成输出的文件

代码如下：

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.util.GenericOptionsParser;

import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;

public class WordCountMapReduce {

public static void main(String[] args) throws Exception{

    Configuration configuration = new Configuration();

    String[] otherArgs = (new GenericOptionsParser(configuration, args)).getRemainingArgs();

    if (otherArgs.length < 2){

        System.out.println("Usage:wordcount<in>[<in>···]<out>");
        System.exit(2);

    }

    */

/**
* 设置环境参数
//

    Job job = Job.getInstance(configuration, "wordcount");

    */

/**
* 设置整个程序的类名
//

    job.setJarByClass(WordCountMapReduce.class);

    */

/**
* 添加Mapper类
//

    job.setMapperClass(WordCountMapReduce.WordCountMapper.class);

    */

/**
* ?
//

    //job.setCombinerClass(WordCountMapReduce.WordCountReducer.class);

    */

/**
* 添加Reducer类
//

    job.setReducerClass(WordCountMapReduce.WordCountReducer.class);

    */

/**
* 设置输出类型
//

    job.setOutputKeyClass(Text.class);

    */

/**
* 设置输出类型
//

    job.setOutputValueClass(IntWritable.class);

    for (int i = 0;i < otherArgs.length - 1;++i){

        */

/**
* 设置输入文件
//

        FileInputFormat.addInputPath(job, new Path(otherArgs[i]));

    }

    */

/**
* 设置输出文件
//

    FileOutputFormat.setOutputPath(job, new Path(otherArgs[otherArgs.length - 1]));

    System.exit(job.waitForCompletion(true)?0:1);

}

//map程序
public static class WordCountMapper extends Mapper<Object, Text, Text, IntWritable> {

    */

/*
* map方法是提供给map task进程来调用的，map task进程是每读取一行文本来调用一次我们自定义的map方法
* map task在调用map方法时，传递的参数：
* 一行的起始偏移量LongWritable作为key
* 一行的文本内容Text作为value
//

    private static final IntWritable one = new IntWritable(1);
    private Text word = new Text();

    public WordCountMapper() {
    }

    @Override
    protected void map(Object key, Text value, Mapper<Object, Text, Text, IntWritable>.Context context) throws IOException, InterruptedException {

        StringTokenizer stringTokenizer = new StringTokenizer(value.toString());

        while (stringTokenizer.hasMoreTokens()) {

            this.word.set(stringTokenizer.nextToken());
            context.write(this.word, one);

        }

    }
}

//reduce程序
*/

/*
* KEYIN：对应mapper阶段输出的key类型
* VALUEIN：对应mapper阶段输出的value类型
* KEYOUT：reduce处理完之后输出的结果kv对中key的类型
* VALUEOUT：reduce处理完之后输出的结果kv对中value的类型
//

public class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
    */

/*
* reduce方法提供给reduce task进程来调用
*
* reduce task会将shuffle阶段分发过来的大量kv数据对进行聚合，聚合的机制是相同key的kv对聚合为一组
* 然后reduce task对每一组聚合kv调用一次我们自定义的reduce方法
* 比如：
* hello组会调用一次reduce方法进行处理，tom组也会调用一次reduce方法进行处理
* 调用时传递的参数：
* key：一组kv中的key
* values：一组kv中所有value的迭代器
//

    private IntWritable intWritable = new IntWritable();

    public WordCountReducer(){
    }

    public void intWritable(Text key, Iterable<IntWritable>values, Reducer<Text, IntWritable, Text, IntWritable>.Context context)throws IOException, InterruptedException{

        int sum = 0;
        IntWritable val;

        for (Iterator i$ = values.iterator(); i$.hasNext(); sum += val.get()){

            val = (IntWritable)i$.next();

        }

        this.intWritable.set(sum);
        context.write(key, this.intWritable);

    }


}

}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
我才不菜Ծ‸Ծ 2022-06-24 10:20
关注
请问你解决了吗？怎么解决啊？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

hadoop运行wordcount时main程序的输入参数不是2个 jar java linux
2019-11-10 17:31

回答 1 已采纳调试下你的args数组的长度是多少。
Flink Java 运行WordCount程序报错 flink java 有问必答
2022-04-04 22:57

回答 2 已采纳本地执行需要去掉，依赖范围provided，可以查看我的微博，flink专栏
新手，hadoop上运行wordcount程序报错 hadoop
2017-09-09 08:20

回答 1 已采纳 http://blog.csdn.net/crazyzhb2012/article/details/9258247
运行wordcount.java_hadoop2编译运行wordCount.java程序
2021-03-13 06:43

唯我一心的博客在/usr/local目录中新建wordCount文件夹mkdir /wordCountecho "hello hadoop">./input/file1写入数据2。Hadoop 的 classhpath 信息添加到 CLASSPATH 变量中，在 ~/.bashrc 中增加：vi ~/.bashrc...
hadoop 运行wordcount出错 hadoop
2021-10-01 19:28

回答 3 已采纳 Container [pid=7204,containerID=container_1607355221856_0001_01_000002] is running b
运行hadoop自带的wordcount程序时报错 hadoop
2021-11-18 09:16

回答 2 已采纳不是提示要有输入（IN）和输出（OUT）么你这个参数 /hdfs/test/wctest.txt/hdfstest/output 中间没有空格不应该是 /hdfs/test/wctest.t
我的jar包在hadoop运行程序出现了问题（非代码错误） hadoop java 有问必答
2021-07-27 18:50

回答 2 已采纳可参考：https://blog.csdn.net/wk51920/article/details/51698042https://stackoverflow.com/questions/145540
hadoop 运行java程序_原生态在Hadoop上运行Java程序
2021-02-27 14:08

淇水煮汤的博客第一种：原生态运行jar包1，利用eclipse编写Map-Reduce方法，一般引入Hadoop-core-1.1.2.jar。注意这里eclipse里没有安装hadoop的插件，只是引入其匝包，该eclipse可以安装在windows或者linux中，如果是在windows中...
hadoop第一个程序WordCount出现的问题 hadoop hdfs 大数据
2018-11-07 13:10

回答 2 已采纳 sum += value.get(); -> sum = 1; break;
eclipse连接hadoop，dfs文件存在，但运行测试文件报错 hadoop java
2022-11-13 19:12

回答 1 已采纳已经解决啦，.xml文件下的端口出错了，更改后正常跑啦
Hadoop wordcount 错误 hadoop 有问必答
2021-10-01 14:09

回答 1 已采纳不至于吧，很明显已经给你提示了hdfs://master:8020/user/root/wcinput不存在，你仔细检查hdfs上这个路径是否存在，另外这是输入，你为啥写文件夹，而不是精确到文件？
hadoop运行java程序命令_使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0
2021-03-10 05:35

emi0wb的博客网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的，大多又是 0.20 等旧版本版本的做法，即javac -classpath /usr/local/hadoop/hadoop-1.0.1/hadoop-core-1.0.1.jar ...
hadoop格式化hdfs提示文件不存在怎么办 hadoop
2021-11-16 21:09

回答 1 已采纳你的core-site.xml 配置文件错了你没有生成log和hadooptmp，删了重配我前几天写了一个脚本，你可以借鉴一下
编译hadoop java_hadoop2编译运行wordCount.java程序
2021-02-27 15:24

蓝洱的博客在/usr/local目录中新建wordCount文件夹mkdir /wordCountecho "hello hadoop">./input/file1写入数据2。Hadoop 的 classhpath 信息添加到 CLASSPATH 变量中，在 ~/.bashrc 中增加：vi ~/.bashrc...
hadoop入门使用MapReduce编写 WordCount程序（一）
2023-03-31 13:08

Long long ago.的博客 org.apache.hadoop.io.nativeio.NativeIOException: 当文件已存在时，无法创建该文件”3、以管理员身份运行你的ide(我适应的是idea),如果在配置环境变量前已经打开，关闭再重新打开。5、编写Mapper。6、编写reduce。
没有解决我的问题, 去提问

悬赏问题

¥50 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？