IDEA关联hadoop执行wordcount程序

output里面没有数据，jar包好像都导上了，就是不行，
Mapper代码如下


package com.atguigu.mapreduce.wordcount;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.util.Tool;
import java.io.IOException;
//KEYIN     map阶段输入的key类型：LongWritable
//VALUEIN   map阶段输入value类型：Text
//KEYOUT    map阶段输出的key类型：Text
//VALUEOUT  map阶段输出的value类型：IntWritable
class WordCountUpMR extends Configured implements Tool {
    @Override
    public int run(String[] strings) throws Exception {
        return 0;
    }
    public class WorldCountMapper extends Mapper<LongWritable, Text, Text, IntWritable> {
        private Text outK = new Text();
        private IntWritable outV = new IntWritable(1);
        @Override
        protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
            super.map(key, value, context);
            //1  获取一行，数据如下
            //atguigu atguigu
            String line = value.toString();
            //2  切割操作，成为
            //atguigu
            //atguigu
            String[] words = line.split(" ");
            //3  循环写出
            for (String word : words) {
                //封装outK
                outK.set(word);
                //写出
                context.write(outK, outV);
            }
        }
    }
}

Driver代码如下


package com.atguigu.mapreduce.wordcount;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import java.io.IOException;
public class WordCountDriver {
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        //1.获取job
        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf);
        //2.获取jar包路径
        job.setJarByClass(WordCountDriver.class);
        //3.关联mapper和reducer
        job.setMapperClass(WordCountUpMR.WorldCountMapper.class);
        job.setReducerClass(WorldCountReducer.class);
        //4.设置map输出的k-v类型
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        //5.设置最终输出的k-v类型
        job.setOutputKeyClass(Text.class);
        job.setMapOutputValueClass(IntWritable.class);
        //6.设置输入路径和输出路径
        FileInputFormat.setInputPaths(job,new Path("E:\\hadoop\\input"));
        FileOutputFormat.setOutputPath(job,new Path("E:\\hadoop\\output"));
        //7.提交job
        boolean result = job.waitForCompletion(true);
        System.exit(result ? 0 : 1);
    }
}

Reducer代码如下


package com.atguigu.mapreduce.wordcount;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

//KEYIN       reduce阶段输入的key类型：LongWritable
//VALUEIN     reduce阶段输入value类型：Text
//KEYOUT      reduce阶段输出的Key类型：Text
//VALUEOUT    reduce阶段输出的value类型：IntWritable
public class WorldCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
    private IntWritable outV = new IntWritable();
    @Override
    protected void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        int sum = 0;
        //atguigu,(1,1)
        //ss,(1,1)
        //进行累加
        for (IntWritable value : values) {
            sum += value.get();
        }

        outV.set(sum);

        //写出
        context.write(key,outV);
    }
}

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

运行hadoop自带的wordcount程序时报错 hadoop
2021-11-18 09:16

回答 2 已采纳不是提示要有输入（IN）和输出（OUT）么你这个参数 /hdfs/test/wctest.txt/hdfstest/output 中间没有空格不应该是 /hdfs/test/wctest.t
新手，hadoop上运行wordcount程序报错 hadoop
2017-09-09 08:20

回答 1 已采纳 http://blog.csdn.net/crazyzhb2012/article/details/9258247
hadoop第一个程序WordCount出现的问题 hadoop hdfs 大数据
2018-11-07 13:10

回答 2 已采纳 sum += value.get(); -> sum = 1; break;
大数据hadoop-wordcount实例（手把手教学）
2022-05-28 09:08

乐小琛的博客安装ideal 配置jdk 配置主机的hadoop环境变量，D:\01_software\hadoop-3.1.0 hadoop-3.1.0文件建议安装到没有中文，...使用vim命令创建wordcount.txt文件夹，并将文件夹上传至HDFS的/input 文件夹下。 [atguigu@hado.
IDEA运行hadoop集群报错 hadoop idea 有问必答
2021-12-04 16:26

回答 1 已采纳你代码中获取了args中的参数，这个是需要配置的。如果觉得麻烦，直接将代码中涉及args[]取值的地方替换为具体的值。 idea中运行args作为接收参数的程序_Luke
hadoop 运行wordcount出错 hadoop
2021-10-01 19:28

回答 3 已采纳 Container [pid=7204,containerID=container_1607355221856_0001_01_000002] is running b
hadoop运行wordcount时main程序的输入参数不是2个 jar java linux
2019-11-10 17:31

回答 1 已采纳调试下你的args数组的长度是多少。
hadoop入门使用MapReduce编写 WordCount程序（一）
2023-03-31 13:08

Long long ago.的博客 org.apache.hadoop.io.nativeio.NativeIOException: 当文件已存在时，无法创建该文件”3、以管理员身份运行你的ide(我适应的是idea),如果在配置环境变量前已经打开，关闭再重新打开。5、编写Mapper。6、编写reduce。
大数据、Hadoop hadoop 大数据
2022-12-19 16:44

回答 1 已采纳 format只需要对NameNode做，如果你在node3做了也没关系，删除node3上的、hdfs-site.xml中配置的NameNode对应的目录即可，然后在node1上也删除相同的目录后，重新
Hadoop wordcount 错误 hadoop 有问必答
2021-10-01 14:09

回答 1 已采纳不至于吧，很明显已经给你提示了hdfs://master:8020/user/root/wcinput不存在，你仔细检查hdfs上这个路径是否存在，另外这是输入，你为啥写文件夹，而不是精确到文件？
hadoop和大数据、spark的关系该怎么理解？ hadoop spark 大数据
2022-06-23 13:55

回答 1 已采纳 Hadoop和Spark都是处理大数据的框架。就象你说关系型数据库，这只是一个概念，但是代表了一系列的含意，比如数据是结构化的，基于关系模型存储的。而MySQL、Oracle、SqlServer这些就
大数据之hadoop中的MapReduce（WordCount实例）
2021-11-18 11:29

独创之上的博客 MapReduce 是一个分布式运算程序的编程框架，是用户开发“基于 Hadoop 的数据分析应用”的核心框架。 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个...
hadoop HA测试Wordcount报错 hadoop
2022-03-23 16:55

回答 1 已采纳是端口号的问题吗你将报错的信息百度一下
尚硅谷大数据hadoop教程_mapReduce
2023-05-30 23:35

莫等闲白了少年头的博客（4）启动Hadoop集群 [atguigu@hadoop102 hadoop-3.1.3]sbin/start-dfs.sh [atguigu@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh （5）执行WordCount程序 [atguigu@hadoop102 hadoop-3.1.3]$ hadoop jar wc.jar ...
大数据hadoop3.1.3——WordCount案例操作--Windows本地提交集群以及打jar包到集群上执行
2020-04-16 19:41

Carson_xcb的博客 WordCount案例实操 1．需求在给定的文本文件中统计输出每一个单词出现的总次数（1）输入数据到*.txt文件，预计出现次数如下： banzhang 1 cls 2 hadoop 1 jiao 1 ss 2 xue 1 2．需求分析按照MapReduce编程规范，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月23日

悬赏问题

¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示

IDEA关联hadoop执行wordcount程序

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新