hadoop第一个程序WordCount出现的问题

我用mapreduce做单词的统计
数据：

map程序


public class MyMapper extends Mapper<LongWritable,Text,Text,LongWritable> {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        Text word = new Text();
        LongWritable one = new LongWritable(1);
        //将Text转为String
        String line = value.toString();
        //分词
        String[] wordArr = line.split("\\s+");

        word.set(wordArr[0]);
        //将词的次数放入context
        context.write(word ,one);
    }
}

reduce程序：

public class MyReducer extends Reducer<Text,LongWritable,Text,LongWritable> {
    @Override
    protected void reduce(Text key, Iterable<LongWritable> values, Context context) throws IOException, InterruptedException {
        Long sum = 0L;
        for(LongWritable value:values){
            sum += value.get();
        }
        context.write(key,new LongWritable(sum));
    }
}

结果：

我只想统计第一列的词汇
想要的结果是
word 1
hello 1
hahha 1
ahaha 1

到底哪里出错了

展开全部

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2018-11-07 05:52
关注
sum += value.get();
->
sum = 1;
break;

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

新手，hadoop上运行wordcount程序报错 hadoop
2017-09-09 00:20

回答 1 已采纳 http://blog.csdn.net/crazyzhb2012/article/details/9258247
运行hadoop自带的wordcount程序时报错 hadoop
2021-11-18 01:16

回答 2 已采纳不是提示要有输入（IN）和输出（OUT）么你这个参数 /hdfs/test/wctest.txt/hdfstest/output 中间没有空格不应该是 /hdfs/test/wctest.t
大数据、Hadoop hadoop 大数据
2022-12-19 08:44

回答 1 已采纳 format只需要对NameNode做，如果你在node3做了也没关系，删除node3上的、hdfs-site.xml中配置的NameNode对应的目录即可，然后在node1上也删除相同的目录后，重新
大数据之hadoop中的MapReduce（WordCount实例）
2021-11-18 03:29

独创之上的博客 MapReduce 核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序，并发运行在一个 Hadoop 集群上。优点：易于编程（用户只关心业务逻辑即可）、良好的扩展性（可以动态增加服务器...
hadoop运行wordcount时main程序的输入参数不是2个 jar java linux
2019-11-10 09:31

回答 1 已采纳调试下你的args数组的长度是多少。
hadoop的第一练习，wordcount出错了。。。不知道这是怎么回事求指教。。 hadoop
2016-02-18 01:36

回答 2 已采纳 1、WordCount依赖的几个类没找到导致的。 2、像hadoop相关开发，可以先在eclipse或是netbean开发，打成jar包后，布署到linux上就可以了。 3、如果一定要
我的jar包在hadoop运行程序出现了问题（非代码错误） hadoop java 有问必答
2021-07-27 10:50

回答 2 已采纳可参考：https://blog.csdn.net/wk51920/article/details/51698042https://stackoverflow.com/questions/145540
大数据开发之Windows10上运行第一个hadoop实例wordcount
2022-12-16 06:36

茅草屋的屋的博客本文主要介绍了如何在在window 10上运行第一个hadoop程序wordcount
Hadoop wordcount 错误 hadoop 有问必答
2021-10-01 06:09

回答 1 已采纳不至于吧，很明显已经给你提示了hdfs://master:8020/user/root/wcinput不存在，你仔细检查hdfs上这个路径是否存在，另外这是输入，你为啥写文件夹，而不是精确到文件？
hadoop和大数据、spark的关系该怎么理解？ hadoop spark 大数据
2022-06-23 05:55

回答 1 已采纳 Hadoop和Spark都是处理大数据的框架。就象你说关系型数据库，这只是一个概念，但是代表了一系列的含意，比如数据是结构化的，基于关系模型存储的。而MySQL、Oracle、SqlServer这些就
Hadoop集群搭建时问题 big data hadoop 大数据
2022-02-09 00:07

回答 1 已采纳题主的hadoop102 和 hadoop103 应该没有开sudo 对吧，直接使用ssh进行命令的启动恐怕是不行的，可以尝试写一个跳转的shell到每个node中进行sudo启动，关于sudo权限
大数据hadoop通过wordcount示例程序
2022-09-30 09:00

破防大学生的博客如果显示hadoop未找到命令，则在.bashrc文件中添加命令。上传hadoop fs -put ~/words /test。...第一步：创建一个words文档。使文件生效以及测试是否修改成功。运行wordcount。在文件最上方添加命令。
大数据学习03之hadoop第一个MR程序wordcount单词统计
2019-09-28 06:20

moble_xie的博客我们可以使用集群中任务一台机器作为客户端，这样来说有几个弊端，第一hadoop总是优先读写离自己最近的节点，然后同步到其他的节点，这样导致该节点的压力倍增，第二容易误删文件，可能导致节点不可用，等等原因，...
Hadoop：第一个WordCount程序
2021-06-05 07:25

tone_xu的博客 第一个WordCount程序 1.新建一个空maven工程 2.pom.xml中引入以下依赖 <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <...
【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境（复杂版的WordCount）
2021-01-07 08:06

【大数据入门笔记系列】第五节 SpringBoot集成hadoop开发环境（复杂版的WordCount）前言环境清单创建SpringBoot项目创建包创建yml添加集群主机名映射hadoop配置文件环境变量HADOOP_HOME编写代码添加hadoop依赖jar包...
没有解决我的问题, 去提问

悬赏问题

¥15 DevEco studio开发工具真机联调找不到手机设备
¥15 请教前后端分离的问题
¥100 冷钱包突然失效，急寻解决方案
¥15 下载honeyd时报错 configure: error: you need to instal a more recent version of libdnet
¥15 距离软磁铁一定距离的磁感应强度大小怎么求
¥15 霍尔传感器hmc5883l的xyz轴输出和该点的磁感应强度大小的关系是什么
¥15 vscode开发micropython，import模块出现异常
¥20 Excel数据自动录入表单并提交
¥30 silcavo仿真，30分钟，只需要代码
¥15 FastReport 怎么实现打印后马上关闭打印预览窗口

hadoop第一个程序WordCount出现的问题

1条回答 默认 最新

悬赏问题

1条回答默认最新