运行mapreduce时reduce读取hdfs文件时出现乱码问题

程序最初是jar包在单机执行的，执行过程中同样使用了hdfs上的文件不过在执行jar包的时候指定了file.encoding=utf8所以未出现乱码问题
现在程序改成了mapreduce运行在集群上在reduce端读取了hdfs上的文件本想的是在reduce将数据量不多的数据读出做全局变量使用与map端输出过来的数据做比对结果reduce端读的数据乱码了本想在运行mapreduce的时候指定编码结果指定的编码都被当做jar包的入参解析了
文件都是utf8的服务器的lang也改成utf8了 jar包也是utf8编译的求大佬指点迷津

这个图是reduce端读文件做了基本处理后的输出

这个是输出的数据

这个是读hdfs的方法

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
有问必答小助手 2022-02-14 13:43
关注
你好，我是有问必答小助手，非常抱歉，本次您提出的有问必答问题，技术专家团超时未为您做出解答

本次提问扣除的有问必答次数，将会以问答VIP体验卡（1次有问必答机会、商城购买实体图书享受95折优惠）的形式为您补发到账户。

因为有问必答VIP体验卡有效期仅有1天，您在需要使用的时候【私信】联系我，我会为您补发。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Eclipse上运行MapReduce程序时，win10系统用户名中间有空格导致tmp文件生成&读取错误 eclipse java java-ee
2019-09-05 10:40

回答 4 已采纳 “请问有没有办法让本地的tmp文件换个地方生成？” 可以，但是只修改本地core-site.xml文件，添加 ``` hadoop.tmp.dir X:/x
MapReduce统计单词出现次数，但是结果显示出多个 hdfs mapreduce
2022-04-21 17:49

回答 2 已采纳发一下你的mr程序可能reduce阶段的代码写错了吧
idea里面运行mapreduce报这个错误，如何解决？ java mapreduce
2023-01-24 08:24

回答 1 已采纳望采纳！！新年快乐！！数据表中设置了主键(Primary Key)，而主键对应的值是不允许重复的。错误提示为：你插入的记录与数据表中原有记录的主键重复了(Duplicate)。所以插入失败。
【小白视角】大数据基础实践(五) MapReduce编程基础操作
2021-06-23 21:44

小生凡一的博客 MapReduce 简介1.1 起源1.2 模型简介1.3 MRv1体系结构1.4 YARN1.4.1 YARN体系结构1.4.2 YARN工作流程2. MapReduce 工作流程3. Java Api要点4. 实验过程最后 1. MapReduce 简介 1.1 起源在函数式语言里，map表示对...
hadoop 启动时datnode、resourcemanager没有启动。 hadoop hdfs mapreduce
2023-04-11 22:23

回答 1 已采纳以下内容部分参考ChatGPT模型：首先需要查看datanode和resourcemanager的日志文件，确定具体的错误信息。根据错误信息来定位问题所在。如果是datanode无法启动，可能是
debug调试无法运行 Method threw.Cannot evaluate org.apache.hadoop.mapreduce.Job.toString() hadoop mapreduce 大数据有问必答
2023-04-05 23:37

回答 2 已采纳参考这篇文章试下https://blog.csdn.net/weixin_37895026/article/details/125660368
利用eclipse编写MapReduce程序，打包运行的时候报错 eclipse hadoop mapreduce
2021-12-05 08:26

回答 1 已采纳数组越界了，从0开始访问，到3，java.lang.StringIndexOutOfBoundsException: String index out of range: 4你这个访问了4
hadoop：MapReduce （Writable）输出结果中文乱码解决
2020-05-09 02:58

花和尚也有春天的博客 hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式，但是对于中文的输出window系统默认的是GBK，有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时，输出的结果为乱码，只能由UE...
进行hdfs的上下载的时候，出现了空指针异常的问题 hadoop java maven
2022-12-27 17:05

回答 1 已采纳望采纳！点击该回答右侧的“采纳”按钮即可采纳！！！我猜原因可能是某些对象没有正确初始化。你可以尝试在这些对象使用前加上非空判断，或者检查是否存在某些配置参数或路径写错的情况。例如，你可以在主函数
Mr程序编写 driver 无法运行输出结果 hadoop mapreduce 大数据有问必答
2023-04-02 11:45

回答 2 已采纳程序报错了，把Caused by后面的错误贴出来。
hadoop第一个程序WordCount出现的问题 hadoop hdfs 大数据
2018-11-07 13:10

回答 2 已采纳 sum += value.get(); -> sum = 1; break;
大数据实训笔记4：mapreduce
2022-07-03 20:02

Roslin_v的博客介绍了mapreduce的核心思想，序列化与反序列化，并给出多个实际应用案例，包括过滤、排序、分区、组合、Join、在MySql中的读写操作。
Hadoop mapreduce传值问题 hadoop mapreduce 推荐算法
2018-04-25 00:52

回答 1 已采纳 step4输出的是 UserId\tItemId,Score，也就是Step5的Map的step4数据KEY是UserId，map的step2的数据KEY是itemID，肯定没办法走到同一个循环。
Hadoop生态圈（三十一）- MapReduce IO性能优化：文件类型
2022-02-09 17:22

大Null的博客 SequenceFile工具类，MapFile工具类，ORCFile工具类，ORC介绍，生成读取SequenceFile，生成读取MapFile文件，生成读取ORC文件
hadoop MapReduce 输出结果中文乱码解决
2017-07-19 16:43

ljtyxl的博客 hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式，但是对于中文的输出window系统默认的是GBK，有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时，输出的结果为乱码，只能由UE...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月10日

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

运行mapreduce时reduce读取hdfs文件时出现乱码问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新