Hadoop序列化问题，实现WritableComparable，readFields报错EOFException

 public class MyKey implements WritableComparable<MyKey> {

    //flag == 1 : user
    //flag == 0 : shopping
    private Integer flag;
    private Integer u_id;
    private Integer s_id;
    private Integer s_u_id;
    private String u_info;
    private String s_info;

    @Override
    public int compareTo(MyKey o) {
        if (flag.equals(1)){
            //user
            return u_id - o.u_id;
        }else {
            //shopping
            return s_id - o.s_id;
        }
    }

    @Override
    public void write(DataOutput out) throws IOException {
        out.writeInt(flag);
        out.writeInt(u_id);
        out.writeInt(s_id);
        out.writeInt(s_u_id);
        out.writeUTF(u_info);
        out.writeUTF(s_info);
    }

    @Override
    public void readFields(DataInput in) throws IOException {
        flag = in.readInt();
        u_id = in.readInt();
        s_id = in.readInt();
        s_u_id = in.readInt();
        u_info = in.readUTF();
        s_info = in.readUTF();
    }
}

报错异常

2018-10-08 19:55:15,246 INFO Configuration.deprecation: mapred.skip.on is deprecated. Instead, use mapreduce.job.skiprecords
2018-10-08 19:55:15,250 INFO mapred.LocalJobRunner: reduce task executor complete.
2018-10-08 19:55:15,253 WARN mapred.LocalJobRunner: job_local85671337_0001
java.lang.Exception: java.lang.RuntimeException: java.io.EOFException
at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:492)
at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:559)
Caused by: java.lang.RuntimeException: java.io.EOFException
at org.apache.hadoop.io.WritableComparator.compare(WritableComparator.java:165)
at org.apache.hadoop.mapreduce.task.ReduceContextImpl.nextKeyValue(ReduceContextImpl.java:158)
at org.apache.hadoop.mapreduce.task.ReduceContextImpl.nextKey(ReduceContextImpl.java:121)
at org.apache.hadoop.mapreduce.lib.reduce.WrappedReducer$Context.nextKey(WrappedReducer.java:302)
at org.apache.hadoop.mapreduce.Reducer.run(Reducer.java:170)
at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:628)
at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:390)
at org.apache.hadoop.mapred.LocalJobRunner$Job$ReduceTaskRunnable.run(LocalJobRunner.java:347)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Caused by: java.io.EOFException
at java.io.DataInputStream.readInt(DataInputStream.java:392)
at sortjoin.MyKey.readFields(MyKey.java:43)
at org.apache.hadoop.io.WritableComparator.compare(WritableComparator.java:158)
... 12 more
2018-10-08 19:55:15,962 INFO mapreduce.Job: Job job_local85671337_0001 running in uber mode : false
2018-10-08 19:55:15,964 INFO mapreduce.Job: map 100% reduce 0%

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
huwao 2018-10-09 00:53
关注
这个异常是自带的异常，可以忽略的；该异常是输入流已经到结尾了的标志,我们可以将其捕获,然后不做任何操作,即结束了该次反序列化操作。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Hadoop-2.4.1学习之RawComparator及其实现
2014-12-19 14:59

skyWalker_ONLY的博客本篇文章结合源代码学习了RawComparator接口及其实现，并分析了不同实现的区别
Hadoop MapReduce二次排序算法与实现之实现
2018-10-08 16:16

zerone-f的博客转自：一起学Hadoop——二次排序算法的实现二次排序，从字面上可以理解为在对key排序的基础上对key所对应的值value排序，也叫辅助排序。一般情况下，MapReduce框架只对key排序，而不对key所对应的值排序，因此...
IDEA开发第二个Hadoop程序TQ
2020-09-03 22:09

achu19的博客 TQ介绍数据、要求如下表： ...import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; i
Hadoop
2020-01-08 16:32

时ˇ移的博客 Hadoop大数据生态系统实验教程第1章欢迎来到大数据的世界 1.1 拥抱大数据当今的社会，是一个信息大爆炸的社会，社会在高速发展，科技发达，信息流通，人们之间的交流越来越密切，生活也越来越方便，大量的数据在...
Hadoop学习03之MapReduce案例
2019-09-25 16:13

心的步伐的博客在一组含有时间年月日时分秒以及此时温度的数据中，通过hadoop的map&reduce取出一个月中温度最高的两个数据。数据如下： 1949-10-01 14:21:02 34c 1949-10-01 19:21:02 38c 1949-10-02 14:01:02 36c 1950-01...
Hadoop中的HDFS讲解
2018-02-23 10:46

wsfd600的博客 Hadoop中的HDFS讲解HDFS 性能详解HDFS 天生是为大规模数据存储与计算服务的，而对大规模数据的处理目前还有没比较稳妥的解决方案。 HDFS 将将要存储的大文件进行分割，分割到既定的存储块(Block)中进行了存储，并...
一起学Hadoop——二次排序算法的实现
2018-09-11 23:34

weixin_30595035的博客二次排序，从字面上可以理解为在对key排序的...但是我们经常会遇到同时对key和value排序的需求，例如Hadoop权威指南中的求一年的高高气温，key为年份，value为最高气温，年份按照降序排列，气温按照降序排列。还有水...
MapReduce的一个令我不解的问题
2020-08-08 17:16

一定要努力啊！！的博客 MapReduce的一个令我不解的问题问题的产生写MR的思路问题的产生自己在做一个关于用户数据行为分析的项目。首先先看一下项目的数据吧！因为导师说之后的数据量更大，所以我需要使用Hive进行数据存储和使用...
Hadoop项目实战之多类型输入
2019-01-09 21:18

说文科技的博客 Hadoop项目实战之多类型输入 1.背景在日常的需求中，可能遇到的问题是：如果MapReduce job的任务需要的数据源在不同的文件中怎么办？例如：需要从文本文件user.txt中得到一批数据；从另外一个文本文件transactions....
MapReduce运行问题记录
2018-11-28 15:32

weiiL的博客具体问题通过hadoop jar的方式提交jar包，但是只能本地运行Local_job。解决方法 hadoop部署包下/etc/hadoop/yarn.xml配置出错。缺少如下配置，添加即可。 &amp;amp;lt;property&amp;amp;gt;...
没有解决我的问题, 去提问

Hadoop序列化问题，实现WritableComparable，readFields报错EOFException

1条回答 默认 最新

1条回答默认最新