MapReduce分区输出ip并且统计个数（2

在使用mapReduce实现不同类别ip地址输出到不同文件如何统计每个类型ip地址的个数，将mapper结果用bean封装，分区主要靠partitioner实现，但是一直出现java.lang.ClassCastException的问题，按照网上的法子改了很多次都不行

Mapper

package com.topview.log;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/**
 * @Title:
 * @Package
 * @Description:
 * @author: Yeeasy
 **/
public class LogMapper extends Mapper<LongWritable,Text,LogBean, IntWritable> {

    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

        //178.199.96.56    2023-03-17 02:29:29    2023-03-17 03:09:25
        //获取一行
        String line = value.toString();
        //日志解析
        LogBean logBean = parseLog(line);

        //写出
        context.write(logBean, new IntWritable(1));
    }

    private LogBean parseLog(String line) {
        String[] fields = line.split("\t");
        if (fields[0].length() < 15) {
            return new LogBean(fields[0], fields[1], fields[2]);
        } else{
            return new LogBean();
        }
    }
}

Reducer

package com.topview.log;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.Reducer;
import java.io.IOException;

/**
 * @Title:
 * @Package
 * @Description:
 * @author: Yeeasy
 **/
public class LogReducer extends Reducer<LogBean,IntWritable,LogBean, NullWritable> {

    // 一组相同的key，调用一次reduce
    @Override
    protected void reduce(LogBean logBean, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        int count=0;
        for(IntWritable value:values){
            count++;
            context.write(logBean,NullWritable.get());
        }
    }

}

分区实现

package com.topview.log;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.mapreduce.Partitioner;

/**
 * @Title:
 * @Package
 * @Description:
 * @author: Yeeasy
 **/
public class ProvincePartitioner extends Partitioner<LogBean, IntWritable> {

    @Override
    public int getPartition(LogBean logBean, IntWritable intWritable, int i) {
        String logBeanIp=logBean.getIp();
        String[] key = logBeanIp.split("\\.");
        int ip = Integer.parseInt(key[0]);
        int partition = 0;
        if (ip > 0 && ip < 128) {
            partition = 0;
        } else if (ip > 127 && ip < 192) {
            partition = 1;
        } else if (ip > 191 && ip < 224) {
            partition = 2;
        } else if (ip > 223 && ip < 240) {
            partition = 3;
        } else if (ip > 239 && ip < 256) {
            partition = 4;
        } else {
        }
        return partition;
    }
}

Bean

package com.topview.log;

import org.apache.hadoop.io.Writable;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;

/**
 * @Title:
 * @Package
 * @Description:
 * @author: Yeeasy
 **/
public class LogBean implements Writable {
    private String ip;
    private String login;
    private String logout;

    public LogBean(){
        super();
    }

    public LogBean(String ip,String login,String logout){
        this.ip=ip;
        this.login=login;
        this.logout=logout;
    }

    @Override
    public void write(DataOutput dataOutput) throws IOException {
        //序列化
        dataOutput.writeUTF(ip);
        dataOutput.writeUTF(login);
        dataOutput.writeUTF(logout);
    }

    @Override
    public void readFields(DataInput dataInput) throws IOException {
        //反序列化
        ip=dataInput.readUTF();
        login=dataInput.readUTF();
        logout=dataInput.readUTF();
    }

    public String toString(){
        return ip+"\t"+login+"\t"+logout;
    }

    public String getIp() {
        return ip;
    }
    public void setIp(String ip) {
        this.ip = ip;
    }
    public String getLogin() {
        return login;
    }
    public void setLogin(String login) {
        this.login = login;
    }
    public String getLogout() {
        return logout;
    }
    public void setLogout(String logout) {
        this.logout = logout;
    }

}

Driver

package com.topview.log;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;


/**
 * @Title:
 * @Package
 * @Description:
 * @author: Yeeasy
 **/
public class LogDriver {
    public static void main(String[] args) throws Exception{

        //job
        Job job= Job.getInstance(new Configuration());

        //jar
        job.setJarByClass(LogDriver.class);

        //map
        job.setMapperClass(LogMapper.class);
        job.setMapOutputKeyClass(LogBean.class);
        job.setMapOutputValueClass(IntWritable.class);

        //reduce
        job.setReducerClass(LogReducer.class);
        job.setOutputKeyClass(LogBean.class);
        job.setOutputValueClass(NullWritable.class);

        //分区
        job.setPartitionerClass(ProvincePartitioner.class);
        job.setNumReduceTasks(5);

        //路径
        FileInputFormat.setInputPaths(job,new Path("D:/IDEA/TVlog/input"));
        FileOutputFormat.setOutputPath(job,new Path("D:/IDEA/TVlog/success"));

        //提交
        boolean completion = job.waitForCompletion(true);
        System.exit(completion ? 0 : 1);
    }
}

修改了运行了还是报错，希望有好的解决方法，实现Bean封装与分区，还有各个分区的ip数量统计

java.lang.Exception: java.io.IOException: Initialization of all the collectors failed. Error in last collector was:java.lang.ClassCastException: class com.topview.log.LogBean

是我的Bean类写的有问题吗

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-05-16 02:07
关注
这篇博客: 【MapReduce】美国新冠疫情案例集（MR与数据库交互）中的 Step 5：编写Mapper类，传递< 州，记录（Bean对象） > 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; import java.io.IOException; public class Map1 extends Mapper<LongWritable, BeanSQL, Text, BeanSQL> { Text k = new Text(); @Override protected void map(LongWritable key, BeanSQL value, Context context) throws IOException, InterruptedException { // 将key设置为获取的每行数据的state信息 k.set(value.getState()); // 写出 context.write(k,value); } }

返回顶部
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

MapReduce统计单词出现次数，但是结果显示出多个 hdfs mapreduce
2022-04-21 17:49

回答 2 已采纳发一下你的mr程序可能reduce阶段的代码写错了吧
在mapreduce编程实践中 name node处于安全模式 hadoop mapreduce
2022-11-01 09:17

回答 2 已采纳你试试hadoop dfsadmin -safemode leave或者你cd到hadoop/bin目录下，再执行命令
idea里面运行mapreduce报这个错误，如何解决？ java mapreduce
2023-01-24 08:24

回答 1 已采纳望采纳！！新年快乐！！数据表中设置了主键(Primary Key)，而主键对应的值是不允许重复的。错误提示为：你插入的记录与数据表中原有记录的主键重复了(Duplicate)。所以插入失败。
大数据MapReduce实现IP定位
2024-05-17 10:30

MapReduce会在每个分区内部对键进行排序，这有助于保证同一IP地址的所有条目会在同一台机器上处理，从而简化Reduce阶段的工作。此外，数据的分区策略也会影响处理效率，合理设置分区可以帮助负载均衡。为了运行这...
MapReduce平均数成绩怎么求每行的平均数 hadoop mapreduce 有问必答
2021-12-17 00:13

回答 1 已采纳 package com.hpu.hadoop.test; import org.apache.hadoop.io.DoubleWritable; import org.apache.hadoop.
MapReduce分析气象数据 java linux mapreduce
2022-06-19 22:26

回答 3 已采纳是只能使用mapreduce写吗，你把他整成sql，操作不是简单多了吗
如何用python进行mapreduce编写统计单词所在行？ python
2021-04-06 18:40

回答 2 已采纳 from mrjob.job import MRJob class FrequencyCount(MRJob): def mapper(self, _, line): words = line
拓思爱诺大数据-第二次作业MapReduce编程
2017-06-24 14:25

这个模型将复杂的计算任务分解为两个主要阶段：Map（映射）和Reduce（化简），并且在Hadoop这样的大数据处理框架中得到了广泛应用。在“拓思爱诺大数据-第二次作业MapReduce编程”中，你将学习到如何使用MapReduce...
MapReduce，hadoop,eclipse hadoop java mapreduce
2022-12-15 20:47

回答 1 已采纳这些都是日志，包含处理进度、数据处理的一些统计信息，比如数据条数、所占空间大小等。
MapReduce怎么求每个学生平均数啊我算出来结果只有是把成绩重新打出来了 hadoop mysql sql
2021-12-15 15:49

回答 2 已采纳我只发了核心的代码reduce阶段，你可以借鉴下，不懂我可以解释 ```java public class AvgReducer extends Reducer<Text, Avg,Text,
MapReduce Unable to initialize MapOutputCollector hadoop java mapreduce 有问必答
2022-04-22 14:34

回答 2 已采纳 public class StudentScore implements Serializable, WritableComparable<StudentScore> 类要实现Seria
Java代码统计网站中不同省份用户的访问数
2020-09-02 09:41

在Java编程中，统计网站中不同省份用户的访问数是一个常见的数据分析任务，这通常涉及到日志分析和使用MapReduce框架处理大规模数据。以下是对这个主题的详细讲解： **一、需求** 1. 日志数据：首先，你需要从...
Mapreduce集思功能实现，想不出啦实在 java mapreduce
2023-03-11 23:23

回答 2 已采纳链接：https://pan.baidu.com/s/1Tg-5DX0uuyM1m_mqLOV_JQ提取码：7alt
MapReduce(2)——编程实战
2021-06-27 20:56

痴迷的小小工匠的博客 MapReduce编程须知 map()方法是对输入的一个KV对调用一次！！ Reduce()方法是对相同K的一组KV对调用执行一次一、WordCount统计功能 1.1 需求 1.2 思路梳理 Map阶段： 1. map()方法中把传入的数据转为...
【MapReduce】实战：流量统计（完整Java代码）
2020-11-14 15:10

快乐的冲浪码农的博客文章目录1 需求2 实验环境3 实验内容3.1 数据准备3.2 分析和设计统计求和分区总体排序分区排序4 编码4.1 统计求和PhoneFlowMapperReudcerMain4.2 分区PartitionerMain4.3 全排序PhoneFlowMapperReducerMain4.4 内部
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月16日

悬赏问题

¥15 求京东批量付款能替代天诚
¥15 slaris 系统断电后，重新开机后一直自动重启
¥15 51寻迹小车定点寻迹
¥15 谁能帮我看看这拒稿理由啥意思啊阿啊
¥15 关于vue2中methods使用call修改this指向的问题
¥15 idea自动补全键位冲突
¥15 请教一下写代码，代码好难
¥15 iis10中如何阻止别人网站重定向到我的网站
¥15 滑块验证码移动速度不一致问题
¥15 Utunbu中vscode下cern root工作台中写的程序root的头文件无法包含

MapReduce分区输出ip并且统计个数（2

MapReduce分区输出ip并且统计个数（2

在使用mapReduce实现不同类别ip地址输出到不同文件如何统计每个类型ip地址的个数，将mapper结果用bean封装，分区主要靠partitioner实现，但是一直出现java.lang.ClassCastException的问题，按照网上的法子改了很多次都不行

修改了运行了还是报错，希望有好的解决方法，实现Bean封装与分区，还有各个分区的ip数量统计

是我的Bean类写的有问题吗

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新