@hhw 2017-11-10 03:42 采纳率: 0%

MapReducer 写入到数据库报错

【 DBUserWritable 类】

package org.neworigin.com.Database;

import java.io.DataInput;
import java.io.DataOutput;
import java.io.IOException;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;

import org.apache.hadoop.io.WritableComparable;
import org.apache.hadoop.mapreduce.lib.db.DBWritable;

public class DBUserWritable implements DBWritable,WritableComparable{

private String name="";
private String sex="";
private int age=0;
private int num=0;
private String department="";
private String tables="";

@Override
public String toString() {
    return "DBUserWritable [name=" + name + ", sex=" + sex + ", age=" + age + ", department=" + department + "]";
}


public DBUserWritable(DBUserWritable d){
    this.name=d.getName();
    this.sex=d.getSex();
    this.age=d.getAge();
    this.num=d.getNum();
    this.department=d.getDepartment();
    this.tables=d.getTables();
}
public String getName() {
    return name;
}

public void setName(String name) {
    this.name = name;
}

public String getSex() {
    return sex;
}

public void setSex(String sex) {
    this.sex = sex;
}

public int getAge() {
    return age;
}

public void setAge(int age) {
    this.age = age;
}

public int getNum() {
    return num;
}

public void setNum(int num) {
    this.num = num;
}

public String getDepartment() {
    return department;
}

public void setDepartment(String department) {
    this.department = department;
}

public String getTables() {
    return tables;
}

public void setTables(String tables) {
    this.tables = tables;
}

public DBUserWritable(String name, String sex, int age, int num, String department, String tables) {
    super();
    this.name = name;
    this.sex = sex;
    this.age = age;
    this.num = num;
    this.department = department;
    this.tables = tables;
}

public DBUserWritable() {
    super();
    // TODO Auto-generated constructor stub
}

public void write(DataOutput out) throws IOException {
    // TODO Auto-generated method stub
    out.writeUTF(name);
    out.writeUTF(sex);
    out.writeInt(age);
out.writeInt(num);
    out.writeUTF(department);
out.writeUTF(tables);
}

public void readFields(DataInput in) throws IOException {
    // TODO Auto-generated method stub
    name = in.readUTF();
    sex=in.readUTF();
    age=in.readInt();
    num=in.readInt();
    department=in.readUTF();
    tables=in.readUTF();
}

public int compareTo(Object o) {
    // TODO Auto-generated method stub
    return 0;
}

public void write(PreparedStatement statement) throws SQLException {
    // TODO Auto-generated method stub
    statement.setString(1, this.getName());
    statement.setString(2, this.getSex());
    statement.setInt(3, this.getAge());
    statement.setString(4, this.getDepartment());
}

public void readFields(ResultSet resultSet) throws SQLException {
    // TODO Auto-generated method stub
     this.name=resultSet.getString(1);
     this.sex=resultSet.getString(2);
     this.age=resultSet.getInt(3);
     this.department=resultSet.getString(4);
}

}

【mapper】

package org.neworigin.com.Database;

import java.io.IOException;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class UserDBMapper extends Mapper {
DBUserWritable DBuser= new DBUserWritable();
@Override
protected void map(LongWritable key, Text value, Mapper.Context context)
throws IOException, InterruptedException {
String[] values=value.toString().split(" ");

    if(values.length==4){

     DBuser.setName(values[0]);
     DBuser.setSex(values[1]);
     DBuser.setAge(Integer.parseInt(values[2]));
     DBuser.setNum(Integer.parseInt(values[3]));
     DBuser.setTables("t1");
     System.out.println("mapper---t1---------------"+DBuser);
     context.write(new Text(values[3]),DBuser);

     }


        if(values.length==2){

             DBuser.setNum(Integer.parseInt(values[0]));
             DBuser.setDepartment(values[1]);   
             DBuser.setTables("t2");
             context.write(new Text(values[0]),DBuser);
             //System.out.println("mapper --t2"+"--"+values[0]+"----"+DBuser);
        }

}

}

【reducer 】

package org.neworigin.com.Database;

import java.io.IOException;
import java.util.LinkedList;
import java.util.List;

import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class UserDBReducer extends Reducer {
// public DBUserWritable db= new DBUserWritable();

@Override
protected void reduce(Text k2, Iterable<DBUserWritable> v2,
        Reducer<Text, DBUserWritable, NullWritable,DBUserWritable>.Context context) throws IOException, InterruptedException {
    String Name="";
 List<DBUserWritable> list=new LinkedList<DBUserWritable>();
 for(DBUserWritable val : v2){
     list.add(new DBUserWritable(val));//new 一个对象 给list

// System.out.println("[table]"+val.getTables()+"----key"+k2+"---"+val);
if(val.getTables().equals("t2")){
Name=val.getDepartment();

     }
 }
 //键是  num  
for(DBUserWritable join : list){
    System.out.println("[table]"+join.getTables()+"----key"+k2+"---"+join);
if(join.getTables().equals("t1")){

    join.setDepartment(Name);
System.out.println("db-----"+join);
    context.write(NullWritable.get(), join);
    }
}

}

}

【app】

package org.neworigin.com.Database;

import java.io.IOException;
import java.net.URI;
import java.net.URISyntaxException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.db.DBConfiguration;
import org.apache.hadoop.mapreduce.lib.db.DBOutputFormat;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class UserDBAPP {

public static void main(String[] args) throws Exception, URISyntaxException {
    // TODO Auto-generated method stub
   String INPUT_PATH="file:///E:/BigData_eclipse_database/Database/data/table1";
   String INPUT_PATH1="file:///E:/BigData_eclipse_database/Database/data/table2";

// String OUTPUT_PARH="file:///E:/BigData_eclipse_database/Database/data/output";
Configuration conf = new Configuration();
// FileSystem fs=FileSystem.get(new URI(OUTPUT_PARH),conf);
// if(fs.exists(new Path(OUTPUT_PARH))){
// fs.delete(new Path(OUTPUT_PARH));
// }

   Job job = new Job(conf,"mydb");
   //设置数据库配置

   DBConfiguration.configureDB(conf, "com.mysql.jdbc.Driver", "jdbc:mysql://localhost/hadoop", "root", "123456");


   FileInputFormat.addInputPaths(job,INPUT_PATH);
   FileInputFormat.addInputPaths(job,INPUT_PATH1);

   job.setMapperClass(UserDBMapper.class);
   job.setMapOutputKeyClass(Text.class);
   job.setMapOutputValueClass(DBUserWritable.class);

   job.setReducerClass(UserDBReducer.class);
   job.setOutputKeyClass(NullWritable.class);
   job.setOutputValueClass(DBUserWritable.class);

// FileOutputFormat.setOutputPath(job, new Path(OUTPUT_PARH));
//设置输出路径
DBOutputFormat.setOutput(job,"user_tables", "name","sex","age","department");
job.setOutputFormatClass(DBOutputFormat.class);
boolean re = job.waitForCompletion(true);
System.out.println(re);
}

}

【报错】ps 表链接，写到本地没问题写到数据库就报错；
17/11/10 11:39:11 WARN output.FileOutputCommitter: Output Path is null in cleanupJob()
17/11/10 11:39:11 WARN mapred.LocalJobRunner: job_local1812680657_0001
java.lang.Exception: java.io.IOException
at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)
at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:529)
Caused by: java.io.IOException
at org.apache.hadoop.mapreduce.lib.db.DBOutputFormat.getRecordWriter(DBOutputFormat.java:185)
at org.apache.hadoop.mapred.ReduceTask$NewTrackingRecordWriter.(ReduceTask.java:541)
at org.apache.hadoop.mapred.ReduceTask.runNewReducer(ReduceTask.java:614)
at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:389)
at org.apache.hadoop.mapred.LocalJobRunner$Job$ReduceTaskRunnable.run(LocalJobRunner.java:319)
at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
at java.lang.Thread.run(Thread.java:745)
17/11/10 11:39:12 INFO mapreduce.Job: Job job_local1812680657_0001 running in uber mode : false
17/11/10 11:39:12 INFO mapreduce.Job: map 100% reduce 0%
17/11/10 11:39:12 INFO mapreduce.Job: Job job_local1812680657_0001 failed with state FAILED due to: NA
17/11/10 11:39:12 INFO mapreduce.Job: Counters: 35

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
荣洋 2017-11-10 06:59
关注
会不会少了端口号3306，jdbc:mysql://localhost/hadoop

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

系统复习大数据知识点
2020-07-21 18:10

Jecky不姓码的博客 大数据转行不易，希望能帮助到你资料下载+XMind：https://pan.baidu.com/s/1Xn7WPNwNUwdwDW6V0ZGyvg 提取码：raog 复制这段内容后打开百度网盘手机App，操作更方便哦 VX：WL1179952622 有问题的可以加我好友，都是...
一个小兔子的大数据见解1
2019-02-20 14:00

会武术的科学家的博客刚去公司的时候，做数据的迁移，写sqoop脚本，（注意：这里可能会问到sqoop增量导入数据的方式式，一般会用到append追加的模式）把数据从oracle数据库导入到hive当中（注意： a.这里我们使用是shell脚本的方式...
大数据实训笔记
2020-09-17 14:52

qq1772819485的博客 大数据实训笔记（一）大数据实训第一天 Linux常用命令： cd / 切换路径 cd … 回到上一层路径 ls 查看当前目录下所有文件和文件夹 ls -a 显示隐藏文件 ls -l 查看详细信息（ll） mkdir 创建文件夹 touch 创建文件...
大数据-Hadoop初探-01
2018-04-09 13:24

taco詹詹的博客一，大数据： 1.大数据起源于社交网络 QQ微信发展于电商平台淘宝，京东，一号店 2。***大数据的4V特征体积数据量大TB PB Varity 的数据多种多样文本（.log .txt .sql .xml） Veracity...
报错问题：分隔符\t识别不出来问题，本地可以分割出，但是MapReduce却报错
2020-08-31 22:45

旺仔的算法coding笔记的博客输入给sys.stdin的是hsql中select出来结果写入hdfs的数据，如果抽取部分数据到本地测试用个下面\t分割能很好分割select出来的数据，但是一旦提交hadoop的MapReduce服务器处理就报错。 for line in sys.stdin: ...
09.大数据之Hive基本概念
2018-05-31 22:37

小茗同学IT的博客当然，这个低是有条件的，即数据规模较小，当数据规模大到超过数据库的处理能力的时候，Hive 的并行计算显然能体现出优势。 8. 可扩展性。由于 Hive 是建立在 Hadoop 之上的，因此 Hive 的可扩展性是和 Hadoop ...
sqoop安装使用
2020-12-31 20:33

桃橙柳的博客数据导入1.1导入数据到hdfs1.1.1全量导入（1）全表导入，--table子句：（2）数据子集导入①--where子句:②按需导入--query子句③--column子句1.1.2增量导入1.1.2.1 Append方式1.1.2.2 LastModify方式1.1导入数据到...
Hive 知识体系保姆级教程
2021-10-24 22:15

云祁的博客 Hive涉及的知识点如下图所示，本文将逐一讲解：正文开始：一. Hive概览1.1 hive的简介Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并...
五万字 | Hive知识体系保姆级教程
2021-08-23 10:45

五分钟学大数据的博客文档目录如下： ...Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。其本质是将SQL转换为MapReduce/Spark的任务进行运算，底层由HDFS来提供.
【Hive知识体系详细教程】
2022-02-10 16:13

[小六]的博客 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。其本质是将SQL转换为MapReduce/Spark的任务进行运算，底层由HDFS来提供数据的存储，说白了hive可以理解为...
没有解决我的问题, 去提问

MapReducer 写入到数据库 报错

【 DBUserWritable 类 】

【mapper】

【reducer 】

【app】

6条回答 默认 最新

MapReducer 写入到数据库报错

【 DBUserWritable 类】

6条回答默认最新