overflow_decade 2022-04-25 16:53 采纳率: 60%

在hdfs体系下用jar包处理hbase中的表，日志报错"No FileSystem for scheme: HDFS"，如何处理？

问题遇到的现象和发生背景

在一个有4台服务器的系统（zookeeper负责协调）中创建hbase表后，上传jar包处理表的内容。

问题相关代码

pom.xml部分：

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>org.example</groupId>
    <artifactId>MyHBase</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <maven.compiler.source>8</maven.compiler.source>
        <maven.compiler.target>8</maven.compiler.target>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <hadoop.version>2.7.7</hadoop.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-mapreduce</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-yarn</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase</artifactId>
            <version>2.0.2</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-mapreduce</artifactId>
            <version>2.0.2</version>
        </dependency>
    </dependencies>

</project>

MemberMapper.java部分：


package org.szc2019211234.hbase.inputSource;

import org.apache.hadoop.hbase.Cell;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.Writable;
import java.io.IOException;

public class MemberMapper extends TableMapper<Writable, Writable> {
    private Text k = new Text();
    private Text v = new Text();
    public static final String FIELD_COMMOM_separator = "\u0001";
    @Override
    protected void setup(Context context) throws IOException,InterruptedException{}
    @Override
    protected void map(ImmutableBytesWritable row, Result columns, Context context) throws IOException,InterruptedException{
        String value = null;
        String rowkey = new String(row.get());

        byte[] columnFamily = null;
        byte[] columnQualifier = null;
        long ts = 0L;

        try{
            for(Cell cell : columns.listCells()){
                value = Bytes.toStringBinary(cell.getValueArray());

                columnFamily = cell.getFamilyArray();

                columnQualifier = cell.getQualifierArray();

                ts = cell.getTimestamp();

                k.set(rowkey);
                v.set(Bytes.toString(columnFamily)+FIELD_COMMOM_separator+Bytes.toString(columnQualifier)+FIELD_COMMOM_separator+
                        value+FIELD_COMMOM_separator+ts);
                context.write(k, v);
            }
        }catch(Exception e){
            e.printStackTrace();
            System.err.println("Error:"+e.getMessage()+",Row:"+Bytes.toString(row.get())+",Value"+value);
        }
    }
}

Main.java部分：

package org.szc2019211234.hbase.inputSource;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;


public class Main {
    static final Log LOG = LogFactory.getLog(Main.class);
    public static final String NAME = "Member Test1";
    public static final String TEMP_INDEX_PATH = "HDFS://szc-2019211234-0001:8020/tmp/2019211234szc";
    public static String inputTable = "2019211234szc";
    public static void main(String[] args) throws Exception {
        Configuration conf = HBaseConfiguration.create();
        conf.set("fs.hdfs.impl", "org.apache.hadoop.hdfs.DistributedFileSystem");
        Scan scan = new Scan();
        scan.setBatch(0);
        scan.setCaching(10000);
        scan.setMaxVersions();
        scan.setTimeRange(System.currentTimeMillis() - 3*24*3600*1000L,System.currentTimeMillis());
        scan.addColumn(Bytes.toBytes("cf1"),Bytes.toBytes("keyword"));
        conf.setBoolean("mapred.map.tasks.speculative.execution",false);
        conf.setBoolean("mapred.reduce.tasks.speculative.execution",false);
        Path tmpIndexPath = new Path(TEMP_INDEX_PATH);
        FileSystem fs =FileSystem.get(conf);
        if(fs.exists(tmpIndexPath)){
            fs.delete(tmpIndexPath,true);
        }
        Job job = new Job(conf,NAME);
        job.setJarByClass(Main.class);
        TableMapReduceUtil.initTableMapperJob(inputTable,scan,MemberMapper.class, Text.class,Text.class,job);
        job.setNumReduceTasks(0);
        job.setOutputFormatClass(TextOutputFormat.class);
        FileOutputFormat.setOutputPath(job,tmpIndexPath);
        boolean success = job.waitForCompletion(true);
        System.exit(success?0:1);
    }
}

运行结果及报错内容

上传以上代码生成的jar包后执行命令：
hadoop jar MyHBase.jar org.szc2019211234.hbase.inputSource.Main
运行报错如下所示：

22/03/31 22:47:51 INFO mapreduce.Job: Job job_1648729191766_0002 failed with state FAILED due to: Application application_1648729191766_0002 failed 2 times due to AM Container for appattempt_1648729191766_0002_000002 exited with exitCode: 1
For more detailed output, check application tracking page:http://szc-2019211234-0001:8088/cluster/app/application_1648729191766_0002Then, click on links to logs of each attempt.
Diagnostics: Exception from container-launch.
Container id: container_1648729191766_0002_02_000001
Exit code: 1
Stack trace: ExitCodeException exitCode=1:
at org.apache.hadoop.util.Shell.runCommand(Shell.java:585)
at org.apache.hadoop.util.Shell.run(Shell.java:482)
at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:776)
at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:212)
at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:302)
at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:82)
at java.util.concurrent.FutureTask.run(FutureTask.java:266)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:823)

查看生成的错误日志，如下所示（引用模式一直报错故只能用java模板显示）：

Container exited with a non-zero exit code 1
Failing this attempt. Failing the application.
22/03/31 22:47:51 INFO mapreduce.Job: Counters: 0
2022-04-23 22:39:13,997 INFO [main] org.apache.hadoop.service.AbstractService: Service org.apache.hadoop.mapreduce.v2.app.MRAppMaster failed in state INITED; cause: org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.io.IOException: No FileSystem for scheme: HDFS
org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.io.IOException: No FileSystem for scheme: HDFS
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster$2.call(MRAppMaster.java:518)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster$2.call(MRAppMaster.java:498)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.callWithJobClassLoader(MRAppMaster.java:1593)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.createOutputCommitter(MRAppMaster.java:498)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.serviceInit(MRAppMaster.java:284)
    at org.apache.hadoop.service.AbstractService.init(AbstractService.java:163)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster$5.run(MRAppMaster.java:1551)
    at java.security.AccessController.doPrivileged(AccessController.java:774)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1762)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.initAndStartAppMaster(MRAppMaster.java:1548)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster.main(MRAppMaster.java:1481)
Caused by: java.io.IOException: No FileSystem for scheme: HDFS
    at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2658)
    at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2665)
    at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:93)
    at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2701)
    at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2683)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:372)
    at org.apache.hadoop.fs.Path.getFileSystem(Path.java:295)
    at org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter.<init>(FileOutputCommitter.java:113)
    at org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter.<init>(FileOutputCommitter.java:88)
    at org.apache.hadoop.mapreduce.lib.output.FileOutputFormat.getOutputCommitter(FileOutputFormat.java:309)
    at org.apache.hadoop.mapreduce.v2.app.MRAppMaster$2.call(MRAppMaster.java:516)
    ... 11 more
End of LogType:syslog

我的解答思路和尝试过的方法

jps检测结果符合预期，zookeeper状态输出无异常，hdfs检测也未见明显异常。初步排除服务器自身问题。
根据网上对"No FileSystem for scheme: HDFS"的解决思路，在Main函数中添加了语句：

conf.set("fs.hdfs.impl", "org.apache.hadoop.hdfs.DistributedFileSystem");

仍然未见明显效果。
另：
本次使用的hadoop版本号为2.7.7，在服务器的home/modules目录下有2.7.7版本和2.8.3两个版本的hadoop（hadoop路径仍然设置为2.7.7版本所在）；在pom导入依赖时报错显示如下（但是主界面未标红且能够正常编译并生成jar包）：

尚不清楚错误是否与此二者有关。

我想要达到的结果

希望能够找出错误所在并成功更正，使得hadoop命令能够顺利执行。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-sinJack 2022-04-25 17:37
关注
在配置文件core-default.xml中添加如下配置信息：
/usr/local/hadoop/share/doc/hadoop/hadoop-project-dist/hadoop-common

<property> <name>fs.hdfs.impl</name> <value>org.apache.hadoop.hdfs.DistributedFileSystem</value> <description>The FileSystem for hdfs: uris.</description> </property>
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在Linux hadoop环境中运行sh脚本，报异常java.io.IOException: No FileSystem for scheme: E eclipse java
2018-12-20 16:46

回答 1 已采纳 ``` FileInputFormat.setInputPaths(job, new Path("E:/educ/infile/20170816new")); FileOutputFormat
No FileSystem for scheme "hsds" hadoop hdfs java
2022-06-14 16:04

回答 2 已采纳 URI uri = new URI("hsds://hadoop102:8020");
启动flume脚本，在生成的日志文件中报错：Agent configuration for 'a1' has no configfilters flume hdfs kafka
2021-12-17 14:35

回答 1 已采纳启动命令的问题，试试这个：nohup /opt/module/flume/bin/flume-ng agent --conf /opt/module/flume/conf -f /opt/modul
解决：No FileSystem for scheme: hdfs问题
2022-07-27 09:43

老王常谈的博客解决：No FileSystem for scheme: hdfs问题
hadoop读取hdfs文件：No such file or directory: `hdfs://localhost:9000/user/hadoop' hadoop hdfs spark
2022-10-09 17:22

回答 1 已采纳可以考虑换个目录试一下比如：hdfs dfs -put /usr/local/spark/README.MD /
使用hdfs上传文件报错org.apache.hadoop.hdfs.CannotObtainBlockLengthExceptio hadoop hdfs java
2022-08-15 11:47

回答 6 已采纳信息不足不是很好判断，找了下源码，报错的方法如下： /** Read the block length from one of the datanodes. */ private long rea
用eclipse进行MapReduce编程出现java.io.IOException: No FileSystem for scheme: hdfs解决方法
2021-12-13 13:59

Data engineering Bo的博客我在用eclipse进行MapReduce编程的的时候，一直出现java.io.IOException: No FileSystem for scheme: hdfs。找了很多答案也没有一个能解决我的问题，后来我发现了问题所在，其实就是很简单的问题导致的下面我说...
在Ubuntu Hadoop集群执行分布式实例，hdfs没有输出结果也没有报错 hadoop hdfs ubuntu
2022-09-24 18:25

回答 2 已采纳 input目录里是不是没有文件呢？ cp $HADOOP_HOME/etc/hadoop/*.xml ./input
Python 处理HDFS log 数据 hdfs python
2023-01-18 04:55

回答 2 已采纳您好，我看了这个LOG数据，如果使用切分字符串的方法，2000行里最长的共有111个字段。最关键的是会有数字类型和文本类型组合成文本类型，而这部分是字符串切割无法区分的。所以正则还是香呀，一步到位 i
hadoop hdfs dfs没有任何反应？ hadoop hdfs 大数据
2022-10-04 19:13

回答 1 已采纳不是没有反应，而是目录下没有文件，所以ls后没有内容可以显示，可以试试ls /
【Spring Boot Web容器集成调用Hbase】 java.io.IOException: No FileSystem for scheme : hdfs
2019-07-17 18:17

wunanliu的博客 Maven下项目使用没有任何问题，但是使用Spring boot 项目就出问题，怀疑是容器问题，查阅了相当多的资料，所有的大部分解决方案都是拷贝core-site.xml到本地项目中，然后将下列配置添加到core-site.xml配置文件中，...
[HDFS]hive表文件下的.metadata文件夹是什么？ hdfs hive java sqoop 大数据
2018-06-13 06:26

回答 1 已采纳 metadata就是元数据，用来存放表结构、字段信息之类的，用来描述数据的数据。另外eclipse也有自己的metadata，你要看看是哪个metadata缺失了。
解决：java.io.IOException: No FileSystem for scheme: hdfs
2019-09-12 10:34

AmriStrong2的博客解决：java.io.IOException: No FileSystem for scheme: hdfs 开发项目初期，写完代码开始放到服务器上开始测试的时候，报出这样的一个错，不知道怎么处理了，尝试了重新配置HDFS的Configuration，也不行，无奈之下...
No FileSystem for scheme: hdfs
2015-05-08 09:19

yhao浩的博客 No FileSystem for scheme: hdfs
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月25日

悬赏问题

¥50 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？