用java读取hdfs的.lzo_deflate文件报错

linux环境没有问题，hadoop环境、配置也没有问题，并且通过hdoop fs -text 指令能正常打开该压缩文件。但是用java读取就报错了，请大神帮忙看看，谢谢

代码如下：
public static void main(String[] args) {
String uri = "/daas/****/MBLDPI3G.2016081823_10.1471532401822.lzo_deflate";
Configuration conf = new Configuration();
String path = "/software/servers/hadoop-2.6.3-bin/hadoop-2.6.3/etc/hadoop/";
conf.addResource(new Path(path + "core-site.xml"));
conf.addResource(new Path(path + "hdfs-site.xml"));
conf.addResource(new Path(path + "mapred-site.xml"));
try {
CompressionCodecFactory factory = new CompressionCodecFactory(conf);

        CompressionCodec codec = factory.getCodec(new Path(uri));
        if (codec == null) {
            System.out.println("Codec for " + uri + " not found.");
        } else {
            CompressionInputStream in = null;
            try {
                in = codec.createInputStream(new java.io.FileInputStream(uri));
                byte[] buffer = new byte[100];
                int len = in.read(buffer);
                while (len > 0) {
                    System.out.write(buffer, 0, len);
                    len = in.read(buffer);
                }
            } finally {
                if (in != null) {
                    in.close();
                }
            }
        }

    } catch (Exception e) {
        e.printStackTrace();
    }
}

报错信息如下：
log4j:WARN No appenders could be found for logger (org.apache.hadoop.util.NativeCodeLoader).

log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
java.io.FileNotFoundException: /daas/***/MBLDPI3G.2016081823_10.1471532401822.lzo_deflate (没有那个文件或目录)
at java.io.FileInputStream.open(Native Method)
at java.io.FileInputStream.(FileInputStream.java:146)
at java.io.FileInputStream.(FileInputStream.java:101)
at FileDecompressor.main(FileDecompressor.java:53)

加载的jar包：
    <classpathentry kind="lib" path="lib/commons-cli-1.2.jar"/>
<classpathentry kind="lib" path="lib/commons-collections-3.2.2.jar"/>
<classpathentry kind="lib" path="lib/commons-configuration-1.6.jar"/>
<classpathentry kind="lib" path="lib/commons-lang-2.6.jar"/>
<classpathentry kind="lib" path="lib/commons-logging-1.1.3.jar"/>
<classpathentry kind="lib" path="lib/guava-18.0.jar"/>
<classpathentry kind="lib" path="lib/hadoop-auth-2.6.3.jar"/>
<classpathentry kind="lib" path="lib/hadoop-common-2.6.3.jar"/>
<classpathentry kind="lib" path="lib/hadoop-hdfs-2.6.3.jar"/>
<classpathentry kind="lib" path="lib/htrace-core-3.0.4.jar"/>
<classpathentry kind="lib" path="lib/log4j-1.2.17.jar"/>
<classpathentry kind="lib" path="lib/protobuf-java-2.5.0.jar"/>
<classpathentry kind="lib" path="lib/slf4j-api-1.7.5.jar"/>
<classpathentry kind="lib" path="lib/slf4j-log4j12-1.7.5.jar"/>
<classpathentry kind="lib" path="lib/hadoop-lzo-0.4.20.jar"/>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
aoan1314 2016-09-09 16:57
关注
问题很奇怪，通过百度实在搞不定了，跪求过路大神帮忙指点迷津，谢谢！

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于工作中的一次读取lzo_deflate文件
2021-01-02 23:49

2582700262_Alfie的博客关于lzo及.lzo_deflate文件读取写入 1.在MR Job中：如果输出格式是TextOutputFormat，要用LzopCodec，相应的读取这个输出的格式是LzoTextInputFormat。如果输出格式用SequenceFileOutputFormat，要用LzoCodec...
JAVA 读取lzo压缩文件
2015-12-15 22:39

adofu的博客 JAVA 读取lzo压缩文件今天犯了一个愚蠢的问题，用lzo做过压缩的数据，用lzop去读，但疼痛了好一会儿。 lzopcode和lzocode的做个简单介绍： 1.lzocode压缩过的文件都是以.lzo_deflate结尾,相应的加载类：...
Hive中压缩使用详解与性能分析
2019-01-05 22:16

涤生大数据的博客所以HIVE可以使用hadoop自带的InputFormat和Outputformat实现从不同的数据源读取文件和写出不同格式的文件到文件系统中。同理，HIVE也可以使用hadoop配置的压缩方法对中间结果或最终数据进行压缩。 1.什么是压缩及...
yorc.json_DataX-HDFS(读写)
2020-12-23 14:03

共由三日的博客 DataX操做HDFS读取HDFS1 快速介绍HdfsReader提供了读取分布式文件系统数据存储的能力。在底层实现上，HdfsReader获取分布式文件系统上文件的数据，并转换为DataX传输协议传递给Writer。目前HdfsReader支持的文件格式...
Hadoop_HDFS_常见的文件组织格式与压缩格式
2023-07-27 13:58

高达一号的博客参考资料1.2.本文主要介绍下HDFS上的常见文件格式和压缩格式总结 :HDFS 中常见的文件存储格式HDFS中常见的文件压缩方式。
HDFS文件的压缩
2020-01-04 18:06

SunnyRivers的博客压缩格式工具算法文件扩展名是否可切分 DEFLATE 无 DEFLATE .deflate 否 gzip gzip DEFLATE .gz 否 bzip2 bzip2 bzip2 .bz2 是 LZO lzop LZO .lzo 否 LZ4 无 LZ4 .lz4 否 Snappy 无 Snappy .snappy 否说明： ...
Hive之配置和使用LZO压缩
2020-06-21 22:40

TomAndersen的博客在配置Hive使用lzo压缩功能之前，需要保证Hadoop集群中lzo依赖库的正确安装，以及hadoop-lzo依赖的正确配置，可以参考：Hadoop配置lzo压缩温馨提示：Hive自定义组件打包时，不要同时打包依赖，避免各种版本冲突，...
hadoop压缩方式deflate、gzip、bzip2、lzo、snappy
2020-07-20 13:35

得过且过1223的博客运算密集型的job，少用压缩 IO密集型的Job，多用压缩 MR支持的压缩压缩格式 Hadoop集成算法扩展名是否可splic 更换压缩格式是否需要修改代码 DEFLATE 直接使用 DEFLATE .deflate 否不需要修改 Gzip ...
Hadoop配置lzo压缩
2020-06-11 19:57

TomAndersen的博客 lzo是一个围绕lzo压缩算法实现的Maven项目，基于hadoop提供的API实现了lzo压缩算法的编解码器，以及其他的一些自定义hadoop组件，本文主要演示如何编译此Git项目，并配置到hadoop集群中，实现lzo算法在集群中的使用 ...
HDFS文件压缩和小文件治理
2019-12-28 12:10

罗啦啦的博客 1.文件压缩文件压缩好处：减少数据所占用的磁盘空间加快数据在磁盘、网络上的IO Hadoop的压缩实现类；均实现CompressionCodec接口压缩格式对应的编码/解码器 DEFLATE org.apache.hadoop.io...
没有解决我的问题, 去提问

用java读取hdfs的.lzo_deflate文件报错

1条回答 默认 最新

1条回答默认最新