hdfs文件下载不到本地

求问哪里出现了问题，一直找不到问题所在，但是就是下载不到本地，进去只能看见一个空的test，也已经创建目录了

下面是运行报错的代码

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-03-31 00:25
关注
引自免费微信小程序：皆我百晓生

在Hadoop中，testDownloadFileToLocal() 方法的主要目标是将名为 "test.txt" 的 HDFS 文件从一个 HDFS 实例下载到本地。下面是一种可能的解决方案，它使用 Java 代码，并通过 HadoopFS 模块和 FsClient 类实现文件下载。

import com.google.common.io.*; import com.google.common.net.HttpHeaders; import com.google.common.net.MediaType; import com.google.common.net.URL; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.hdfs.MiniDFSCluster; import org.apache.hadoop.hdfs.security.UserGroupInformation; // Create a new mini cluster MiniDFSCluster dfs = new MiniDFSCluster.Builder(conf) .numDataNodes(2) .build(); // Download the file to the specified local directory Path downloadDir = dfs.getDataNode().getURI("/testFile/test.txt").getPath(); Path localFilePath = downloadDir.append("testLocal.txt"); try { // Connect to the HDFS instance using FileUtil类 FileSystem hdfs = dfs.getURI("/").toUri().toURL(); // Create a FileChannel object to read the contents from the HDFS file Channel channel = hdfs.openChannel("readLocal"); channel.configureBlocking(false); // Set the content type to CSV, which is supported by the hadoop native lib MediaType mediaType = MediaType.parse("text/csv"); (channel.writeTo(localFilePath, mediaType)); // Close the channel and return the downloaded file path channel.close(); return localFilePath.toString(); } catch (IOException e) { throw new RuntimeException("Failed to download file", e); }

在这个解决方案中，我们首先创建了一个小型的分布式文件系统 (MiniDFSCluster)，并指定了要将其数据节点数量设置为 2，这意味着我们将仅下载两个本地路径：一个是原始 HDFS 文件所在的 /testFile/test.txt，另一个是经过哈希替换后的 /testLocal.txt。然后，我们使用 FileUtil 类连接到这个集群中的某个节点。接着，我们创建一个 Channel 对象用于从 HDFS 中读取文件，我们配置其写入模式为 BlockingWriteLocal，这样可以确保在客户端程序运行期间直到文件写入完毕才关闭通道。接下来，我们设置文件类型为 CSV（CSV 是 Hadoop 自带的文件格式），并将其作为响应写入到本地路径 /testLocal.txt。

最后，我们关闭通道并将文件保存回本地。如果任何异常发生，我们会抛出一个 IOException 异常，表示下载文件失败。在这个情况下，我们可以捕获并处理这个异常，通常会提供关于错误信息和调试点的输出。

注意：为了兼容 Hadoop 1.x 和 Hadoop 2.x，上述代码可能会需要进行一些修改，特别是 FileSystem.getURI("/") 和 UserGroupInformation. 来支持 Hadoop 2.x。此外，如果你正在尝试使用 FsClient 版本的 Hadoop，也需要相应地调整初始化步骤，例如调用 client.create(), client.rename(), 等方法。在实际应用中，你可能还需要考虑到不同版本的 Hadoop 启动参数、文件权限等可能会影响下载行为的问题。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

怎么在hdfs上下载文件传给前端 hdfs java spring
2023-01-05 14:13

回答 9 已采纳 String fileName = "xxx"; response.reset(); response.setContentType("application/x-msdownload
hdfs为什么不适合存储小文件 hdfs 有问必答
2021-12-15 20:24

回答 1 已采纳为啥集群小文件治理那么重要，你真的懂吗？_涤生手记大数据-CSDN博客小文件是 Hadoop 的常见挑战，如果不小心处理，它们可能会导致
文件上传到hdfs后，读取总说找不到
2016-07-28 07:24

回答 1 已采纳试试这个。 String uri = "hdfs://master:9000/input/picture1.jpg"; Configuration conf = new Conf
HDFS高级-集群管理和运维
2022-11-10 19:09

Evan2OO1的博客 HDFS高级-集群管理和运维
hadoop格式化hdfs提示文件不存在怎么办 hadoop
2021-11-16 21:09

回答 1 已采纳你的core-site.xml 配置文件错了你没有生成log和hadooptmp，删了重配我前几天写了一个脚本，你可以借鉴一下
spark-shell命令读取HDFS文件时文件不存在 spark 有问必答
2021-08-03 17:06

回答 2 已采纳先看看hadoop集群有没有正常开启，检查hdfs路径有没有问题
创建hdfs文件系统下目录创建不成功 hadoop
2021-12-23 19:44

回答 2 已采纳您这个问题是因为您没有把hadoop里面的bin目录放到PATH变量中呢，您可以通过以下方式将hadoop的bin目录放到PATH中呢 vim /etc/profile export PATH=$P
Hadoop笔记——HDFS运维详解
2020-08-05 09:14

Bessenn的博客 HDFS是分布式文件系统中的一种，通过目录树定位文件。 1. 适用场景：一次写入、多次读出、不支持修改、适用于数据分析。 2. 优点：高容错性、存储数据规模大、可使用廉价机器。 3. 缺点：不适合低延时数据访问、不...
为什么用Java调用hdfs的时候不需要密码 hadoop java 有问必答
2022-03-10 21:07

回答 2 已采纳其实hdfs是可以给用户配置密码的。要是有需求就去搞个kerberos认证，或者去装个sentry、ranger。再一个一般来讲hdfs服务都是在内网环境部署，也不太需要更强的安全性。
hdfs在idea上传文件运行错误 hadoop hdfs intellij-idea
2023-03-25 03:16

回答 8 已采纳 hdfs没有 /data目录
【Hadoop】本地文件上传到HDFS
2021-07-10 16:23

阿龙先生啊的博客需求：按照配置文件的内容解析要上传文件的路径，HDFS的目标路径，文件名格式匹配，按照不同的文件名上传到不同的HDFS目录，HDFS按照业务分目录存储文件。定义RegexLocalPathFilter类实现FileFilter接口实现文件过滤...
hdfs本地查看器java java
2022-11-01 14:56

回答 4 已采纳用绝对路径看看你最好把异常完全打印，你这样没法排查问题的
HDFS运维
2022-05-26 11:15

cpuCode的博客文件被复制到本地系统中查看文件内容建立目录复制文件查看目录的健康状态 check 目录下的文件查看某个目录 block 以及监控情况删除文件或目录查看目录损坏的块查看 HDFS 的基本统计信息主从切换查看 ...
HDFS 常见的运维技巧汇总
2022-06-20 22:23

Shockang的博客下面汇总一些常见的 Hadoop 运维技巧（不定期更新）。日志是 Hadoop 运维最重要的依据，无论遇到什么异常情况，通常首先做的就是查看日志。下面介绍日志的存放路径。我们可以通过直接查看日志文件的方式查看日志，也...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 3月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月31日

悬赏问题

¥20 Ubuntu18.04卸载Python2后无可视化界面问题
¥15 php同一个单元格里多选提交，更新表格
¥15 Vue 前端调用本地jar包有什么方法？
¥15 基础的图像处理问题求解答
¥50 全国两定智慧医保接口开发相关业务文档，以及技术实现流程文档
¥15 idea做图书管理系统，要求如下
¥15 最短路径分配法——多路径分配
¥15 SQL server 2022安装程序（英语）无法卸载
¥15 求一个nao机器人跳舞的程序
¥15 anaconda下载后spyder内无法正常运行

hdfs文件下载不到本地

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新