关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
我不想名字重复
2021-11-22 16:36
采纳率: 0%
浏览 60
首页
大数据
已结题
公司A通过http请求访问公司B的hdfs上的文件数据
hadoop
scala
java
比如,公司A要获取公司B的hadoop集群的hdfs某个路径下的文件(不考虑安全认证什么的),但hdfs上存的数据都是以块存的,我可以获取到一个txt文件或者csv文件,但获取块的文件夹时却没办法获取数据,现在要将conf.set("fs.default","hdfs:127.0.01")这样的方式获取改为http请求,请问有案例吗,谢谢
运行结果及报错内容
我的解答思路和尝试过的方法
能通过代码获取到csv文件,但怎么获取到leiWriter文件夹呢并且是http请求,毕竟hdfs上这样的数据才是最普遍的,
收起
写回答
好问题
0
提建议
关注问题
微信扫一扫
点击复制链接
分享
邀请回答
编辑
收藏
删除
收藏
举报
3
条回答
默认
最新
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
我不想名字重复
2021-11-22 16:41
关注
顶一下
本回答被题主选为最佳回答
, 对您是否有帮助呢?
本回答被专家选为最佳回答
, 对您是否有帮助呢?
本回答被题主和专家选为最佳回答
, 对您是否有帮助呢?
解决
无用
评论
打赏
微信扫一扫
点击复制链接
分享
举报
评论
按下Enter换行,Ctrl+Enter发表内容
查看更多回答(2条)
向“C知道”追问
报告相同问题?
提交
关注问题
大数据
存储技术(2)——
HDFS
分布式
文件
系统
2023-12-07 21:43
Francek Chen的博客
随着
数据
量越来越大,在一个操作系统存不下所有的
数据
,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的
文件
,这就是分布式
文件
管理系统。
HDFS
就是分布式
文件
...
浅谈
大数据
领域
HDFS
的
数据
分片策略
2025-05-21 14:42
光子AI的博客
本文旨在全面解析
HDFS
(Hadoop Distributed File System)中的
数据
分片策略,这是理解
大数据
存储和处理的基础。
HDFS
数据
分片的基本原理分片大小对系统性能的影响副本放置策略及其优化实际应用中的调优技巧本文讨论的...
大数据
领域
HDFS
数据
访问
控制策略
2025-06-18 02:29
AI大数据智能洞察的博客
HDFS
(Hadoop分布式
文件
系统)作为
大数据
基础设施的核心存储层,其
数据
访问
控制策略是保障集群安全与多租户隔离的关键机制。本文从第一性原理出发,系统解析
HDFS
访问
控制的理论基础、架构设计与实践要点,覆盖从经典...
大数据
_
HDFS
原理
2022-10-01 22:52
Happy编程的博客
Block 保存在那些 DataNode 节点上(
数据
并非保存在 NameNode 磁 盘上的,它是在 DataNode 启动时上报给 NameNode 的,NameNode 接收到之后 将这些信息保存在内存中)NameNode 的 metadata 信息在 NameNode 启动后...
大数据
领域
HDFS
数据
同步方案探讨
2025-04-11 20:02
AI大数据智能洞察的博客
随着
数据
规模不断扩大和业务需求日益复杂,如何高效、可靠地实现
HDFS
数据
同步成为
大数据
架构设计中的关键问题。本文旨在系统性地探讨
HDFS
数据
同步的各种技术方案,分析其优缺点及适用场景。本文首先介绍
HDFS
的基本...
【Hadoop
大数据
技术】——
HDFS
分布式
文件
系统(学习笔记)
2024-03-07 14:44
HinsCoder的博客
在NameNode内部是以元
数据
的形式,维护着两个
文件
,分别是FsImage镜像
文件
和EditLog日志
文件
。其中,FsImage镜像
文件
用于存储整个
文件
系统命名空间的信息,EditLog日志
文件
用于持久化记录
文件
系统元
数据
发生的变化。...
大数据
领域
HDFS
的
数据
存储效率提升
2026-01-07 00:18
操作系统内核探秘的博客
Hadoop 分布式
文件
系统(
HDFS
)作为
大数据
生态系统中最常用的分布式
文件
系统,为大规模
数据
提供了可靠的存储解决方案。然而,随着
数据
量的不断增长,
HDFS
的
数据
存储效率问题逐渐凸显。本文的目的在于深入探讨如何...
剖析
大数据
领域
HDFS
的
数据
存储架构演进
2025-05-12 21:03
光子AI的博客
HDFS
作为 Apache Hadoop 项目的核心组件之一,旨在提供一个高容错、高吞吐量的分布式
文件
系统,能够在廉价的硬件集群上存储和处理大规模
数据
。本文的目的是深入剖析
HDFS
数据
存储架构的演进过程,涵盖从
HDFS
1.0 ...
大数据
领域
HDFS
的
数据
一致性保障机制
2025-05-13 19:05
AI大数据智能洞察的博客
本文旨在系统性地解析
HDFS
(Hadoop Distributed File System)如何在大规模分布式环境中保障
数据
一致性。我们将覆盖从基础架构设计到具体实现机制的...NameNode:
HDFS
的主节点,负责管理
文件
系统命名空间和客户端
访问
。
大数据
领域
HDFS
的
数据
一致性维护方法
2026-02-19 02:18
AI应用架构探索者的博客
我是张明,资深
大数据
工程师,拥有6年Hadoop、Spark、Hive等技术的实践经验,曾负责过PB级
数据
仓库的搭建和运维。专注于
大数据
存储与计算的性能优化和稳定性保障。欢迎关注我的公众号“
大数据
技术实践”,获取更多...
没有解决我的问题,
去提问
向专家提问
向AI提问
付费问答(悬赏)服务下线公告
◇ 用户帮助中心
◇ 新手如何提问
◇ 奖惩公告
问题事件
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
已结题
(查看结题原因)
8月22日
关注
码龄
粉丝数
原力等级 --
被采纳
被点赞
采纳率
创建了问题
11月22日