sailorZheng 2017-09-23 14:58 采纳率: 0%
浏览 1082

从hdfs读取文件夹加密压缩传到ftp服务器上

最近项目中需要从hdfs读取文件夹加密压缩到ftp服务器上,目前采用的方案是从hdfs上下载文件到本地,后加密压缩,接着上传到ftp上。由于有三次io操作过程,效率和速度都不理想。目前想读取hdfs文件流的同时进行加密压缩流,然后将流写到ftp服务器上,求教此方案是否可行或者能否有现有的工具类可以快速实现,谢谢

  • 写回答

1条回答 默认 最新

  • lshen01 2023-03-16 10:27
    关注

    参考GPT和自己的思路:

    您好,针对您的问题,我认为您可以使用Apache Hadoop提供的工具类来实现从hdfs读取文件夹加密压缩传到ftp服务器上。

    具体的方案可以如下:

    1.使用Hadoop的InputFormat从HDFS中读取文件流。

    2.对文件流进行加密压缩处理,并将加密压缩后的文件流通过Hadoop的OutputFormat写入FTP服务器。

    3.使用Hadoop的FileSystem API将加密压缩后的文件保存到本地,然后上传到FTP服务器。

    4.使用Apache Common Net Library通过FTP协议将加密压缩后的文件上传到FTP服务器。

    同时,可以使用Apache Commons Compress Library提供的压缩和解压缩功能来实现文件夹的压缩和解压缩操作。

    需要注意的是,在处理文件流的加密和压缩过程中,要确保数据的安全性和正确性,以免出现数据损坏或泄露的情况。

    希望我的回答能够帮助到您,谢谢!

    评论

报告相同问题?

悬赏问题

  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号
  • ¥50 安装pyaudiokits失败
  • ¥15 计组这些题应该咋做呀
  • ¥60 更换迈创SOL6M4AE卡的时候,驱动要重新装才能使用,怎么解决?
  • ¥15 让node服务器有自动加载文件的功能
  • ¥15 jmeter脚本回放有的是对的有的是错的
  • ¥15 r语言蛋白组学相关问题
  • ¥15 Python时间序列如何拟合疏系数模型