莫离yy 2022-09-16 09:12 采纳率: 0%
浏览 25
已结题

Hadoop数据传输问题?

Hadoop数据传输问题?

在开发中遇见一个问题,业务数据服务器与Hadoop服务器不在同一个地方,网络不可达,需要将业务数据实时传入Hdfs中。
公司用的是c#开发的,不是很熟悉大数据组件,他们准备在Hadoop服务器中部署一套tomcat的web服务,用来实时接收业务数据,现在所面临的问题就是如何将tomcat中的实时数据传送到Hdfs中?
(要求只能在hadoop、hive、spark这三个技术中解决,我目前想到的就是写javaApi上传数据,但是那是实时数据,每次只有一条数据,这样会频繁地创建fs对象,对系统性能不是很好。接口中的数据以Json格式发送)
有没有兄弟指导一下该怎么做?

  • 写回答

1条回答 默认 最新

  • DSJ_ kohler 2022-09-16 09:33
    关注

    这三个可能不太好解决,对于大数据场景来说,如果将业务数据服务器上的数据传输到hadoop集群上,需要通过flume + kafka + flume的方式,详情你可以参考这篇博客:https://blog.csdn.net/qq_38705144/article/details/112600396

    评论 编辑记录

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 5月23日
  • 创建了问题 9月16日

悬赏问题

  • ¥15 preLaunchTask"C/C++: aarch64- apple-darwin22-g++-14 生成活动 文件”已终止,退出代码为-1。
  • ¥18 关于#贝叶斯概率#的问题:这篇文章中利用em算法求出了对数似然值作为概率表参数,然后进行概率表计算,这个概率表是怎样计算的呀
  • ¥20 C#上传XML格式数据
  • ¥15 elementui上传结合oss接口断点续传,现在只差停止上传和继续上传,各大精英看下
  • ¥100 单片机hardfaulr
  • ¥20 手机截图相片分辨率降低一半
  • ¥50 求一段sql语句,遇到小难题了,可以50米解决
  • ¥15 速求,对多种商品的购买力优化问题(用遗传算法、枚举法、粒子群算法、模拟退火算法等方法求解)
  • ¥100 速求!商品购买力最优化问题(用遗传算法求解,给出python代码)
  • ¥15 虚拟机检测,可以是封装好的DLL,可付费