Eumenides-Z 2018-11-27 10:55 采纳率: 100%

浏览 865

已结题

能否用spark streaming和flume或kafka对实时网络数据进行检测

目前已经有一个训练好的机器学习分类模型，存在于HDFS上，可以对LibSVMFile格式的数据进行检测。它是对很多的一段时间内的流量数据（比如1s，很多个1s）提取特征训练之后得到的。
我们知道streaming是将输入流分成微切片，微切片能否可以是从pcap文件读取呢？因为提取特征包括训练模型的时候是需要对pcap文件操作的。
flume和kafka都是可以传输txt的，能不能传输pcap文件呢？要将输入的网络数据流像tcpdump一样可以存为pcap文件，又有像kafka一样的缓存功能可以用哪些技术呢？
最后就是能否用spark streaming利用分类模型对网络数据流进行提特征并预测，而且与防火墙联动，这在技术上是否可行？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2018-11-27 12:32
关注
https://blog.csdn.net/qq_37142346/article/details/81140618

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

悬赏问题

¥15 任意一个散点图自己下载其js脚本文件并做成独立的案例页面，不要作在线的，要离线状态。
¥30 c#打开word开启修订并实时显示批注
¥15 如何解决ldsc的这条报错/index error
¥15 VS2022+WDK驱动开发环境
¥30 关于#java#的问题，请各位专家解答！
¥30 vue+element根据数据循环生成多个table，如何实现最后一列平均分合并
¥20 pcf8563时钟芯片不启振
¥20 pip2.40更新pip2.43时报错
¥15 换yum源但仍然用不了httpd
¥50 C# 使用DEVMOD设置打印机首选项