Ethan_pika 2018-11-27 08:57 采纳率: 0%
浏览 1256

如何理解Yahoo Streaming Benchmark运行结果seen.txt和updated.txt中值的含义

Yahoo! Streaming Benchmark简介

Yahoo! Streaming Benchmark是Yahoo的一个团队在2015年对当前热门的流式计算平台:Sparking Streaming, Storm和Flink开发的一个基准测试系统。

该系统是当时第一个将这三个流式计算平台在模拟真实应用场景下的基准测试,对后面的基准测试系统的发展有重要的意义。

该系统详细的介绍见:https://yahooeng.tumblr.com/post/135321837876/benchmarking-streaming-computation-engines-at。

Github地址:https://github.com/yahoo/streaming-benchmarks。

问题描述

在使用该基准测试系统进行运行之后,会产生两个结果文件:seen.txt,updated.txt。其中记录的相关的测试结果信息,但对这两个文件中数据的含义存在困惑。相似的问题在Github中仍存在,但无人解答:https://github.com/yahoo/streaming-benchmarks/issues/22。

因此,如何理解这个基准测试的信息,并且如何使用这些数据绘制出如下统计图(该图是该系统开发人员进行给出的):

图片说明

感谢你的回答!!!

  • 写回答

2条回答 默认 最新

  • varuy322 2018-12-12 02:25
    关注

    计算latency主要使用updated.txt 其存的是10s窗口生成的最后一条数据被处理的时间(last_record_timestamp)与10s窗口第一条数据产生的时间(所说的window产生时间window_time)之差。最终计算latency时还要减去窗口时间(10s),表示数据产生窗口的最后一条record从kafka发出到被处理的时间。 希望对你有所帮助!

    评论

报告相同问题?

悬赏问题

  • ¥15 如何在scanpy上做差异基因和通路富集?
  • ¥20 关于#硬件工程#的问题,请各位专家解答!
  • ¥15 关于#matlab#的问题:期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707,使系统具有较小的超调量
  • ¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
  • ¥30 截图中的mathematics程序转换成matlab
  • ¥15 动力学代码报错,维度不匹配
  • ¥15 Power query添加列问题
  • ¥50 Kubernetes&Fission&Eleasticsearch
  • ¥15 報錯:Person is not mapped,如何解決?
  • ¥15 c++头文件不能识别CDialog