Flink中的水位线是动态生成的,watermark = 进入窗口的最大事件时间-允许延迟的时间,当watermark时间戳大于等于窗口结束时间时,意味着窗口结束,需要触发窗口计算,请问窗口开始时间和结束时间是怎么计算的?
2条回答 默认 最新
关注
对于时间窗口,开始时间和结束时间的计算方式如下:
滚动时间窗口:按照固定的时间长度对数据进行分组,窗口的大小和滑动步长相同,例如,5秒的滚动窗口,每5秒钟计算一次。开始时间为当前窗口大小的整数倍,结束时间为开始时间加上窗口大小。
滑动时间窗口:按照固定的时间长度对数据进行分组,窗口的大小和滑动步长不同,例如,5秒的滑动窗口,每2秒钟滑动一次。开始时间为当前窗口大小的整数倍加上窗口滑动步长的整数倍,结束时间为开始时间加上窗口大小。
会话窗口:按照数据的时间间隔进行分组,当两个数据之间的时间间隔大于指定的间隔时间时,就认为前一个窗口结束,后一个窗口开始。开始时间为第一个数据的时间戳,结束时间为最后一个数据的时间戳加上间隔时间。
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报