现在需要使用Flink处理一批乱序数据,设置了一个十分钟的窗口从10:14:50-10:24:50,但是为什么10:14:51的数据会输出到测输出流中?
val aggStream = dataStream
.filter(_.method == "GET")
.keyBy(_.url)
.timeWindow(Time.minutes(10), Time.seconds(5))
.allowedLateness(Time.minutes(1)) //允许延迟
.sideOutputLateData(new OutputTag[ApacheLogEvent]("late"))
.aggregate(new PageCountAgg(), new PageViewCountWindowResult())
希望有朋友可以帮忙解答一下