容易饿的奥利奥 2024-01-19 15:49 采纳率: 0%
浏览 6

flink使用sum为什么出现多个重复结果

使用flink时候出现重复数据,我想不通

img

为什么flink使用sum的结果是

img


原数据为

img

  • 写回答

1条回答 默认 最新

  • 百锦再@新空间 优质创作者: 编程框架技术领域 2024-01-19 16:17
    关注

    当使用 Flink 的 sum 操作时出现多个重复结果的原因可能是由于事件流中存在某些重复数据,或者在窗口计算中存在重叠窗口的情况。

    首先,确保输入的事件流没有重复数据。你可以在数据源端进行去重操作,或者在数据处理过程中使用 Flink 提供的去重算子,如 distinct

    微信GPT辅助做答
    如果确保输入的事件流没有重复数据,那么可能是在窗口计算中存在重叠窗口的情况。当窗口滑动大小小于窗口长度时,就会出现某些数据同时属于多个窗口的情况。例如,设定一个滑动窗口大小为10秒,窗口长度为30秒,如果一个数据的时间戳为20秒,那么它将同时属于第一、第二和第三个滑动窗口。在计算滑动窗口的 sum 时,会对这个数据进行三次求和操作,从而产生多个重复结果。

    解决这个问题的方法之一是通过增加窗口滑动大小或减小窗口长度来避免重叠窗口。确保每个数据只属于一个窗口,在窗口计算中只计算一次。

    如果以上方法仍然无法解决多个重复结果的问题,请提供更多的信息,例如代码示例或详细的问题描述,以便更好地帮助你分析和解决问题。

    评论

报告相同问题?

问题事件

  • 创建了问题 1月19日