大象灵感 2021-09-12 15:42 采纳率: 0%
浏览 14
已结题

关于Flink WATERMARK,下面两种理解方式哪种是对的?

例如以WATERMARK FOR order_time AS order_time - INTERVAL '4' SECOND的方式定义一个水印,其中等待偏移量设置为4秒。
下面两种理解方式哪种是对的?
1.可以理解为:当Flink数据流中第一个2021-09-12 08:00:16的数据达到的4秒后,所有2021-09-12 08:00:16以前的数据都被认为已经到达了。
2.当前这一瞬,如果最大的事件时间为2021-09-12 08:00:20,那么意味着2021-09-12 08:00:16之前的数据都被认为已经到达了。其中2021-09-12 08:00:16就可以认为是分界线,表示这个时间戳之前的数据可以被处理,而这个时间戳之后的数据还需要等待,直到水位线上涨到它所在的记录。

如果是第二种理解是对的,就会有另外一个疑问——如果数据中突然来了一条错误的时间戳,比如正常的数据都是2021-09-12这一天的数据,但是由于一些奇怪的原因,突然来了一条2021-09-13 15:00:20的数据,那基于第二种理解,此刻的水位线应该是2021-09-13 15:00:16吗?

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 9月20日
    • 创建了问题 9月12日

    悬赏问题

    • ¥40 微信小程序 使用vant组件ActionSheet 下拉面板,内容区域滚动会触发。scroll-view自定义下拉刷!即使设置停止下拉刷新也不行。
    • ¥15 专业问题提问,7月5号2点之前
    • ¥25 使用cube ai 导入onnx模型时报错
    • ¥15 关于#微信小程序#的问题:用一个网页显示所有关联的微信小程序数据,包括每个小程序的用户访问量
    • ¥15 root的安卓12系统上,如何使apk获得root或者高级别的系统权限?
    • ¥20 关于#matlab#的问题:如果用MATLAB函数delayseq可以对分数延时,但是延时后波形较原波形有幅度上的改变
    • ¥15 使用华为ENSP软件模拟实现该实验拓扑
    • ¥15 通过程序读取主板上报税口的数据
    • ¥15 matlab修改为并行
    • ¥15 尝试访问%1服务的windows注册表时遇到问题。必须先解决此问题,然后才能运行安装过程。(请确认您正在使用管理员权限运行)373