andyonlines 2020-09-09 20:12 采纳率: 50%
浏览 92
已结题

flink kekby 分区问题

请看下面的代码

object KeybyTest {
  def main(args: Array[String]): Unit = {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    val random = new Random()
    env.setParallelism(4)
    val parallelism = env.getParallelism

    val stream = env.addSource(new SensorSource)
      .map(v=>{
        (v.id,(random.nextInt().abs % parallelism).toString) //_.2 为分组字段
      })
      .keyBy(1)
      .print()

    env.execute()
  }
}

设置并行度为4
随机生成0到3的数作为分区字段,发现有一个subtask的没有数据进来.

输出结果如下:

2> (sensor_0,3) 
2> (sensor_1,3)
2> (sensor_2,1)
2> (sensor_4,3)
2> (sensor_5,1)
2> (sensor_1,1)
3> (sensor_0,0)
1> (sensor_2,2)
3> (sensor_4,0)
3> (sensor_5,0)
1> (sensor_2,2)

有两个key值跑到同一个分区去了,这怎么解决?

  • 写回答

1条回答 默认 最新

  • dabocaiqq 2020-09-10 09:43
    关注
    评论

报告相同问题?

悬赏问题

  • ¥20 软件测试决策法疑问求解答
  • ¥15 win11 23H2删除推荐的项目,支持注册表等
  • ¥15 matlab 用yalmip搭建模型,cplex求解,线性化处理的方法
  • ¥15 qt6.6.3 基于百度云的语音识别 不会改
  • ¥15 关于#目标检测#的问题:大概就是类似后台自动检测某下架商品的库存,在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
  • ¥15 神经网络怎么把隐含层变量融合到损失函数中?
  • ¥15 lingo18勾选global solver求解使用的算法
  • ¥15 全部备份安卓app数据包括密码,可以复制到另一手机上运行
  • ¥20 测距传感器数据手册i2c
  • ¥15 RPA正常跑,cmd输入cookies跑不出来