各位大佬,请教一个问题。 关于spark任务的。 一个大表和一个小表join,大表1.7亿条,小表几百条。 我已经把小表广播了。 在集群下执行的时候,总卡到一个task(通过ui看每次都是最后一个)上,然后长时间等待,最后报executor lost failure。就异常退出了!
这是怎么回事呢?
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
数据倾斜了吧,先抽样reducebykey看一下各个key的分布
报告相同问题?