1.他们处理的数据源和处理次数、处理逻辑是一模一样的!!可是所需的时间差异却这么的大
2.因为spark版的kmeans算法里我要迭代计算新的聚类中心点,每一次迭代计算的聚类中心点结果需要collect到drive端,来进行下一次的迭代计算
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
报告相同问题?