weixin_48484941 2021-11-24 10:01 采纳率: 62.5%
浏览 32
已结题

spark sql join 1个driver很慢,其他很快,怀疑数据倾斜,帮解决可有偿私

问题:用spark sql 表join自身,执行过程就1个driver很慢,其他很快

代码:

      spark.sql("select /*+ MERGEJOIN(t2) */ t1.bsm,t2.bsm " +
        " from temp t1" +
        " join temp t2 on t1.index != t2.index and st_overlaps(t1.geometry,t2.geometry)").show()

结果:

img

img

import org.apache.spark.sql.SparkSession
import org.gdal.ogr.Geometry
import org.locationtech.geomesa.spark.GeoMesaSparkKryoRegistrator
import org.locationtech.geomesa.spark.jts._
import org.locationtech.jts.geom.MultiPolygon

object SparkSqlJoinTest {

  def main(args: Array[String]):Unit = {
    val spark: SparkSession = SparkSession.builder()
      .appName("testSpark")
      .config("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
      .config("spark.kryo.registrator", classOf[GeoMesaSparkKryoRegistrator].getName)
      .master("local[*]")
//      .config("spark.sql.adaptive.enabled",true)
//      .config("spark.sql.adaptive.coalescePartitions.enabled",true)
//      .config("spark.sql.adaptive.coalescePartitions.minPartitionNum",1)
//      .config("spark.sql.adaptive.skewJoin.enabled",true)
//      .config("spark.sql.adaptive.skewJoin.skewedPartitionFactor",5)
      .config("spark.sql.crossJoin.enabled",true)
      .getOrCreate()
      .withJTS

    val geonamesParams = Map(
      "hbase.zookeepers" -> "master",
      "hbase.catalog"  -> "test"
    )

    val geonamesDF = spark.read
      .format("geomesa")
      .options(geonamesParams)
      .option("geomesa.feature", "test2000")
      .load()

    geonamesDF.where("layername='test2000'").createOrReplaceTempView("temp")

    try{

      spark.sql("select /*+ skewjoin(t2) */ t1.bsm,t2.bsm from temp t1 join temp t2 ").rdd.saveAsTextFile("D:/test")

//      spark.sql("select /*+ skewjoin(t2) */ t1.bsm,t2.bsm " +
//        " from temp t1" +
//        " join temp t2 on t1.index != t2.index and st_overlaps(t1.geometry,t2.geometry)").show()
}finally {
  print("a")

}
  }



}

img

  • 写回答

1条回答 默认 最新

  • 「已注销」 2021-11-24 10:27
    关注

    你把它复制到记事本发给我

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月2日
  • 已采纳回答 11月24日
  • 修改了问题 11月24日
  • 修改了问题 11月24日
  • 展开全部

悬赏问题

  • ¥15 YoloV5 第三方库的版本对照问题
  • ¥15 请完成下列相关问题!
  • ¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像,如何解决?
  • ¥15 求daily translation(DT)偏差订正方法的代码
  • ¥15 js调用html页面需要隐藏某个按钮
  • ¥15 ads仿真结果在圆图上是怎么读数的
  • ¥20 Cotex M3的调试和程序执行方式是什么样的?
  • ¥20 java项目连接sqlserver时报ssl相关错误
  • ¥15 一道python难题3
  • ¥15 牛顿斯科特系数表表示