• 全部
  • 关注
  • 有问必答
  • 等你来答

排行榜

  • 用户榜
  • 标签榜
  • 冲榜分奖金

频道

  • 编程语言
  • 后端
  • Python
  • Java
  • 前端

活动

  • C站认证
  • 大咖来了
  • 悦读时间
最新最热精华悬赏待回答 筛选
  • 2

    回答

  • 36

    浏览

现在公司嫌程序访问数据库太慢了,听说spark能给程序加速,所以希望能用Java调用spark来访问数据库。那么请问这个Java项目怎么写?(注:spark采用local模式运行即可)

  • 0

    回答

  • 3

    浏览

单机的时候是没有问题的。但是用standalone 或yarn 模式提交作业的话就会报java.lang.UnsatisfiedLinkError: no gdalalljni in java.lib

回答 weixin_48484941
采纳率100%
2021-10-18 15:15
  • 1

    回答

  • 24

    浏览

编写Scala程序读取数据,对属性列”ID”的重复样本,以重复样本记录的“A_Day”与”B_Day”的属性均值分别作为这两个属性的值,并删除多于样本,保留“updata_at”值最近的那条样本。 截

回答 Coisin__RWwo
采纳率50%
2021-10-06 16:29
  • 1

    回答

  • 14

    浏览

在代码里面: SparkLauncher launcher = null; launcher.setAppResource(SPARK_JAR); launcher.setMainClass(SPAR

回答 学编程的渣渣
采纳率33.3%
2021-09-28 11:49
  • 2

    回答

  • 18

    浏览

  • 2

  • 20

    浏览

ERROR [Executor task launch worker for task 0] - Exception in task 0.0 in stage 0.0 (TID 0) java.lan

caicaihaohaohao
采纳率66.7%
2021-09-08 09:26
  • 2

  • 19

    浏览

就比如kafka推送数据后,spark从kafka中拉取数据,再计算。 我直接写消费者 ,计算不行吗?两者到底啥区别?

别卷了啊
采纳率100%
2021-09-02 17:59
  • 2

    回答

  • 15

    浏览

我在安装spark3.0时遇到了问题如下:配置的环境及信息如下: 报错如下: 请问问题到底出在了哪里?

回答 上善若水_伊西斯
采纳率20%
2021-08-25 17:36
  • 1

    回答

  • 23

    浏览

测试环境:spark 2.4 + python 3.7生产环境:spark 2.2 + python 3.7 (环境不能修改) 测试环境能跑通,生产环境报错如下:21/08/19 16:17:

回答 lxl876
采纳率0%
2021-08-20 17:17
  • 1

    回答

  • 66

    浏览

conf = {"hbase.zookeeper.quorum": host, "hbase.mapreduce.inputtable": table} keyConv = "org.apache.s

故梦�
采纳率0%
2021-08-17 11:00
  • 1

    回答

  • 36

    浏览

在pyspark中如何实现呢这里是图中链接 https://www.cse.ust.hk/msbd5003/data/dblp.in https://www

  • 1

    回答

  • 13

    浏览

环境变量配置 winutils.exe安装目录 scala代码和运行后报错 看了别人说配置变量 重启电脑就好了,为啥我的还是有问题,请道友们研究研究

回答 m0_57934557
采纳率50%
2021-08-05 21:31
  • 1

    回答

  • 15

    浏览

在本机正常运行, 服务器上运行报错,spark版本2.3.1 hive版本1.1.0 错误信息: org.apache.thrift.TApplicationException: Required f

回答 z183052114
采纳率50.9%
2021-07-30 17:14