spark运行scala的jar包

图片说明

有人遇到过类似的问题吗？
我的尝试：
当没Master节点的Worker进程，运行会报错，当开启了Master节点的Worker进程有时不会报错，但是会说内存不够，但是我觉得不是这个问题，也能得出一定的结果，但并不是预期的结果。

执行的命令：bin/spark-submit --master spark://node1:7077 --class cn.itcast.WordCount_Online --executor-memory 1g --total-executor-cores 1 ~/data/spark_chapter02-1.0-SNAPSHOT.jar /spark/test/words.txt /spark/test/out

jar包是在idea中打包的，用的是scala语言，主要作用是词频统计
scala代码：

package cn.itcast

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object WordCount_Online {
  def main(args: Array[String]):Unit={
    val sparkConf = new SparkConf().setAppName("WordCount_Online")
    val sparkContext = new SparkContext(sparkConf)
    val data : RDD[String] = sparkContext.textFile(args(0))
    val words :RDD[String] = data.flatMap(_.split(" "))
    val wordAndOne :RDD[(String,Int)] = words.map(x => (x,1))
    val result :RDD[(String,Int)] = wordAndOne.reduceByKey(_+_)
    result.saveAsTextFile(args(1))
    sparkContext.stop()
  }
}

我也做了很多尝试，希望懂的人可以交流一下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-10-27 15:49
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
关于该问题，我找了一篇非常好的博客，你可以看看是否有帮助，链接：Scala,Spark依赖jar包冲突解决方法

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

spark-submit命令运行jar包报空指针，Java -jar命令可以运行。 jar java spark
2018-05-08 10:49

回答 1 已采纳可以试试hadoop jar xxx(main)
如何在IntelliJ IDEA中安装完scala后，spark包报红？ intellij-idea spark
2022-04-19 11:52

回答 2 已采纳依赖和依赖的版本都要对上
spark 调用SparkPi时，显示拒绝连接 hadoop spark 大数据
2023-03-15 15:46

回答 1 已采纳这篇文章：spark 运行自带样例SparkPi、spark-examples报错也许有你想要的答案，你可以看看
Scala开发环境部署以及jar包提交运行
2022-11-02 09:43

醉与浮的博客 scala在idea中使用maven的开发模式
配置hive on spark测试，创建表，insert测试效果报错，如何解决？ hadoop hive spark 有问必答
2022-04-21 01:37

回答 2 已采纳你在b站视频下面看看评论区，评论区下面的前几个有大佬提供了解决思路。我当时这里报错了，我用了评论区给的方法成功了。如果评论区的方法没有解决，说一个最不好听的方法，你把hive和spark重新装一遍。我
spark创建外部表时报错 spark
2017-09-22 03:23

回答 2 已采纳可能是scala驱动版本不匹配
spark 本地 maven 工程报错 java javascript spark 其他
2021-04-21 09:32

回答 1 已采纳发现了额，是jdk 版本问题，我用的是jdk 16 ，换成 8 就好了
java spark jar包_Spark java+scala项目打包(jar)
2021-03-08 23:39

柔粟的博客 1.法1：maven打包pom.xml文件maven-assembly-pluginfalsejar-with-dependencies ch.kmeans2.SparkStreamingKMeansKafkaExamplemake-assemblypackageassemblyorg.scala-toolsmaven-scala-plugin2.15.2...
Atlas关联spark插件编译报错大数据
2023-01-17 10:39

回答 3 已采纳这个是github上个人维护的spark-aql勾子程序,你的问题应该是设置高版本的spark和scala,造成了一些版本冲突,而且高版本中许多类都更新过了,当然找不到.(1)<import o
spark（自带hive）不能读取主子表的数据 hive spark
2017-09-06 08:27

回答 1 已采纳可以使用spark的连接器： CREATE table st_order ( shop_id string, `date` string) using com.sequoiadb.spark
在AWS EMR sdk中使用AddJobFlowStep的正确方法是什么？ jar scala
2017-03-21 09:47

回答 1 已采纳 I managed to solve this issue. For anyone who is struggling with something similar, the answer is
在spark里面使用jar包运行java项目
2022-04-02 21:14

可乐旺仔冰的博客在spark里面使用jar包运行java项目
在win10启动kafka报错 kafka zookeeper
2022-05-15 21:27

回答 1 已采纳删除异常的主题“movie_real_topic”试试.\bin\kafka-topics --delete --topic movie_real_topic --zookeeper localhos
在linux上运行scala的jar包
2019-11-25 20:32

乔治大哥的博客 -- 在maven项目中既有java又有scala代码时配置 maven-scala-plugin 插件打包时可以将两类代码一起打包 --> <groupId>org.scala-tools <artifactId>maven-scala-plugin <version>2.15.2 <goal>compile ...
java spark程序打包_Spark java+scala项目打包(jar)
2021-03-21 08:57

芥子纳须弥1116的博客 1.法1：maven打包pom.xml文件maven-assembly-pluginfalsejar-with-dependencies ch.kmeans2.SparkStreamingKMeansKafkaExamplemake-assemblypackageassemblyorg.scala-toolsmaven-scala-plugin2.15.2...
没有解决我的问题, 去提问

悬赏问题

¥15 如何用stata画出文献中常见的安慰剂检验图
¥15 c语言链表结构体数据插入
¥40 使用MATLAB解答线性代数问题
¥15 COCOS的问题COCOS的问题
¥15 FPGA-SRIO初始化失败
¥15 MapReduce实现倒排索引失败
¥15 ZABBIX6.0L连接数据库报错，如何解决？(操作系统-centos)
¥15 找一位技术过硬的游戏pj程序员
¥15 matlab生成电测深三层曲线模型代码
¥50 随机森林与房贷信用风险模型

spark运行scala的jar包

1条回答 默认 最新

悬赏问题

1条回答默认最新