Spark scala 运行报错 .test$$anonfun$1

同样的写法再scala中执行报错，然而在java中能够正常执行
以下是报错内容

 helloOffSLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/C:/Users/zsts/.m2/repository/org/apache/logging/log4j/log4j-slf4j-impl/2.5/log4j-slf4j-impl-2.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/C:/Users/zsts/.m2/repository/org/slf4j/slf4j-log4j12/1.7.10/slf4j-log4j12-1.7.10.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]
ERROR StatusLogger No log4j2 configuration file found. Using default configuration: logging only errors to the console.
19:25:11.875 [main] ERROR org.apache.hadoop.util.Shell - Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
    at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:355) ~[hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.util.Shell.getWinUtilsPath(Shell.java:370) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.util.Shell.<clinit>(Shell.java:363) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.util.StringUtils.<clinit>(StringUtils.java:79) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.Groups.parseStaticMapping(Groups.java:116) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.Groups.<init>(Groups.java:93) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.Groups.<init>(Groups.java:73) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.Groups.getUserToGroupsMappingService(Groups.java:293) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.UserGroupInformation.initialize(UserGroupInformation.java:283) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.UserGroupInformation.ensureInitialized(UserGroupInformation.java:260) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.UserGroupInformation.loginUserFromSubject(UserGroupInformation.java:789) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.UserGroupInformation.getLoginUser(UserGroupInformation.java:774) [hadoop-common-2.6.4.jar:?]
    at org.apache.hadoop.security.UserGroupInformation.getCurrentUser(UserGroupInformation.java:647) [hadoop-common-2.6.4.jar:?]
    at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2198) [spark-core_2.10-1.6.2.jar:1.6.2]
    at org.apache.spark.util.Utils$$anonfun$getCurrentUserName$1.apply(Utils.scala:2198) [spark-core_2.10-1.6.2.jar:1.6.2]
    at scala.Option.getOrElse(Option.scala:120) [?:?]
    at org.apache.spark.util.Utils$.getCurrentUserName(Utils.scala:2198) [spark-core_2.10-1.6.2.jar:1.6.2]
    at org.apache.spark.SparkContext.<init>(SparkContext.scala:322) [spark-core_2.10-1.6.2.jar:1.6.2]
    at tarot.test$.main(test.scala:19) [bin/:?]
    at tarot.test.main(test.scala) [bin/:?]
Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://tarot1:9000/sparkTest/hello
    at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:285)
    at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)
    at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:313)
    at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:199)
    at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
    at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
    at scala.Option.getOrElse(Option.scala:120)
    at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
    at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
    at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
    at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
    at scala.Option.getOrElse(Option.scala:120)
    at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
    at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
    at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
    at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
    at scala.Option.getOrElse(Option.scala:120)
    at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
    at org.apache.spark.rdd.RDD$$anonfun$take$1.apply(RDD.scala:1307)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:150)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:111)
    at org.apache.spark.rdd.RDD.withScope(RDD.scala:316)
    at org.apache.spark.rdd.RDD.take(RDD.scala:1302)
    at tarot.test$.main(test.scala:26)
    at tarot.test.main(test.scala)

scala代码

 package tarot

import scala.tools.nsc.doc.model.Val

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.api.java.JavaSparkContext

object test {
  def main(hello:Array[String]){
    print("helloOff")
    val conf = new SparkConf()
        conf.setMaster("spark://tarot1:7077")
                .setAppName("hello_off")
                .set("spark.executor.memory", "4g")
                .set("spark.executor.cores", "4")
                .set("spark.cores.max", "4")
                .set("spark.sql.crossJoin.enabled", "true")
    val sc = new SparkContext(conf)
        sc.setLogLevel("ERROR")
    val file = sc.textFile("hdfs://tarot1:9000/sparkTest/hello")
    val filterRDD = file.filter {  (ss:String) =>    ss.contains("hello") }
    val f=filterRDD.cache()
//    println(f)
//    filterRDD.count()
    for(x <- f.take(100)){
      println(x)
    }
  }
    def helloingTest(jsc:SparkContext){
    val sc = jsc

    val file = sc.textFile("hdfs://tarot1:9000/sparkTest/hello")
    val filterRDD = file.filter((ss:String) =>   ss.contains("hello"))

    val f=filterRDD.cache()
    println(f)
    val i = filterRDD.count()
    println(i)
  }
//  val seehello =
  def helloingTest(jsc:JavaSparkContext){
    val sc = jsc

    val file = sc.textFile("hdfs://tarot1:9000/sparkTest/hello")
    val filterRDD = file.filter((ss:String) =>   ss.contains("hello"))

    val f=filterRDD.cache()
    println(f)
    val i = filterRDD.count()
    println(i)

  }

}

java代码

 package com.tarot.sparkToHdfsTest;

import org.apache.spark.SparkConf;
import org.apache.spark.SparkContext;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.rdd.RDD;

//import scalaModule.hello;


public class App 
{
    public static void main( String[] args )
    {
        SparkConf sparkConf = new SparkConf();
        sparkConf.setMaster("spark://tarot1:7077")
                .setAppName("hello off")
                .set("spark.executor.memory","4g")
                .set("spark.executor.cores", "4")
                .set("spark.cores.max","4")
                .set("spark.sql.crossJoin.enabled", "true");
        JavaSparkContext jsc = new JavaSparkContext(sparkConf);
        jsc.setLogLevel("ERROR");
        text(jsc);
//      test.helloingTest(jsc);
    }

/**
 * test
 * @param jsc
 */
private static void text(JavaSparkContext jsc){
//  jsc.textFile("hdfs://tarot1:9000/sparkTest/hello");
    JavaRDD<String> jr= jsc.textFile("hdfs://tarot1:9000/sparkTest/hello",1);
    jr.cache();
//  test t = new test();
    jr.filter(f);

    for (String string :  jr.take(100)) {
        System.out.println(string);
    }
    System.out.println("hello off");
}

public static Function<String, Boolean> f = new Function<String, Boolean>() {
    public Boolean call(String s) {
        return s.contains("hello");
    }
};
}

坑了很久了，网上的解决办法不是让我去shell上就是让我上传jar包，但是java不用啊？都调用的JVM。
大神救命

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
zqbnqsdsmd 2018-06-02 15:20
关注
https://blog.csdn.net/xiao_jun_0820/article/details/45038205

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python报org.apache.spark.SparkException: Python worker failed to connect back.
2022-12-06 15:11

长不大的蜡笔小新的博客 org.apache.spark.SparkException: Python worker failed to connect back.
spark编程ERROR02——java.lang.OutOfMemoryError: Java heap space
2022-04-08 14:39

SY_Pistachio的博客 --class "com.sparkcore.dataQuality.dataExploration.data_exploration_7.Code_Test" --master spark://10.10.10.10:7077 --total-executor-cores 24 --executor-memory 3G --driver-memory 3G.
用IDEA开发spark应用，发生java.lang.ClassNotFoundException的解决
2014-11-04 10:06

qq_22091165的博客之前的一篇转载介绍了用IDEA开发spark应用的配置方法。在完成配置之后，我写了下面的demo code。 object LogReg { def main (args: Array[String]) { val conf = new SparkConf().setAppName("spark demo")....
【五一创作】使用Scala二次开发Spark3.3.0实现对MySQL的upsert操作
2023-04-29 18:05

虎鲸不是鱼的博客本文介绍使用Scala对Spark做二次开发实现对MySQL执行upsert操作的原理及实现
Spark 闭包（Task not serializable）问题分析及解决
2021-07-15 08:13

大数据技术架构的博客问题描述及原因分析在编写Spark程序中，由于在map等算子内部使用了外部定义的变量和函数，从而引发Task未序列化问题。然而，Spark算子在计算过程中使用外部变量在许多情形下确实在所难...
Spark中组件Mllib的学习1之Kmeans错误解决
2016-03-29 18:09

KeepLearningBigData的博客解决办法：（中间比较多，为了方便看到，放在最开始） ...代码和数据请参考【1】【2】问题： hadoop@Master:~/cloud/testByXubo/sh_spark_xubo/mllib/kmeans/KMeansTest3ByIBM$ ./submitJob.sh [Stage 0:>
如何从 0 到 1 开发 PyFlink API 作业
2021-04-27 01:07

Apache Flink的博客从 Flink 1.9 开始，Apache Flink 社区开始在原有的 Java、Scala、SQL 等编程语言的基础之上，提供对于 Python 语言的支持。经过 Flink 1.9 ～ 1.12 以及即将发布的 1.13 版本的多个版本的开发，目前 PyFlink API 的...
org.apache.spark.SparkException: Task not serializable问题分析
2016-09-06 10:52

Glad_Xiao的博客在编写Spark程序中，由于在map等算子内部使用了外部定义的变量和函数，从而引发Task未序列化问题。然而，Spark算子在计算过程中使用外部变量在许多情形下确实在所难免，比如在filter算子根据外部指定的条件进行过滤...
第114课:SparkStreaming+Kafka+Spark SQL+TopN+Mysql+KafkaOffsetMonitor电商广告点击综合案例实战(详细内幕版本)
2016-06-05 17:24

硅谷可控大模型智能体AI技术的博客第114课:Spark Streaming电商广告点击综合案例实战(测试版本) /* 王家林老师授课http://weibo.com/ilovepains 每天晚上20：00YY频道现场授课频道68917580*/... 综合案例的实战我们分步进行： 1.Mysql 中建立表：
spark 读写oracle常见问题分析
2017-01-23 17:09

a11a2233445566的博客基于Spark SQL 读写Oracle 的简单案例分析常见问题 1 概述本文主要内容包含Spark SQL读写 Oracle表数据的简单案例，并针对案例中比较常见的几个问题给出解决方法。最后从常见的java.lang....
没有解决我的问题, 去提问

Spark scala 运行报错 .test$$anonfun$1

1条回答 默认 最新

1条回答默认最新