Scala的错误代码如下有点奇怪

为什么插上电源适配器之后代码运行不了？这么神奇？
这是没插电的时候！

这是插电的时候！

哪位大伸看看有什么问题

代码如下

package L02

import org.apache.spark.sql.{DataFrame, SparkSession}
import org.apache.spark.sql.functions._

case class P2(selling_price:Double,bedrooms_num:Double,bathroom_num:Double,housing_area:Double,
              parking_area:Double,floor_num:Double,housing_rating:Double,built_area:Double,basement_area:Double,
              year_built:String,year_repair:String,latitude:Double,longitude:Double,sale_data:String)
object L001 {
  def main(args: Array[String]): Unit = {
//    val spark = new SparkConf().setMaster("local[*]").setAppName("test")
//    val sc = new SparkContext(spark)
    val spark = SparkSession.builder()
      .master("local[*]")
      .appName("test")
      .getOrCreate()
    val sc = spark.sparkContext
    import spark.implicits._
    val path = "src/main/scala/L02/house.csv"
    val rdd = sc.textFile(path, 1)
    rdd.collect().foreach(println)
    val df = rdd.map(
      x => {
        var y = x.split(",")
        P2(y(0).toDouble, y(1).toDouble, y(2).toDouble, y(3).toDouble, y(4).toDouble, y(5).toDouble,
          y(6).toDouble, y(7).toDouble, y(8).toDouble, y(9), y(10), y(11).toDouble, y(12).toDouble, y(13))
      }
    ).toDF()
    df.show(5)

    def null_count(data: DataFrame, columnName: String) = {
      println(columnName + ":缺失值数量" + (data.count() - data.na.drop().count()))
    }

    //    定义一个函数区求各列的最大值，最小值，平均值
    def mmas(data: DataFrame, columnName: String) = {
      println(columnName + ":")
      data.selectExpr("max(" + columnName + ") as max").foreach(x => println("max:" + x.toString()))
      data.selectExpr("min(" + columnName + ") as min").foreach(x => println("min:" + x.toString()))
      data.selectExpr("mean(" + columnName + ") as mean").foreach(x => println("mean:" + x.toString()))
      data.selectExpr("stddev(" + columnName + ") as stddev").foreach(x => println("stddev:" + x.toString()))
      null_count(data, "selling_price")
      println("*" * 30)
    }

    val dataColumnName = df.columns.toList
    for (i <- dataColumnName) {
      if (i == "year_built" || i == "year_repair" || i == "sale_data") {
        println(i + ":")
        null_count(df, i)
        println("-" * 20)
      } else {
        mmas(df, i)
      }
    }
    null_count(df, "selling_price")
    mmas(df, "selling_price")


    val houseDate = df.na.drop().withColumn("date", to_date(col("sale_data"), "yyyyMMdd"))
    val houseQuarter = houseDate.withColumn("quarter", quarter(col("date")))
    //    对各季度房屋销售额的统计分析
    houseQuarter.groupBy("quarter").sum("selling_price").sort("quarter").show()
    //    对各季度房屋评分的统计分析
    houseQuarter.groupBy("housing_rating").count().sort(desc("count")).show()
    houseQuarter.groupBy("housing_rating").agg(avg(col("selling_price") / col("housing_area"))).sort("housing_rating").show()

  }
}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 优质创作者: 编程框架技术领域 2024-05-23 11:38
关注
引自免费微信小程序：皆我百晓生

从你提供的信息来看，你在运行Scala代码时遇到了问题，这个问题与是否插入电源适配器无关，而是与Spark环境配置有关。在插电的情况下，你看到了一个NullPointerException和一个SparkException。

错误信息显示问题出在Spark Shuffle Block Pusher类的初始化阶段，以及Spark Heartbeat Receiver的连接问题。这通常意味着Spark的网络通信组件可能存在问题，或者是由于内存不足导致的问题。

首先，让我们检查一下你的Spark配置。在你的代码中，你已经设置了本地模式（local[*]），这意味着所有的Spark作业都会在一个进程中执行，且尽可能多地使用可用的核心数。如果你的系统资源有限，特别是内存，那么可能会因为内存不足而导致上述错误。

解决方法：

确保你的Spark程序有足够的内存来运行。尝试减少数据集大小，或者增加系统的物理内存。

检查你的Spark配置文件（通常是conf/spark-defaults.conf）是否有任何可能导致问题的设置。确保没有限制了Executor的内存或其他重要参数。

尝试使用更少的executor核心数，例如local[2]或local[4]，看看是否能解决问题。

如果你是在IDEA或者其他集成开发环境中运行，确保你的IDE没有限制JVM的内存分配。你可以在IDE的运行配置中调整JVM选项，比如添加 -Xmx4g 来分配4GB的堆内存给你的应用。

如果你仍然遇到问题，尝试更新你的Spark版本到最新稳定版，有时候老版本可能存在bug。

下面是一个修改后的代码片段，包含了上述建议中的部分更改：

import org.apache.spark.sql.functions._ import org.apache.spark.sql.types._ // ...其他导入... val sparkConf = new SparkConf() .setMaster("local[2]") // 使用较少的核心数 .setAppName("test") val spark = SparkSession.builder() .config(sparkConf) .getOrCreate() // ...其他代码...

请按照这些步骤尝试解决问题，如果还有问题，请提供更多的日志信息以便进一步诊断。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

map写法 scala语言_使用Scala语言进行编程
2020-12-20 12:03

weixin_39821605的博客 Scala和Kotlin、Clojure等一样是一种jvm语言，传说其复杂度可与C++一较高下。用下来感觉并不舒服，例如其中的implicit特性，能够减少很多代码的冗余，但另一方面，又会导致代码对新手而言的可读性变差。这篇文章拆分...
37、Scala 高级类型与函数式编程深度解析
2025-08-19 03:22

git9versioner的博客本文深入解析了 Scala 中的高级类型与函数式编程技巧，包括中缀类型、高阶类型、类型 Lambda、自递归类型（F-有界多态）等核心概念，并探讨了代数数据类型（ADT）中的求和类型与乘积类型。通过丰富的代码示例，展示...
55、Scala 并发编程与解析器组合器：原理与实践
2025-07-23 18:53

julia4scientist的博客本博客深入探讨了 Scala 的两大核心功能：并发编程与解析器组合器。文章首先介绍了 Futures 的使用，包括 transformWith 方法、Future 测试技巧以及异步测试风格。随后，详细解析了如何使用 Scala 的解析器组合器...
从Java到Scala：如何利用IDEA2021快速上手函数式编程（Scala-2.12.15实战）
2025-10-13 02:35

code8的博客本文为Java开发者提供了在IDEA2021.1.3中快速上手Scala函数式编程的实战指南。通过详细的Scala-2.12.15环境搭建、Maven项目配置及IDEA高效开发技巧，帮助读者平滑过渡思维，掌握val/var、函数作为一等公民等核心概念...
Scala学习记录
2022-02-04 13:39

杰之行的博客 Scala（发音为/ˈskɑːlə, ˈskeɪlə/）是一门多范式的编程语言，设计初衷是要集成面向对象编程和函数式编程的各种特性。洛桑联邦理工学院的Martin Odersky于2001年基于Funnel的工作开始设计Scala。Java平台的...
scala基础教程：《scala 编程（第3版）》学习笔记（全）
2023-03-15 09:58

Code_LT的博客说明这点的作用是在做scala测试的时候，ScalaTest框架，会把测试代码当作无参函数传入test函数中。这样也利用了传名函数不会马上计算结果的特征。所有需要类型参数的地方，都被认为是一个“点”，这些点可分为协变点...
scala完整笔记-5万字一周入门到精通系列（二）
2024-05-27 13:07

会java的怪蜀黍的博客 …2）Scala包的三大作用（和Java一样）（1）区分相同名字的类（2）当类很多时，可以很好的管理类（3）控制访问范围只能包含数字、字母、下划线、小圆点.，但不能用数字开头，也不要使用关键字命名规则：命名规范...
Scala和Servlet
2020-06-29 11:03

cusi77914的博客 Scala显然是一种有趣的语言，非常适合展示语言理论和创新方面的精妙新思想，但是到最后，由于它具有任何“实际”用途，因此它必须能够在中间遇到实践中的开发人员。并在“现实世界”中具有一定的适用性。既然我们...
【代码之髓】研究编程语言的核心点——结构化编程、函数、异常、作用域、类型、容器、并发、闭包和面向对象
2024-05-28 18:50

红雨随心翻作浪的博客本文基于人民邮电出版社发行的西尾泰和先生所著《代码之髓》有一定读书笔记性质，算是精简版改写。
4、深入了解Scala：特性、优势与根源
2025-07-23 18:47

julia4scientist的博客本文深入探讨了Scala编程语言的核心特性...文章还分析了Scala在代码复杂性管理、开发效率提升方面的优势，并介绍了其受其他编程语言影响的设计理念。最后，文章展望了Scala在大数据处理、分布式系统等领域的应用前景。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月23日

Scala的错误代码如下 有点奇怪

4条回答 默认 最新

问题事件

Scala的错误代码如下有点奇怪

4条回答默认最新