- 2
- 2
回答
自选主题,Spark SQL编程或Spark StreamingL编程或Structured Streaming 编程,任选其一或综合运行,设计与实现一个Spark应用
- spark
- 9
- 2025-12-03 10:21
- 3
回答
- 3
回答
- 3
回答
- 6
回答
- 3
回答
到这一步卡了很久,一直不动,jPS的各内容也有,怎么解决,网络连通性,spark也有,内存是4g,有两个从节点
- spark
- 12
- 2025-09-24 16:31
- 5
回答
- 5
回答
- 5
回答
- 5
2025-08-25 12:46:14,146 ERROR yarn.Client: Application diagnostics message: User class threw excepti
- 7
在编译spark322时,遇到了一个半天没解决的问题,编译环境maven363,java8,scala2.12.15 执行脚本 ./dev/make-distribution.sh --name dx
- 4
回答
- 4
回答
最近部署了spark的rss,使用celeborn,但奇怪的是,按照官方仓库中的方式打包和部署之后,spark任务能正常用celeborn提供的shuffle服务,但是celeborn服务的http端
- 4
回答
DolphinScheduler工作流定义页面报错,分页查询工作流定义列表错误,导致工作流定义页面一直加载,历史的工作流定义也消失了,有无解决办法
- 5
回答
- 5
回答
有人能做这个吗,可不可以指导一下,已经搭建好了相关的集群,hadoop,mysql,hive,spark集群,需要用到IDEAR这个软件,在这个软件里面打包,最后结果要按要求得出结果
- spark
- 5
- 2025-07-06 00:30
- 5
回答
spark实时处理并传输到mysql数据库时,显示流处理已启动,卡住很久不动然后报错是什么原因?我们的流程是爬取股票数据,3s刷新,然后传输到kafka里面,接着spark实时处理并存储到mysql
- 5
回答
最近在学pyspark 在使用map算子(如图一)的时候 一直报错꒰>﹏< ꒱ (错误类型如图二)感觉应该是hadoop的问题 但是相关环境变量也有配置 (如三四五) 有没有哪个人可
- 6
回答
有个父子层级的记录数据表,一共有八层,想要分层展示数据,有什么办法吗
- 6
回答
- 6
回答
import pyspark.sql as spark_sql from pyspark.sql import SparkSession spark = SparkSession.builder \
- 5
回答
这个系统中有配置好的spark,hadoop,Scala,sbt,IDE等环境
- 5
回答
在spark与mysql的在idea中交互时,报以上错误,我一直解决不了,我的代码附在图一,问题如图二
- 5
回答
4.0.0 spark.demo spark.demo 1.0-SNAPSHOT 2008 2.12.7 scala-tools.or
- spark
- 11
- 2025-06-02 12:29
- 5
回答
[ERROR] Failed to execute goal org.scala-tools:maven-scala-plugin:2.15.2:compile (default) on projec
- spark
- 9
- 2025-06-02 10:48
- 4
回答
连接spark的代码这里为什么单独测试没问题,放在views.py里就报了这个错
- 4
回答
python使用pyspark运行报错 报错如上图,已经安装了java8,之前连包都导不进去,现在能导pyspark,但就是报错很多,网上搜索还解决不了,请帮忙解决下,谢谢
- 3
回答
spark 接入ecshop 表头表头表头表头表头单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格
- spark
- 5
- 2025-04-28 14:40
- 4
回答
在虚拟机终端spark中进行sbt打包时出现如下问题,怎么解决呀😭