- 3
回答
尚硅谷电商6.0安装spark配置 Hive on Spark使用可见的纯净版的,安装教程配置启动hive,创建表执行insert into table student values(1,'abc')
- 3
在JDK17环境下pyspark代码运行报错。但是下面代码在配置环境下这段代码运行有警告错误,但是仍然能够正常运行。为什么图二报错。pyspark的版本目前是4.1.1,换成低版本和高版本的都不行,都
- 2
什么原因,应该如何解决。正常使用,电脑上本来也有jdk,是因为没有配置环境变量吗。
- 2
回答
pycharm开发spark程序豆包给的方案:在 PyCharm 中配置运行参数(推荐,符合课件要求) 1. 点击右上角运行配置下拉框 → 选择「编辑配置」2. 在「参数」一栏中填入输入输出路径(
- 3
回答
我想要做学生学习行为分析系统 但是没有真实数据 不知道该怎么获取
- 1
回答
在使用apache kyuubi spark lineage插件集成Atlas过程中,出现报错,我使用版本是spark 3.5.3+Atlas 2.4.0报错内容如下: ```shell 26/02
- 2
回答
- 2
想用Spark SQL的方式把Spark与Apache IoTDB连起来,官网截图如下,但还是没找到。
- 2
回答
自选主题,Spark SQL编程或Spark StreamingL编程或Structured Streaming 编程,任选其一或综合运行,设计与实现一个Spark应用
- spark
- 9
- 2025-12-03 10:21
- 3
回答
- 3
回答
- 3
回答
- 6
回答
- 3
回答
到这一步卡了很久,一直不动,jPS的各内容也有,怎么解决,网络连通性,spark也有,内存是4g,有两个从节点
- spark
- 12
- 2025-09-24 16:31
- 5
回答
- 5
回答
- 5
回答
- 5
2025-08-25 12:46:14,146 ERROR yarn.Client: Application diagnostics message: User class threw excepti
- 7
在编译spark322时,遇到了一个半天没解决的问题,编译环境maven363,java8,scala2.12.15 执行脚本 ./dev/make-distribution.sh --name dx
- 4
回答
- 5
最近部署了spark的rss,使用celeborn,但奇怪的是,按照官方仓库中的方式打包和部署之后,spark任务能正常用celeborn提供的shuffle服务,但是celeborn服务的http端
- 4
回答
DolphinScheduler工作流定义页面报错,分页查询工作流定义列表错误,导致工作流定义页面一直加载,历史的工作流定义也消失了,有无解决办法
- 5
回答
- 5
回答
有人能做这个吗,可不可以指导一下,已经搭建好了相关的集群,hadoop,mysql,hive,spark集群,需要用到IDEAR这个软件,在这个软件里面打包,最后结果要按要求得出结果
- spark
- 5
- 2025-07-06 00:30
- 5
回答
spark实时处理并传输到mysql数据库时,显示流处理已启动,卡住很久不动然后报错是什么原因?我们的流程是爬取股票数据,3s刷新,然后传输到kafka里面,接着spark实时处理并存储到mysql
- 5
回答
最近在学pyspark 在使用map算子(如图一)的时候 一直报错꒰>﹏< ꒱ (错误类型如图二)感觉应该是hadoop的问题 但是相关环境变量也有配置 (如三四五) 有没有哪个人可
- 6
回答
有个父子层级的记录数据表,一共有八层,想要分层展示数据,有什么办法吗
- 6
回答
- 6
回答
import pyspark.sql as spark_sql from pyspark.sql import SparkSession spark = SparkSession.builder \
- 5
回答
这个系统中有配置好的spark,hadoop,Scala,sbt,IDE等环境