最新最热精华悬赏待回答 筛选
  • 2

想用Spark SQL的方式把Spark与Apache IoTDB连起来,官网截图如下,但还是没找到。

回答 红栈桑
采纳率100%
  • 2

    回答

自选主题,Spark SQL编程或Spark StreamingL编程或Structured Streaming 编程,任选其一或综合运行,设计与实现一个Spark应用

  • spark
  • 9
  • 2025-12-03 10:21
  • 3

    回答

在ubuntukylin配置过程中 java mysql hadoop hive spark均配置成功 且可正常运行 但启动hive时提示hadoop-evn.sh某行存在未闭合 但是多次配置甚至重新

  • 3

    回答

java mysql hive hadoop均配置成功 hive和hadoop提示配置错误但可正常启动 但运行spark失败 提示hadoop配置错误

  • 3

    回答

找不到数据集啊,数据量十万条以上,字段最少15个。主题随便了,求一个合适的数据集

  • 6

    回答

在数仓中,有两张表,t1和t2,字段相同,user_id可能重复,如果t2表中没有,但是t1表中有,说明这条数据是新增数据,例如t1中user_id=4这一条数据。如果t2表中有,但是t1表中没做,则

  • 3

    回答

到这一步卡了很久,一直不动,jPS的各内容也有,怎么解决,网络连通性,spark也有,内存是4g,有两个从节点

  • spark
  • 12
  • 2025-09-24 16:31
  • 5

    回答

没有配置Hadoop环境,检查了Python.exe路径正确。问了ai不好使。

  • 5

    回答

没有配置Hadoop环境,检查了Python.exe路径正确,问了ai不好使

  • 5

    回答

a表关联b表后,取b表字段,但是结果为空是什么原因?是因为关联字段有空值导致的吗?

  • 5

2025-08-25 12:46:14,146 ERROR yarn.Client: Application diagnostics message: User class threw excepti

  • spark
  • 11
  • 2025-08-25 12:50
尘世壹俗人
采纳率81.3%
  • 7

在编译spark322时,遇到了一个半天没解决的问题,编译环境maven363,java8,scala2.12.15 执行脚本 ./dev/make-distribution.sh --name dx

尘世壹俗人
采纳率81.3%
  • 4

    回答

具体问题是:按照HDFS数据分区规则,我认为最后的"/"应该在输出文件中不会出现占据两个字节的换行符 步骤一:创建文件(!!注意这里的第三行没有换行符!!) 步骤二:计算字节 字节数 = 7

  • 4

    回答

最近部署了spark的rss,使用celeborn,但奇怪的是,按照官方仓库中的方式打包和部署之后,spark任务能正常用celeborn提供的shuffle服务,但是celeborn服务的http端

  • 4

    回答

DolphinScheduler工作流定义页面报错,分页查询工作流定义列表错误,导致工作流定义页面一直加载,历史的工作流定义也消失了,有无解决办法

  • 5

    回答

hadoop EMR集群spark离线任务优化生产两张表dwd_dsp_bid_basic_log_d 表和dwd_dsp_cps_bid_log_d 表,各取7天分区数据,input_size在50

  • 5

    回答

有人能做这个吗,可不可以指导一下,已经搭建好了相关的集群,hadoop,mysql,hive,spark集群,需要用到IDEAR这个软件,在这个软件里面打包,最后结果要按要求得出结果

  • spark
  • 5
  • 2025-07-06 00:30
  • 5

    回答

spark实时处理并传输到mysql数据库时,显示流处理已启动,卡住很久不动然后报错是什么原因?我们的流程是爬取股票数据,3s刷新,然后传输到kafka里面,接着spark实时处理并存储到mysql

  • 5

    回答

最近在学pyspark 在使用map算子(如图一)的时候 一直报错꒰>﹏< ꒱ (错误类型如图二)感觉应该是hadoop的问题 但是相关环境变量也有配置 (如三四五) 有没有哪个人可

  • 6

    回答

有个父子层级的记录数据表,一共有八层,想要分层展示数据,有什么办法吗

  • 6

    回答

在安装配置hudi时输入命令“mvn clean package -DskipTests -Dspark2.4.4 -Dflink1.15 -Dscala-2.12 -Dhadoop.version

  • 6

    回答

import pyspark.sql as spark_sql from pyspark.sql import SparkSession spark = SparkSession.builder \

  • 5

    回答

这个系统中有配置好的spark,hadoop,Scala,sbt,IDE等环境

  • 5

    回答

在spark与mysql的在idea中交互时,报以上错误,我一直解决不了,我的代码附在图一,问题如图二

  • 5

    回答

4.0.0 spark.demo spark.demo 1.0-SNAPSHOT 2008 2.12.7 scala-tools.or

  • spark
  • 11
  • 2025-06-02 12:29
  • 5

    回答

[ERROR] Failed to execute goal org.scala-tools:maven-scala-plugin:2.15.2:compile (default) on projec

  • spark
  • 9
  • 2025-06-02 10:48
  • 4

    回答

连接spark的代码这里为什么单独测试没问题,放在views.py里就报了这个错

回答 swui
采纳率0%
  • 4

    回答

python使用pyspark运行报错 报错如上图,已经安装了java8,之前连包都导不进去,现在能导pyspark,但就是报错很多,网上搜索还解决不了,请帮忙解决下,谢谢

  • 3

    回答

spark 接入ecshop 表头表头表头表头表头单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格单元格

  • spark
  • 5
  • 2025-04-28 14:40
  • 4

    回答

在虚拟机终端spark中进行sbt打包时出现如下问题,怎么解决呀😭