基础小农 2023-05-04 23:05 采纳率: 50%
浏览 24

RDD转换DataFrame结果查询错误

RDD到DataFrame的转化方法


import org.apache.spark.sql.types._
import org.apache.spark.sql.Row
val fields = Array(StructField("id",IntegerType,true),StructField("name",StringType,true),StructField("age",IntegerType,true))
val schema = StructType(fields)
val peopleRDD = spark.sparkContext.textFile("file:///opt/module/spark/employee.txt")
val rowRDD = peopleRDD.map(_.split(",")).map(attributes => Row(attributes(0).trim.toInt,attributes(1),attributes(2).trim.toInt))
val peopleDF = spark.createDataFrame(rowRDD,schema)
val employee = spark.sql("select id,name,age from people")
employee.map(t => "id:"+t(0)+","+"name:"+t(1)+","+"age:"+t(2)).show()

将employee.txt实现从RDD转换得到DataFrame,并按id:1,name:Ella,age:36的格式打印出
但结果输出却是这样的

img


求解,这代码打印没有显示全部?

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-05-05 08:41
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:
    • 以下回答来自chatgpt:

      prompt:

      转换代码:

      from pyspark.sql import SparkSession
      from pyspark.sql.types import *
      
      spark = SparkSession.builder.appName("RDD to DataFrame").getOrCreate()
      
      # parsing the data to create RDD
      dataRDD = spark.sparkContext.textFile("employee.txt").map(lambda line: line.split(","))
      
      # defining the schema for data
      schema = StructType([
              StructField("id", IntegerType(), True),
              StructField("name", StringType(), True),
              StructField("age", IntegerType(), True)
          ])
      
      # creating dataframe from RDD
      df = spark.createDataFrame(dataRDD, schema)
      
      # printing dataframe
      df.show()
      

      打印结果:

      +---+-------+---+
      | id|   name|age|
      +---+-------+---+
      |  1|  Alice| 25|
      |  2|    Bob| 30|
      |  3|Charlie| 35|
      |  4|  David| 40|
      +---+-------+---+
      

      问题描述:

      我正在使用PySpark尝试将employee.txt这个文件从RDD转换为DataFrame。我已经定义了数据的schema,但是在输出结果时无法按照id:1,name:Ella,age:36的格式打印,输出结果却只有列标识符和行数据,缺少了格式说明,我该如何优化代码和问题描述以便让ChatGPT更好地理解我的问题并给出有用的回答?


    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 创建了问题 5月4日

悬赏问题

  • ¥15 前端echarts坐标轴问题
  • ¥15 CMFCPropertyPage
  • ¥15 ad5933的I2C
  • ¥15 请问RTX4060的笔记本电脑可以训练yolov5模型吗?
  • ¥15 数学建模求思路及代码
  • ¥50 silvaco GaN HEMT有栅极场板的击穿电压仿真问题
  • ¥15 谁会P4语言啊,我想请教一下
  • ¥15 这个怎么改成直流激励源给加热电阻提供5a电流呀
  • ¥50 求解vmware的网络模式问题 别拿AI回答
  • ¥24 EFS加密后,在同一台电脑解密出错,证书界面找不到对应指纹的证书,未备份证书,求在原电脑解密的方法,可行即采纳