耶喽川水 2023-12-08 15:43 采纳率: 33.3%
浏览 14

请问如何用map将数据分成三个

img

img


def GenreYearSales(sc, spark, df, genre_list):
    result_df = df.select('genre', 'year_of_pub', 'num_of_sales').rdd \
        .filter(lambda v: v.genre in genre_list) \
        .map(lambda v: ((v.genre, int(v.year_of_pub)), int(v.num_of_sales))) \
        .reduceByKey(lambda x, y: x + y) \
        .sortByKey()
    
    result_df = spark.createDataFrame(result_df)
    print(type(result_df))
    print(result_df.head(3))
    result_df.limit(2).show()
    print(result_df.limit(2).show())


    result_df.write.jdbc(url=mysql_url, table="Genre_Year_Sales", mode="overwrite", properties=mysql_properties)
  • 写回答

2条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2023-12-08 18:42
    关注

    【相关推荐】




    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
    评论

报告相同问题?

问题事件

  • 修改了问题 12月8日
  • 创建了问题 12月8日

悬赏问题

  • ¥15 C# wpf 软年 卸载有残留 webview2
  • ¥15 求代写matlab解决柔性调度代码,价格私
  • ¥15 为什么安装Anaconda时报系统找不到指定文件?
  • ¥15 如何将这个项目的ssh-TCP,改成ssh3-UDP协议
  • ¥20 ic卡dump文件校检码解密
  • ¥15 关于:接收到的数据不是有效的JSON格式
  • ¥15 apdl语言如何增加受力分析
  • ¥15 算法对比:学校优化算法与蚁群算法对比
  • ¥15 机电一体化系统设计说明书
  • ¥20 sgy数据提取地震波速,有人能回答吗小馋