sjfx2021 2022-01-21 16:15 采纳率: 0%
浏览 19
已结题

pyspark性能问题咨询

当groupby().apply()中使用pandas_udf函数时,会将全部数据分组后,每一组数据拉到内存中来,请问这里的内存是指各个executor中的内存还是指driver的内存?如果是executor的内存,那么groupby的过程是否为shuffle过程?

  • 写回答

1条回答 默认 最新

  • 有问必答小助手 2022-01-24 14:58
    关注

    你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答


    本次提问扣除的有问必答次数,将会以问答VIP体验卡(1次有问必答机会、商城购买实体图书享受95折优惠)的形式为您补发到账户。


    因为有问必答VIP体验卡有效期仅有1天,您在需要使用的时候【私信】联系我,我会为您补发。

    评论

报告相同问题?

问题事件

  • 系统已结题 1月29日
  • 创建了问题 1月21日

悬赏问题

  • ¥30 vmware exsi重置后的密码
  • ¥15 易盾点选的cb参数怎么解啊
  • ¥15 MATLAB运行显示错误,如何解决?
  • ¥15 c++头文件不能识别CDialog
  • ¥15 Excel发现不可读取的内容
  • ¥15 UE5#if WITH_EDITOR导致打包的功能不可用
  • ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题
  • ¥20 yolov5自定义Prune报错,如何解决?
  • ¥15 电磁场的matlab仿真
  • ¥15 mars2d在vue3中的引入问题