pyspark速度很慢，不知道是哪方面原因求解惑。

我2千万数字排序用pyspark，spark standalone模式跑的，用的算子sortbykey，服务器分别是32g，32核剩余15g，一个是8g剩余1g，4核。排序用时7s多，感觉用时太多，我不知道到底是那方面问题，求解惑。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
居庆说数 2021-07-09 17:08
关注
你这是从mongodb把数读取出来然后再排序的么？可以看下取数的耗时。然后再spark webui上看看stage的时间消耗在什么地方了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

pyspark速度很慢，不知道是哪方面原因求解惑。 spark
2021-07-09 17:05

回答 1 已采纳你这是从mongodb把数读取出来然后再排序的么？可以看下取数的耗时。然后再spark webui上看看stage的时间消耗在什么地方了
刚学c 这是什么原因呢求解惑 c语言
2021-07-17 13:30

回答 1 已采纳请看： https://so.csdn.net/so/search?q=c%E8%AF%AD%E8%A8%80ascii%E7%A0%81%E8%A1%A8&t=blog&u=&utm_term=c%
哪错了，求解惑，求解惑 c语言 mssql sql
2022-11-05 15:44

回答 2 已采纳你这写的是什么？select b.sid,b.sname,b.city,a.ordno from orders a left join supplier b on a.sid=b.sid;--表连接，
解惑大数据
2017-11-06 23:57

扫描完整版解惑大数据 解惑大数据 解惑大数据 解惑大数据
burp抓包失败，不知道是什么原因 webpack web安全网络协议
2023-01-12 15:28

回答 2 已采纳你这个是证书的问题，你在哪里下载的证书哦，你试下直接在火狐访问127.0.0.1:8080下载
求解惑：结果是21，程序怎么循环出来的，过程请详细点，不是很明白 c语言
2022-06-14 18:26

回答 2 已采纳 case0和case1后面没有break，所以i=0时执行case0，case1，case2，i=1时执行case1，case2，i=2时，执行case2
求解惑，这里有点看不明白 java
2022-11-16 20:07

回答 1 已采纳首先你自定义的配置类，它是被 @Configuration 标记的，spring boot 会自动装配的，重写的方法也就会在框架层面自动装配的时候被调用。而你定义的普通方法，只存在你自己的配置
大数据与人工智能解惑.pptx
2022-11-21 05:16

大数据与人工智能解惑.pptx
.net代码的意思不明白，求各位解惑 c++ c语言 java
2023-04-18 15:22

回答 2 已采纳 ①Entity.DessertEntity en 是一个实体对象busi 是一个类业务逻辑类GetDessertByDessertid 方法看起来是根据甜品id获取甜品对象strKey 给方法
感觉很迷茫，哪位同志能解惑？？学习方法网络安全
2022-09-29 15:03

回答 2 已采纳阶段一：基础部分 Windows部分基础命令、PowerShell的使用和简单脚本编写组件：注册表、组策略管理器、任务管理器、事件查看器另外，可以先学习一下怎么在Windows上搭建虚拟机，学会
求解惑，c语言遇到不懂的了 c语言
2022-04-17 20:28

回答 3 已采纳借花献佛，https://www.zhihu.com/tardis/sogou/qus/426562288
大数据与人工智能-解惑.pptx
2022-06-21 15:20

大数据与人工智能 ------ 解惑主讲：伍飞宇时间：2017年8月27日 大数据与人工智能-解惑全文共27页，当前为第1页。主题人工智能产品 02 机器学习 03 人工智能历史及发展 01 人工智能案例 04 面对人工智能 05 ...
为什么程序运行的结果是onetwo,求解惑 c语言
2022-03-24 11:38

回答 1 已采纳注意switch的特性，在满足case的条件后，是会依次执行后面的case代码块的，所以当满足case 1后，其后面所有语句块都会被执行。你可以对比在case 语句块中加break，continue等
纵观大数据 建模、分析及应用 pdf
2018-10-14 15:21

Big Date Overview数据，是比文字出现更早的工具，它帮助人类不断拓展对客观世界的认知，是社会生活中不可缺少的关键要素。身处大数据时代的我们，更加受到数据及其分析模型带来的影响，既有各种生活的便利，情景化...
大数据时代的思考.doc
2022-12-24 15:07

就是到今天，我们老百姓也很难相信堂堂国家统计局的报告数字，不知道能说明什么意思？在计算、存储和传送成本快速下降的云时代，这些不再为个人所能理解的数据将会变得如何，计算机系统会开启什么样的视角？人们...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月9日

悬赏问题

¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测

pyspark速度很慢，不知道是哪方面原因求解惑。

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新