qq_21949241 2023-02-21 13:51 采纳率: 50%
浏览 143

pytorch mac mps加速比cpu还慢?

目前在学习深度学习的相关内容,用的设备是mac m2芯片 ,下载的anaconda和pytorch都是mac版本的,有mps相关支持。但是对比下来发现torch的cpu模式比mps模式快大概3-5倍,这是为什么啊。有没有人遇到过相同的问题呢?

  • 写回答

1条回答 默认 最新

  • MarkHan_ 2023-02-21 14:00
    关注

    该回答引用GPTᴼᴾᴱᴺᴬᴵ

    可能是由于M2芯片的架构不同于常见的x86架构,所以在使用MPS加速的过程中,一些常见的优化技巧可能不再适用,反而会导致额外的计算和通信开销,从而导致性能下降。

    此外,由于MPS是一个相对较新的技术,可能还存在一些问题和限制,比如不支持某些操作或者某些网络结构,这也可能导致在使用MPS时性能没有提升甚至下降。

    针对这个问题,建议你可以尝试以下几个方案:

    1. 评估不同的网络结构和操作对MPS的支持程度,找到适合MPS的网络结构和操作,避免不必要的开销。
    2. 尝试升级你使用的PyTorch版本或者MPS版本,以获取更好的性能表现。
    3. 如果你的问题在GPU上表现得很好,可以考虑在GPU上运行模型,而不是在MPS上运行。
    4. 如果你的问题在CPU上表现得更好,那么你可以直接使用CPU模式。

    希望这些建议能够帮助你解决问题。

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 2月21日

悬赏问题

  • ¥15 校内二手商品转让网站
  • ¥20 高德地图聚合图层MarkerCluster聚合多个点,但是ClusterData只有其中部分数据,原因应该是有经纬度重合的地方点,现在我想让ClusterData显示所有点的信息,如何实现?
  • ¥100 求Web版SPC控制图程序包调式
  • ¥20 指导如何跑通以下两个Github代码
  • ¥15 大家知道这个后备文件怎么删吗,为啥这些文件我只看到一份,没有后备呀
  • ¥15 C++为什么这个代码没报错运行不出来啊
  • ¥15 一道ban了很多东西的pyjail题
  • ¥15 关于#r语言#的问题:如何将生成的四幅图排在一起,且对变量的赋值进行更改,让组合的图漂亮、美观@(相关搜索:森林图)
  • ¥15 C++识别堆叠物体异常
  • ¥15 微软硬件驱动认证账号申请