nguoer121 2019-11-15 18:15 采纳率: 0%
浏览 267
已结题

并查集算法能用cuda加速吗?是否能真正的提速?

最近通过python的numba库进行实现了并查集的运算,但是只跑通了blockspergrid=1,threadsperblock=1的形式,速度比cpu还慢,我对cuda加速不太懂,想问问这块是否能真的加速

  • 写回答

1条回答 默认 最新

  • threenewbee 2019-11-16 00:08
    关注

    blockspergrid=1,threadsperblock=1相当于串行算法,根本没有利用GPU并行的优势。
    并查集用GPU实现难度比较高,因为其中大量的分支和不规则的数据访问,这些不是GPU的优势。
    可以考虑使用Xeon Phi一类的x86的加速卡。

    评论

报告相同问题?

悬赏问题

  • ¥35 平滑拟合曲线该如何生成
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 自己瞎改改,结果现在又运行不了了
  • ¥15 链式存储应该如何解决
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站