cuda 内存传输速率的理论值和实际值

关于cuda的内存传输，通过cuda-z可以测量出Host和Device之间以及device to device的实际传输速率。
但是有没有这个device to device的理论传输速率应该怎么计算呢？

另外，global和GPU芯片之间的通行，其理论速率应该是可以用显存带宽来描述的，在GPU内部的shared的带宽明显要比显存带宽高得多。但是有没有要怎样才能测量global和shared之间的实际通信速率呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
蔡能教授，网站特聘专家 2020-09-07 09:06
关注
https://q.cnblogs.com/q/129088/

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

CUDA编程05 - GPU内存架构和数据局部性
2024-08-07 21:07

黑不溜秋的的博客到目前为止，我们已经学会了如何编写 CUDA 核函数，以及如何设置和分配大量线程来执行核函数。我们还了解了当前 GPU 硬件的计算架构，以及线程在硬件上调度执行过程。在本章中，我们将重点关注 GPU 的片上(on-chip)...
CUDA编程学习
2024-10-14 21:37

Star_.的博客其特别适合数据并行的计算密集型任务，如大型矩阵运算，与GPU对应的一个概念是CPU，但CPU的运算核心较少，但是其可以实现复杂的逻辑运算，因此其适合控制密集型任务，CPU更擅长数据缓存和流程控制。
CUDA 编程学习
2019-06-11 12:55

xiaoma_bk的博客 CUDA编程真的是入门容易精通难，具有计算机体系结构和C语言编程知识储备的同学上手CUDA编程应该难度不会很大。本文章将通过以下五个方面帮助大家比较全面地了解CUDA编程最重要的知识点，做到快速入门： GPU 架构...
CUDA-MODE 第四课: 计算和内存基础（基于PMPP 书的第4-5章）
2024-08-14 16:23

just_sort的博客我的课程笔记，欢迎关注：https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mode。
CUDA C/C++ 新手入门系列实践
2025-08-19 23:43

項羽Sama的博客 CUDA（Compute Unified Device Architecture），即统一计算架构，是由NVIDIA推出的一个由C语言风格扩展而成的并行计算平台和编程模型。它允许开发者使用NVIDIA的GPU进行通用计算，让开发者能够利用GPU的并行计算能力...
CUDA~Memory coalescing
2024-07-27 02:48

鱼儿小可爱的博客翻译整理自 Programming Massively Parallel Processors 4thmemory coalescing就是内存合并，通常用于高效地在全局内存、共享内存、寄存器之间传输数据。CUDA kernel 性能的一个最重要因素是访问...
基于PCIe的高性能FPGA-GPU-CPU异构编程架构.pdf
2021-07-13 10:12

6. 实验结果：验证了提出的编程框架在提高通信效率和数据传输速率方面的优势，这表明了该框架的实用性和对异构计算性能的显著提升。以上知识点对于理解和应用异构计算架构、编程和性能优化具有重要的参考价值。
43、cupSODA：基于CUDA的质量作用动力学模拟器
2025-07-23 03:42

e1f2g的博客本文介绍了cupSODA，一种基于CUDA的高效生物系统模拟工具，利用GPU加速质量作用动力学模型的确定性模拟。通过自动从生化反应推导ODE系统并使用LSODA算法进行数值积分，cupSODA能够在大规模并行模拟中显著提升计算...
GPU 集群和分布式计算
2024-11-07 03:43

程序员光剑的博客《GPU集群和分布式计算》关键词： GPU集群、分布式计算、CUDA、OpenACC、OpenMP、性能优化、故障处理、案例分析摘要：本文详细探讨了GPU集群和分布式计算
33、GPU架构与性能分析：从理论到实践
2025-09-19 11:52

a2b3c4d5e的博客本文深入探讨了GPU的架构与性能分析，涵盖...同时介绍了mixbench工具在评估不同工作负载下GPU适用性的应用，并分析了PCIe总线对CPU-GPU数据传输的影响，为高性能计算和应用场景下的GPU选型提供了理论依据与实践指导。
没有解决我的问题, 去提问

cuda 内存传输速率的理论值和实际值

1条回答 默认 最新

1条回答默认最新