上图是使用cuda-z测出来的1650的内存数据传输速率,小弟有几个问题想问问大家
1、在cuda-z上分了device to host和host to device,这应该说明device和host之间的传输速率和传输方向有关吧,那这是什么因素导致的呢?
2、device to device的速率应该指的就是global到global的速率吧?我知道显存(也就是global)到GPU芯片的传输速率和显存带宽有关,那global到global的速率是和什么有关呢,它的瓶颈是什么?
上图是使用cuda-z测出来的1650的内存数据传输速率,小弟有几个问题想问问大家
1、在cuda-z上分了device to host和host to device,这应该说明device和host之间的传输速率和传输方向有关吧,那这是什么因素导致的呢?
2、device to device的速率应该指的就是global到global的速率吧?我知道显存(也就是global)到GPU芯片的传输速率和显存带宽有关,那global到global的速率是和什么有关呢,它的瓶颈是什么?
device to host和host to device是内存到显存,两者差不多。
device to device是gpu和显存,注意这个单位是 G,1G=1000M,这个很快了。1650理论带宽 128G(8GHz x128bit/8),你达到了 79G,也差不多了。