最新最热精华悬赏待回答 筛选
  • 1

Pointer aliasing ,简单来说,下面两段代码并不是等价的: void f1(int* x, int* y) { *x += *y; *x += *y; } void f2(

  • 1

    回答

据说最新版的lumerical2024R1版本可以利用GPU加速计算,这是真的嘛?显卡加速需要自己配置嘛,求教程。

  • 2

    回答

以下是我安装的cuda\pytorch的版本,应该是没什么问题的吧,训练的时候也是显示成功调用了,但是不知道为什么就是跑不起来,而且都不是慢,他就是一直不动,找了好久没找到解决办法,希望有datui帮

  • 1

    回答

您好 看了您的文章https://blog.csdn.net/xindoo/article/details/121186052我想问一下您 您后面所说的使用gpu加速是怎么实现的。

  • 2

    回答

你好!我今天正在看你复现UV-Net那篇文章,在我复现的时候无法调用GPU训练的很慢。你在环境配置中写道“上面那种安装有很多没有指定其版本故若要进行GPU版本的pytorch运算可能不太行。若你只是想

  • 27

    回答

GPU占用进程无法被kill,显示no such process

维昵娟
采纳率0%
  • 2

    回答

有什么办法可以让python直接调用.cu文件,也就是cuda程序,类似于matlab利用mexcuda编译cu文件,直接调用这样。

  • 3

    回答

3090显卡,ubuntu20.01系统,在系统默认的显卡驱动(开源),gpu电风扇不响。一旦在附加驱动里面安装专有的显卡驱动(535,470等专有显卡),电风扇就响起来了。电风扇的target sp

  • 4

    回答

有没有人能帮我一下每次我打开街头霸王6(steam游戏)的时候,他过一段时间就会显示0×00007FFE8C57436D指令引用了0×0000000000000000内存,该内存不能为read以及致命

  • 2

    回答

请问下,我想部署一个个人的模型,我自己已经训练好了,基于llama3+peft,我想找一个在线的平台部署我的私有模型,提供REST API的服务,请问有这样的平台吗,多谢!

  • 5

    回答

公司现在准备针对数字人的使用对象为ToC(不是短视频和直播),每个人都可以在系统中生成多个数字人数字人的主要功能包括:1、根据形象、声音生成数字人2、真人可以与数字人进行话语沟通3、可以投喂数据,使数

  • 8

1.这个转换和逆向的意思是类似电源接口不匹配我找个转接头,拿来即用么。2.CUDA不是开源的对吧?那怎么拿到API的呢?是因为一些API有国际标准么。3.合法的方式是严格按照CUDA接口规范,模拟CU

猪却膘肥
采纳率85.7%
  • 15

1.华为atlas9000是训练卡,是NpU路线对么?(基于深度神经网络算法,主打张量计算核心,更擅长计算机视觉?)2.目前基于金融侧市场了解,华为atlas9000是可以用于大模型训练的,大模型训练

猪却膘肥
采纳率85.7%
  • 2

之前都用的好好的,突然就不行了ccsettings说我计算机无法完成AI任务

邓邓邓雨欣
采纳率100%
  • 2

    回答

4070ti super和3090ti跑深度学习哪个更猛一点呀 有必要咬咬牙上4080super吗

  • 10

麻烦提供一个利用tensor core的wmma api实现向量与向量的乘法,或者向量与矩阵的乘法案例。

西瓜奶蛋
采纳率16.7%
  • 19

    回答

麻烦提供一份利用tensor core的wmma api执行矩阵A * 矩阵B的乘法运算,使用共享内存作为中间数据读写 我自己写的不知道怎么实现warp_id对数据的调度和线程之间的计算。如果可以的话

西瓜奶蛋
采纳率16.7%
  • 12

使用tesla m40跑AI报错 CUDA kernel errors环境:win10 专业版本人不懂英文,玩不转Linux硬件:英特尔 Xeon(至强) E5-2673 v3 @ 2.40GHz主板

不肯认输
采纳率100%
  • 17

    回答

我要用pybind编译C++的混合编程实现cuda并行计算,python端采用了pytorch的变量来声明half类型,在cuda c端用at::Tensor的pytorch拓展接口接收变量并提取变量

西瓜奶蛋
采纳率16.7%
  • 1

    回答

MATLAB跑YOLO报错,显示cuDNN failed to return a vaild plan for cudnnBackendExecute for convolution。 电脑环境如下

  • 12

    回答

最近在学习GPU编程,看到文章中有用tensor core WMMA实现矩阵乘法的例子,但是都是稠密矩阵 乘以 稠密矩阵的案例。查了很多例子,好像都是矩阵乘法的API和介绍,那么假如想要实现向量乘法该

西瓜奶蛋
采纳率16.7%
  • 14

    回答

我的电脑不知道设置了啥,端口转发器解析失败,用公司电脑没问题

2301_81641053
采纳率0%
  • 1

    回答

用服务器A6000显卡训练bevfusion,报了以下错误,请问大家该怎么修改呢? RuntimeError: CUDA out of memory. Tried to allocate 20.00

  • 1

各位用的什么配置能流畅快速运行一些图像处理,音频提取软件啊我笔记本3060,想用topaz video enhance ai把5分钟视频分辨率拉高到2k,但是显卡拉满了也要用两个班小时。用UVR5提取

Nekojjk
采纳率100%
  • 1

    回答

PS显示图形处理器不兼容 OpenGL 显示不可用 我尝试过更新但是没什么效果

LGZ_kanzheni
采纳率0%
  • 1

请问大家怎么根据GPU的TOPS和模型的FLOPs判断模型能否在GPU上跑?比如20W下的Jetson Xavier NX是21TOPS,YOLOV5s是16.5FLOPs,YOLOv8s是28.7F

yoyo-han
采纳率50%
  • 7

    回答

使用gpu编程时,计算两张图的不同的代码如下,debug了两天了,因为是初学者,怎么也想不出是哪里的问题,导致图像一部分会缺失,不管裁剪多小的图,都会存在y方向的部分缺失,想知道这是什么问题?(ps

m0_56316059
采纳率0%
  • 8

    回答

cuda+vs2019 初始建立一个cuda runtime后,进行重新生成,便出现了如下所示的错误,试了网上很多的解决方式,但是还没有解决如下所示,总是报错,求同学指点,谢谢

fumingxiaoshen
采纳率50%
  • 2

    回答

请问Nsight Compute目前支持4090的程序运行吗?我是用python调用pybind11编译的cuda核函数,其中用torch.extension的load功能编译cpp和cu文件。在py

  • 1

当前局势下,构建绿色算力面对那些挑战?如何对绿色算力进行统一纳管?如何对多元任务负载进行编排和调度?

青鱼292
采纳率89.3%