Flechaz0147 2025-03-03 07:31 采纳率: 33.3%

2080ti➕telsa 双显卡跑 deepseek 无法调用显存

系统：银河麒麟 V10 Sp1， 2080Ti 显卡（显存 22G) 加 telsa M10 显卡(显存 32G)，双卡运行 deepseek70b（q4 量化），无法调用显存，全部是在内存跑模型，请问是什么库没安装吗？如何解决这个问题？

写回答
好问题 1 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-03-03 07:31
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

问题解答

你遇到的问题是：使用 2080Ti 和 Tesla M10 双显卡运行 DeepSeek70b 量化模型，无法调用显存，导致模型全部在内存中运行。

可能的原因：

显卡驱动问题：检查显卡驱动是否正确安装和更新。
CUDA 版本问题：检查 CUDA 版本是否与 DeepSeek70b 量化模型兼容。 3.显存分配问题：检查显卡显存是否正确分配给 DeepSeek70b 量化模型。

解决方案：

检查显卡驱动版本，确保是最新版本。
检查 CUDA 版本，确保与 DeepSeek70b 量化模型兼容。
使用 nvidia-smi 命令查看显卡显存使用情况，确保显卡显存足够分配给 DeepSeek70b 量化模型。
使用 CUDA_VISIBLE_DEVICES 环境变量指定显卡设备，例如 CUDA_VISIBLE_DEVICES=0,1 指定使用 2080Ti 和 Tesla M10 显卡。
检查 DeepSeek70b 量化模型的配置文件，确保没有显存分配错误。

如果以上解决方案不起作用，可以提供更多的日志信息和配置文件，以便更好地 debug 问题。
解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
码农阿豪@新空间 Java领域优质创作者 2025-03-03 07:41
关注
让阿豪来帮你解答，本回答参考chatgpt3.5编写提供，如果还有疑问可以评论或留言
问题分析：根据描述，系统上安装了银河麒麟 V10 Sp1操作系统，搭配了2080Ti和Tesla M10显卡，使用双卡运行deepseek70b（q4量化），但无法调用显存，导致模型全部在内存中运行。可能是缺少相关库或者驱动导致的问题。解决方法：
确认驱动安装：首先确保2080Ti和Tesla M10显卡的驱动程序已经正确安装。可以通过官方网站下载最新的显卡驱动，并进行安装。
安装CUDA工具包：CUDA是用于并行计算的GPU加速计算库，可以提升深度学习模型的运行速度。检查系统中是否安装了适用于2080Ti和Tesla M10显卡的CUDA工具包，并确保版本兼容。
安装深度学习库：检查系统中是否安装了适用于2080Ti和Tesla M10显卡的深度学习库，如TensorFlow、PyTorch等。确保版本和显卡兼容，并正确配置。
检查环境变量：确认系统中的环境变量正确设置，包括CUDA路径、深度学习库路径等。确保程序能够正确调用显卡资源。
更新操作系统：如果以上方法无法解决问题，尝试更新操作系统到最新版本，以确保系统和驱动的兼容性。案例：以下是可能的解决方法中的示例代码（以安装CUDA为例）：

# 下载并安装CUDA Toolkit wget https://developer.download.nvidia.com/compute/cuda/11.2.1/local_installers/cuda_11.2.1_461.09_linux.run sudo sh cuda_11.2.1_461.09_linux.run # 添加CUDA路径到环境变量 echo 'export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}' >> ~/.bashrc source ~/.bashrc # 检查CUDA安装版本 nvcc --version

通过以上步骤，应该可以解决无法调用显存的问题，使双卡运行深度学习模型能够正确使用显卡资源。
解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

软件技术NINI 2025-03-03 08:56

关注


nvidia-smisudo dpkg -i <驱动程序包名>.runsudo ln -sf /usr/local/cudnn-11.7-linux-x64-v8.6/cuda/include/cudnn.h /usr/local/cuda-11.7/include/cudnn.h
sudo ln -sf /usr/local/cudnn-11.7-linux-x64-v8.6/cuda/lib64/libcudnn.so.8.6.0 /usr/local/cuda-11.7/lib64/libcudnn.so.8
sudo ln -sf /usr/local/cudnn-11.7-linux-x64-v8.6/cuda/lib64/libcudnn.so.8.6.0 /usr/local/cuda-11.7/lib64/libcudnn.soimport torch
print(torch.cuda.is_available())
print(torch.cuda.device_count())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)
inputs = inputs.to(device)

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
宝码香车 JavaScript领域优质创作者 2025-03-13 12:41
关注
让【宝码香车】来帮你解答，本回答参考DeepSeek编写，并整理提供，如果还有疑问可以点击头像关注私信或评论。

如果答案让您满意，请采纳、关注，非常感谢！

在双显卡环境下运行深度学习模型时，无法调用显存的问题可能由多种原因引起。以下是一些可能的原因和解决方案：

1. CUDA 和 cuDNN 安装问题

确保 CUDA 和 cuDNN 已正确安装，并且版本与你的深度学习框架（如 PyTorch 或 TensorFlow）兼容。
你可以通过以下命令检查 CUDA 是否安装成功：
nvcc --version

如果 CUDA 未正确安装，请参考 NVIDIA 官方文档进行安装。

2. GPU 驱动问题

确保你的 GPU 驱动是最新的，并且与 CUDA 版本兼容。
你可以通过以下命令检查 GPU 驱动版本：
nvidia-smi

如果驱动版本过旧或不兼容，请更新驱动。

3. 深度学习框架的 GPU 支持

确保你使用的深度学习框架支持 GPU 加速，并且已正确配置。
对于 PyTorch，你可以通过以下代码检查 GPU 是否可用：
import torch print(torch.cuda.is_available())

如果返回 False，则说明 PyTorch 未正确配置 GPU 支持。

4. 多 GPU 配置问题

如果你使用的是多 GPU 环境，确保你的代码正确配置了多 GPU 支持。
对于 PyTorch，你可以通过以下代码指定使用的 GPU：
import torch device = torch.device("cuda:0") # 使用第一块 GPU model.to(device)

如果你希望使用多块 GPU，可以使用 torch.nn.DataParallel 或 torch.nn.parallel.DistributedDataParallel。

5. 显存分配问题

有时显存可能被其他进程占用，导致无法分配显存。
你可以通过 nvidia-smi 查看显存使用情况，并终止不必要的进程。

6. 环境变量设置

确保环境变量 CUDA_VISIBLE_DEVICES 正确设置，以指定使用的 GPU。
例如，如果你只想使用第一块 GPU，可以设置：
export CUDA_VISIBLE_DEVICES=0

7. 检查量化模型的支持

确保你使用的量化模型（如 q4 量化）支持 GPU 加速。
有些量化模型可能仅支持 CPU 运行，或者需要特定的库支持。

8. 检查系统日志

查看系统日志（如 /var/log/syslog 或 dmesg）以获取更多关于 GPU 错误的信息。

9. 尝试单 GPU 运行

尝试仅使用一块 GPU 运行模型，以排除多 GPU 配置问题。
例如，禁用 Tesla M10，仅使用 2080Ti 运行模型。

10. 更新深度学习框架

确保你使用的深度学习框架是最新版本，或者至少与 CUDA 和 cuDNN 版本兼容。

11. 检查库依赖

确保所有必要的库（如 libcudart.so、libcudnn.so 等）已正确安装，并且在 LD_LIBRARY_PATH 中。

12. 重新安装深度学习框架

如果以上方法都无效，尝试重新安装深度学习框架，并确保在安装过程中正确配置 GPU 支持。

示例代码

以下是一个简单的 PyTorch 示例代码，用于检查 GPU 是否可用并运行模型：

import torch # 检查 GPU 是否可用 if torch.cuda.is_available(): device = torch.device("cuda:0") # 使用第一块 GPU print("GPU 可用，使用 GPU 运行模型") else: device = torch.device("cpu") print("GPU 不可用，使用 CPU 运行模型") # 假设你有一个模型 model = YourModel() # 将模型移动到 GPU model.to(device) # 假设你有一些输入数据 inputs = torch.randn(1, 3, 224, 224).to(device) # 运行模型 outputs = model(inputs) print(outputs)

总结

如果你按照上述步骤检查和配置后仍然无法调用显存，建议进一步检查系统日志和深度学习框架的文档，或者考虑在社区或论坛中寻求帮助。
展开全部
解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

编辑

预览

报告相同问题？

关注问题

跑深度模型的显卡_2020年人工智能深度学习 GPU 解决方案推荐
2020-10-19 15:38

weixin_39946327的博客作为近年来最火热的行业——人工智能，在烧钱方面同样不遑多让。众所周知，人工智能的训练和推理都需要海量的高性能计算，大型企业或者研究机构可以一掷千金部署 HPC；中小型企业或个人研究者通常选择购置性能强劲的...
跑深度模型的显卡_人工智能研究者应该选择哪款显卡？
2020-11-20 16:52

weixin_39742727的博客 2020 年，什么样的 GPU 才是人工智能训练的最佳选择？我在自己的网站中专门介绍过GPU的一些硬件基础知识：https://lulaoshi.info/gpu/gpu-basic/gpu.html。英伟达为优化深度学习的矩阵运算，在较新的微架构中，专门...
DeepSeek-进阶版部署(Linux+GPU)
2025-03-07 14:01

dessler的博客前面几个小节讲解的Win和Linux部署...如果要在生产环境使用还是需要用到GPU来实现，下面我将以有一台带上GPU显卡的Linux机器来部署DeepSeek。这里还只是先体验单机单卡，后期会更新多机多卡使用更高模型的文章。
DeepSeek-单机多卡折腾记
2025-03-13 13:06

dessler的博客 1.DeepSeek部署-Win版本 2.DeepSeek部署-Linux版本 3.DeepSeek部署-一键部署(Linux版本) 4.DeepSeek部署-进阶版本(Linux+GPU) 5.DeepSeek部署-基于vLLM部署 6.DeepSeek部署-部署Open WebUI 7.DeepSeek部署-容器化...
英伟达显卡T4、3080Ti、A4500使用体验和比较
2024-10-09 03:31

程序员甜梨的博客英伟达显卡T4、3080Ti、A4500使用体验和比较
Telsa显卡比较
2019-09-30 01:31

dc90000的博客 1. T4 2. P4/ P40 3. P100 4. V100 转载于:https://www.cnblogs.com/geoffreyone/p/10600516.html
低成本攒机跑深度学习AI
2023-04-12 16:11

哲萌的博客前言一、入手GPU 二、主板建议 1.AMD系列 2.Intel系列 3.X99系列三、电源和机箱建议四、安装系统以及cuda 五、windows端安装与操作总结前言随着人工智能的不断发展，深度学习这门技术也越来越重要，AI绘图、...
tesla p100显卡显示资源不足，api调用失败
2024-07-10 13:55

bug菌¹的博客 Windows系统：Windows10 22H2 机器：华为2288hv3 内存：32G 显卡：nvidia tesla p100 16G pcie 显卡驱动：528.89 + cuda11.8 显卡电源：650w 在官网和某动精灵打的驱动，每次开机都会显示资源不足，api调用失败...
Telsa FSD介绍
2020-05-23 09:45

Telsa FSD Autopilot 3.0硬件介绍
优化设置TESLA T4/P40等显卡在部分主板无法识别情况
2023-06-30 09:50

米可工控的博客将above 4GB MMIO BIOS更改为enable即可解决资源冲突问题。
Tesla T4显卡安装及显卡自带显示屏蔽设置
2023-04-04 01:01

米可工控的博客 2.在官网 https://www.nvidia.com/Download/index.aspx 中下载 T4 显卡驱动.run 文件，本。/etc/modprobe.d/blacklist-nvidia-nouveau.conf 如和下面一样，表示成功。在终端输入：sh NVIDIA-Linux-x86_64-510.47.03....
第四十四篇-Tesla P40+Janus-Pro-7B部署与测试
2025-02-14 14:27

木卫二号Coding的博客速度挺快，简单的快5秒，复杂的就长了20秒+也可以使用hf-mirror在线下载。速度挺慢的，30秒+，有时更长。效果不好评判，只有自己试用。deepseek
Cuda+Pytorch+Tesla P40显卡驱动安装Ubuntu22.04确定是否是硬件问题
2025-01-14 08:31

2301_79814786的博客 1）通过终端命令确定显卡是否插好如果输出有独显信息则证明显卡已插好2）确定显卡电源是否有连接好。
Telsa显卡时间轴
2018-07-18 14:16

weixin_34202952的博客 Nvidia Tesla 级别的显卡是计算卡为主，主要用在服务器和工作站上的高性能计算或者深度学习场景。目前明星级的应用就是在summit集群上的表现。 2007 Tesla Arch 2011 Fermi Arch 2012 Kepler Arch 2015 ...
【动手撸深度学习】AI学子借问显卡何处有，牧童遥指我这里！（全面亲测）
2021-02-21 09:04

cv君的博客话不多说，开始正题，我通过视频和这篇文章的形式归纳总结了大量能让没钱的AI学生白嫖优质算力的平台，尤其是包括使用方法，改善方法，编码方法，以及实践！下面给了一个优秀的例子，能让你通过一篇教程，学会...
基于6U VPX MXM 规范单Telsa P6 GPU 卡
2024-06-28 08:22

FPGAADDA的博客优先匹配凌华公司主板，MIC-6314 OpenVPX CPU Blade with 4th/ 5th Generation Intel Core™ Processor。板卡基于6U VPX 规范和 MXM specification ...特种设备上的深度学习，人工智能计算。板卡支持Telsa P6，M6子卡。
用LM Studio在本地离线玩转DeepSeek大语言模型，新手也能轻松上手！
2025-02-19 01:58

cc学长的博客：如果找不到模型，点**“Search on Hugging Face”**跳转到官方库，输入完整模型名称（如deepseek-ai/deepseek-llm-7b-chat）即可精准定位。这时候可以用LM Studio的**“微调”功能**导入最新数据，或者直接换一个...
Telsa GPU架构分析1
2022-08-08 11:39

在内存系统方面，Tesla K20拥有高达5GB的GDDR5显存，提供高速的数据传输能力，带宽达到336GB/s。这使得GPU能够快速访问和处理大量数据，对于需要大量数据交换的科学计算应用至关重要。同时，Tesla K20的高带宽内存...
Tesla 特斯拉系列显卡
2024-12-27 02:39

hxsln11的博客 1.Tesla P4：这是NVIDIA Tesla系列中的入门级显卡，拥有2560个CUDA核心和8GB的GDDR5显存，显存带宽为192GB/s，最大功耗仅50W/75W，适合初探深度学习领域或需要部署边缘计算的用户，经济实惠，能够应对一些轻量级的...
基于tensorflow-gpu + E5 CPU + GTX1660 SUPER + TESLA-P40 显卡安装CUDA(11.8.0)
2023-02-26 01:50

hanjupiter的博客基于tensorflow-gpu + E5 CPU + GTX1660 SUPER + TESLA -P40显卡安装CUDA(11.8.0)
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月3日

码龄粉丝数原力等级 --

2080ti➕telsa 双显卡跑 deepseek 无法调用显存

4条回答默认最新

码龄粉丝数原力等级 --

问题解答

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

码龄粉丝数原力等级 --

1. CUDA 和 cuDNN 安装问题

2. GPU 驱动问题

3. 深度学习框架的 GPU 支持

4. 多 GPU 配置问题

5. 显存分配问题

6. 环境变量设置

7. 检查量化模型的支持

8. 检查系统日志

9. 尝试单 GPU 运行

10. 更新深度学习框架

11. 检查库依赖

12. 重新安装深度学习框架

示例代码

总结

问题事件

码龄粉丝数原力等级 --

2080ti➕telsa 双显卡跑 deepseek 无法调用显存

4条回答 默认 最新

问题解答

1. CUDA 和 cuDNN 安装问题

2. GPU 驱动问题

3. 深度学习框架的 GPU 支持

4. 多 GPU 配置问题

5. 显存分配问题

6. 环境变量设置

7. 检查量化模型的支持

8. 检查系统日志

9. 尝试单 GPU 运行

10. 更新深度学习框架

11. 检查库依赖

12. 重新安装深度学习框架

示例代码

总结

问题事件

4条回答默认最新