hitomo 2025-08-28 21:40 采纳率: 98.8%

已采纳

如何正确安装Ollama并配置CUDA支持？

**问题：如何在Ubuntu系统上正确安装Ollama并配置CUDA支持？** 在Ubuntu系统上安装Ollama并启用CUDA支持时，常见的问题是无法正确识别NVIDIA GPU，导致模型无法运行在GPU加速模式。用户需首先安装合适的NVIDIA驱动和CUDA Toolkit，再通过官方指南编译Ollama源码或下载支持CUDA的二进制版本。此外，还需设置环境变量以确保Ollama能够调用CUDA。若配置不当，会出现“no CUDA-capable device is detected”等错误。请详细说明Ubuntu系统下Ollama的安装步骤、CUDA依赖安装方法及验证是否成功启用GPU加速的手段。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

风扇爱好者 2025-08-28 21:40

关注

如何在Ubuntu系统上正确安装Ollama并配置CUDA支持

1. 系统准备与环境确认

在开始安装Ollama和CUDA支持前，需确保系统满足以下条件：

Ubuntu 20.04或更高版本（推荐22.04 LTS）
NVIDIA GPU支持CUDA（可通过lspci | grep -i nvidia查看）
具备sudo权限的用户账户

2. 安装NVIDIA驱动

安装合适的NVIDIA驱动是启用CUDA支持的前提。可通过以下步骤安装：

添加NVIDIA驱动仓库：

sudo add-apt-repository ppa:graphics-drivers/ppa

更新软件包列表：
```
sudo apt update
```
查看推荐驱动版本：
```
ubuntu-drivers devices
```
安装推荐版本（例如nvidia-driver-535）：
```
sudo apt install nvidia-driver-535
```
重启系统后验证驱动是否生效：
```
nvidia-smi
```

3. 安装CUDA Toolkit

安装与驱动版本兼容的CUDA Toolkit，以支持GPU加速：

访问NVIDIA官网，根据驱动版本选择对应的CUDA Toolkit版本。
使用apt安装（以CUDA 12.1为例）：

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin

sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb

sudo dpkg -i cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb

sudo apt update

sudo apt install cuda

设置环境变量（添加至~/.bashrc）：

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

验证CUDA安装：
```
nvcc --version
```

4. 安装Ollama并启用CUDA支持

Ollama默认版本不包含CUDA支持，需从源码编译或下载支持CUDA的二进制文件。

克隆Ollama官方仓库：

git clone https://github.com/jmorganca/ollama.git

进入目录并切换到支持CUDA的分支（如cuda分支）：
```
cd ollama
```
```
git checkout cuda
```
安装依赖项：

sudo apt install build-essential libgl1 libgles2 libvulkan1

构建Ollama（确保CUDA环境已正确配置）：
```
make
```
将生成的可执行文件复制到系统路径：
```
sudo cp bin/ollama /usr/local/bin/
```

5. 验证Ollama是否启用CUDA支持

完成安装后，需验证Ollama是否成功启用GPU加速：

启动Ollama服务：
```
ollama serve
```
在另一个终端窗口运行模型（如llama2）：
```
ollama run llama2
```
查看GPU使用情况：
```
nvidia-smi
```
若看到GPU利用率上升，说明CUDA已成功启用。

6. 常见问题与解决方法

问题描述	可能原因	解决方法
no CUDA-capable device is detected	NVIDIA驱动未正确安装或CUDA环境未配置	重新安装NVIDIA驱动并检查环境变量
nvcc not found	CUDA Toolkit未正确安装	确认CUDA安装路径并设置环境变量
无法编译Ollama源码	依赖库缺失或版本不兼容	检查依赖项并尝试使用官方二进制文件
GPU利用率未上升	模型未启用GPU加速或CUDA支持未生效	确认Ollama是否为支持CUDA的版本

7. 可选：使用Docker部署Ollama + CUDA

若希望简化部署流程，可使用NVIDIA官方提供的CUDA容器环境：

安装NVIDIA Container Toolkit：

sudo apt install nvidia-container-toolkit

sudo systemctl restart docker

拉取支持CUDA的Ollama镜像（需社区提供）：
```
docker pull ollama/ollama:cuda
```
运行容器：

docker run --gpus all -d -v ollama:/root/.ollama -p 11434:11434 ollama/ollama:cuda

8. 结语

通过上述步骤，您可以在Ubuntu系统上成功安装Ollama并启用CUDA支持，实现基于GPU的模型推理加速。后续可结合模型量化、多GPU并行等技术进一步优化性能。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

Ollama本地运行大模型？先配置好PyTorch-GPU环境再说
2025-12-15 11:06

规则哥讲规则的博客本文详解在本地通过Ollama运行大语言模型前，必须正确配置PyTorch-GPU环境。涵盖CUDA、cuDNN、显卡选型与常见问题排查，强调构建完整技术栈对高效推理的关键作用。
Anything-LLM + Ollama：支持哪些开源模型？
2025-12-16 13:18

岑秋苑的博客深入解析Anything-LLM与Ollama的集成机制，实测Llama3、Mistral、Phi-3等主流开源模型的兼容性表现，探讨本地化RAG系统的部署方案、性能优化与安全策略，为构建私有知识库提供高效可行的技术路径。
GPT-OSS:20b性能实测：36亿活跃参数在Ollama中的表现如何？
2026-01-15 03:19

草莓味儿柠檬的博客本文介绍了如何在星图GPU平台上自动化部署GPT-oss:20b镜像，并实测其性能。该平台简化了部署流程，用户可快速体验这一拥有36亿活跃参数的开源大模型。该镜像在代码生成与逻辑推理等复杂任务中表现出色，例如，能够...
Ollama安装遇到的问题解决方法
2025-07-23 13:12

Paul689的博客本文介绍了在已安装英伟达驱动的环境中解决Node.js安装冲突和ollama安装使用问题的方法。首先处理libnode-dev与Node.js16.x的文件冲突，建议卸载冲突包后安装LTS版20.x。对于npm的可选更新提示，可根据需要决定是否...
Ollama 本地部署大语言模型操作指南
2025-07-19 08:04

Kelaru的博客 Ollama 是一个轻量级、开源的工具，用于在本地部署和运行大语言模型（LLM），支持 Llama、Qwen、DeepSeek、Gemma 等模型。它提供命令行操作和 OpenAI 兼容的 API，跨平台支持 Windows、macOS 和 Linux，适用于对数据...
opencode支持哪些模型？BYOK接入Ollama本地模型详细教程
2026-01-24 03:58

bjackzjack的博客本文介绍了如何在星图GPU平台上自动化部署OpenCode镜像，实现AI编程辅助功能。通过BYOK方式接入Ollama本地模型，开发者可离线使用代码补全、重构和调试等核心功能，确保代码隐私安全的同时提升开发效率。
Ollama实战指南：本地部署语言模型的高效技巧
2025-09-20 02:51

hhh00的博客文章深入剖析了从云端转向本地部署的核心优势，如提升响应速度和保障数据隐私，并提供了从硬件准备、软件安装、模型选择与拉取，到性能调优与API集成的全流程技巧。通过具体的命令示例和配置建议，即使是初学者也能...
internlm2-chat-1.8b Ollama镜像免配置部署：支持gRPC服务暴露的生产方案
2026-01-25 04:02

健康和谐男哥的博客本文介绍了在星图GPU平台上，如何一键自动化部署【书生·浦语】internlm2-chat-1.8b Ollama镜像，实现免配置的AI助手服务。该方案内置gRPC接口，便于集成，其核心应用场景包括智能客服、代码辅助与内容创作等文本...
Win10下Ollama安装避坑指南：从环境检查到模型加载全流程
2025-10-13 02:21

kotlin6android的博客内容涵盖安装前的深度环境检查（包括显卡、驱动、系统版本与磁盘空间）、自定义路径安装技巧、关键的环境变量与模型存储路径配置、模型拉取与运行等实战操作，并汇总了常见故障的解决方案，旨在帮助用户顺利完成本地...
Windows 10/11下AnythingLLM+Ollama保姆级配置教程（含DeepSeek模型调优）
2025-10-12 01:08

信用卡奴隶的博客本文提供了一份详细的Windows系统下AnythingLLM与Ollama...教程涵盖从环境准备、Ollama部署、DeepSeek模型加载，到AnythingLLM配置、参数调优及私有知识库构建的全过程，旨在帮助用户打造一个安全、高效的专属AI助手。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月28日