云服务器上怎样部署Ollama?

我在Auto DL租用了GPU，使用VS Code远程连接，我想部署Ollama，然后在上面运行大模型。
但现在遇到了这个问题，这个问题该如何解决呢？还有其他方法部署Ollama吗？
求解答，谢谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
檀越@新空间 2026-04-06 23:51
关注
晚上好🌙🌙🌙
本答案参考通义千问

在云服务器上部署 Ollama 是一个相对简单的过程，尤其是在你已经租用了 GPU 的情况下。Ollama 是一个轻量级的模型服务工具，支持多种大模型（如 Llama、Llama2、ChatGLM 等），非常适合在云服务器上运行。

下面我将详细说明如何在 Auto DL 云平台上的 GPU 实例中部署 Ollama，并解决可能遇到的问题。

一、部署 Ollama 的步骤

1. 登录 Auto DL 平台并启动实例

打开 Auto DL 官网
选择合适的 GPU 实例（建议至少 16GB 显存）
启动实例后，通过 VS Code 连接远程服务器

2. 安装 Docker（如果尚未安装）

Ollama 推荐使用 Docker 部署，因为这样可以避免依赖问题。

sudo apt update sudo apt install docker.io -y sudo systemctl enable --now docker

注意： 如果你没有权限，可以使用 sudo 或者将用户加入 docker 组。

3. 下载并运行 Ollama Docker 容器

Ollama 提供了官方的 Docker 镜像，你可以直接拉取并运行：

docker pull ollama/ollama:latest docker run -d -p 11434:11434 --name ollama ollama/ollama:latest

关键点：

-d 表示后台运行
-p 11434:11434 将容器的 11434 端口映射到主机的 11434 端口
--name ollama 给容器命名，方便管理

4. 检查 Ollama 是否正常运行

docker ps

你应该看到类似如下输出：

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES abc123def456 ollama/ollama "/bin/sh -c 'exec s..." 10 seconds ago Up 9 seconds 0.0.0.0:11434->11434/tcp ollama

5. 访问 Ollama API

你可以通过浏览器或命令行访问 Ollama 的 API 地址：

http://<你的服务器IP>:11434

或者使用 curl 测试：

curl http://localhost:11434

二、常见问题及解决方案

✅ 问题1：无法访问 11434 端口

原因： 云服务器的防火墙或安全组未开放 11434 端口。

解决方案：

在 Auto DL 控制台中，进入实例详情页，添加安全组规则，允许 TCP 11434 端口。
如果你是通过 SSH 连接的，确保你可以在本地访问该端口。

✅ 问题2：Ollama 启动失败或报错

原因： 可能是 Docker 配置错误、内存不足、或缺少依赖。

解决方案：

查看日志：

docker logs ollama

如果提示“no space left on device”，可能是磁盘空间不足，清理一下：

docker system prune -a

如果是 GPU 支持问题，可以尝试在启动时指定 GPU：

docker run -d -p 11434:11434 --gpus all --name ollama ollama/ollama:latest

✅ 问题3：模型下载失败或超时

原因： 国内网络限制导致 Ollama 无法连接到模型仓库。

解决方案：

使用国内镜像源（如阿里云）加速下载：

export HTTP_PROXY=http://your.proxy.server:port export HTTPS_PROXY=http://your.proxy.server:port

或者手动下载模型文件，然后放入 Ollama 的存储目录中（默认为 /root/.ollama/models）

三、其他部署方式（非 Docker）

如果你不想用 Docker，也可以直接下载 Ollama 的可执行文件，但需要满足以下条件：

1. 下载 Ollama 可执行文件

从 Ollama 官方 GitHub 下载对应系统的二进制文件。

例如，Linux 64位：

wget https://github.com/ollama/ollama/releases/download/v0.3.15/ollama-linux-amd64 chmod +x ollama-linux-amd64 mv ollama-linux-amd64 /usr/local/bin/ollama

2. 启动 Ollama

ollama serve

注意： 此方法不推荐用于 GPU 服务器，因为 Ollama 默认只支持 CPU，除非你自行编译支持 GPU 的版本。

四、总结：部署 Ollama 的最佳方案

| 方法 | 优点 | 缺点 | |------|------|------| | Docker 部署 | 快速、易维护、兼容性强 | 需要配置 Docker | | 直接二进制部署 | 更轻量 | 不支持 GPU（除非自定义编译） |

五、完整部署脚本（一键部署）

你可以将以下内容保存为 deploy_ollama.sh 并执行：

#!/bin/bash # 安装 Docker sudo apt update && sudo apt install docker.io -y sudo systemctl enable --now docker # 拉取 Ollama 镜像 docker pull ollama/ollama:latest # 运行 Ollama 容器 docker run -d -p 11434:11434 --name ollama ollama/ollama:latest # 查看运行状态 docker ps | grep ollama

六、后续操作建议

你可以通过 Python 调用 Ollama API 来运行模型：

import requests response = requests.post( "http://<your_server_ip>:11434/api/generate", json={"model": "llama2", "prompt": "Hello, world!"} ) print(response.json())

如果你想加载更大的模型，比如 llama3，可以先拉取模型：

docker exec -it ollama ollama pull llama3

七、结语

在 Auto DL 上部署 Ollama 是完全可行的，只要合理配置 Docker 和安全组，就能顺利运行大模型。如果你遇到了具体错误，欢迎提供错误信息，我可以帮你进一步排查。

如果你还有其他关于模型调优、API 使用等问题，也欢迎继续提问！
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

怎样在离线的Linux服务器上部署 Ollama，并运行 Qwen 大模型（附教程）
2025-03-11 15:45

LLM教程的博客怎样在离线的Linux服务器上部署 Ollama，并运行 Qwen 大模型（附教程）
内网服务器离线环境下 Ollama 的完整部署指南
2025-05-16 14:49

技术醒者的博客通过本文所述的离线部署方案，企业可以在完全隔离的内网环境中安全运行 Ollama，实现大语言模型的本地化应用。关键在于做好依赖管理、模型预处理和服务化配置，同时结合企业实际需求进行安全加固和性能优化。随着 AI...
【大语言模型】本地快速部署Ollama运行大语言模型详细流程
2024-06-17 17:23

檀越@新空间的博客本文主要介绍如何在 Windows 系统快速部署 Ollama 开源大语言模型运行工具，并安装 Open WebUI 结合 cpolar 内网穿透软件，实现在公网环境也能访问你在本地内网搭建的 llama2、千文 qwen 等大语言模型运行环境。
使用 Ollama 在腾讯云服务器环境部署 DeepSeek 大模型实战指南
2025-02-06 10:41

Lorin 洛林的博客本文将详细讲解如何在腾讯云服务器上，通过 Ollama 框架快速部署 deepseek-r1:1.5b 模型，实现本地化模型服务。本文详细讲解如何在腾讯云服务器环境上，通过 Ollama 框架快速部署 deepseek-r1:1.5b 模型，实现本地化...
LLM - CentOS上离线部署Ollama+Qwen2.5-coder模型完全指南
2025-03-22 14:00

小小工匠的博客实测部署了个qwen2.5-coder 7B的模型，对话延时400多秒…上图就是两个文件，下面就要进行模型文件合并。返回后，ollama ps （以0.5b的为例）就可以看到了（我之前看不到，以为有问题）其他的模型，也可以按照上面的...
Linux服务器上快速部署ollama大模型服务：从安装到外网访问全流程
2026-03-09 00:48

梧桐应恨夜来霜的博客本文详细介绍了在Linux服务器上快速部署ollama大模型服务的完整流程，涵盖从基础安装、配置监听外部请求，到打通防火墙与安全组实现外网访问，并提供了模型管理与API集成的实战指南。重点解决了生产环境中安全暴露...
用Ollama部署大语言模型
2025-03-20 08:52

天天进步2015的博客 Ollama是一个开源项目，旨在简化大语言模型的本地部署和使用过程。它提供了一个轻量级的框架，使用户能够在个人电脑上运行各种开源大语言模型，如Llama 2、Mistral、Vicuna等，而无需依赖云服务。创建Modelfile：...
什么是 Ollama？如何安装运行？一文讲清
2024-08-10 16:35

程序员老冉的博客 Ollama 是一个可以在本地部署和管理开源大语言模型的框架，由于它极大的简化了开源大语言模型的安装和配置细节，一经推出就广受好评，目前已在github上获得了46k star。不管是著名的羊驼系列，还是最新的AI新贵...
【ollama部署】国内Linux服务器快速部署ollama与模型实战
2026-03-12 00:34

楚雨馨的博客本文详细介绍了在国内Linux服务器上快速部署Ollama的实战指南。通过利用ModelScope（魔搭社区）的国内镜像，有效解决了官方源下载慢的问题。文章从环境检查、依赖安装开始，逐步讲解如何通过镜像下载Ollama、一键...
服务器上搭建ollama用于本地vscode代码生成
2025-05-30 11:07

@daviiid的博客摘要：本文介绍了在局域网GPU服务器(Linux)上搭建大模型服务，用于本地Windows系统VSCode代码补全的完整流程。服务器端通过Docker安装Ollama服务并加载模型(如qwen2.5-coder、llama3)，本地通过端口转发将127.0.0.1:...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月6日

云服务器上怎样部署Ollama?

2条回答 默认 最新

一、部署 Ollama 的步骤

1. 登录 Auto DL 平台并启动实例

2. 安装 Docker（如果尚未安装）

3. 下载并运行 Ollama Docker 容器

4. 检查 Ollama 是否正常运行

5. 访问 Ollama API

二、常见问题及解决方案

✅ 问题1：无法访问 11434 端口

✅ 问题2：Ollama 启动失败或报错

✅ 问题3：模型下载失败或超时

三、其他部署方式（非 Docker）

1. 下载 Ollama 可执行文件

2. 启动 Ollama

四、总结：部署 Ollama 的最佳方案

五、完整部署脚本（一键部署）

六、后续操作建议

七、结语

问题事件

2条回答默认最新