Ollama运行whisper时提示“model not found”如何解决？

**问题描述（198字）：** 在Ollama中执行 `ollama run whisper` 时提示“model not found”，本质是Ollama官方模型库（https://ollama.com/library）**并未上架原生Whisper模型**。Whisper是OpenAI开源的语音识别模型，属ASR（自动语音识别）任务，而Ollama当前（v0.5.x）主要支持LLM（大语言模型），其内置模型格式（GGUF）、推理框架（llama.cpp）与Whisper的PyTorch/ONNX架构不兼容。用户误将Hugging Face上的`openai/whisper-*`或第三方GGUF转译版直接`ollama run`，因未正确导入或命名不匹配（如缺少`whisper:base`等有效tag），导致拉取失败。此外，Ollama不支持`.bin`/`.pt`原生权重，也暂未集成Whisper专用解码器（如faster-whisper后端）。该错误非网络或权限问题，而是模型生态与工具链的根本不匹配所致。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

Jiangzhoujiao 2026-03-07 10:50

关注

```html

一、现象层：命令执行失败的表象与典型报错

执行 ollama run whisper 后终端明确返回 pull model manifest: 404 not found 或 model not found: whisper。该错误高频出现在 macOS/Linux CLI 环境（Ollama v0.5.2–v0.5.7），且 ollama list 输出中无任何以 whisper: 开头的模型条目。值得注意的是，此非 DNS 解析失败、HTTPS 证书错误或 Docker 权限缺失——ollama run llama3 可正常拉取并运行，证实服务端连通性与本地守护进程均健康。

二、机制层：Ollama 架构约束与 Whisper 技术栈的本质冲突

模型格式鸿沟：Ollama 强制要求 GGUF 格式（由 llama.cpp 定义），而 Whisper 原生权重为 PyTorch .bin 或 ONNX .onnx，二者 tensor layout、量化方案、算子注册机制完全不兼容；
推理引擎隔离：llama.cpp 专为 Transformer-based LLMs（Decoder-only）优化，缺乏 Whisper 所需的 Encoder-Decoder attention 跨模态对齐、音频 tokenization（Mel-spectrogram → logits）、forced decoder prefix（language token）等 ASR 特有逻辑；
生态治理边界：Ollama Library 官方审核仅接纳符合 Modelfile 规范的 LLM 模型，Whisper 不在支持任务列表（ASR、TTS、STT 均未纳入 roadmap v0.6）。

三、验证层：三步实证排除法确认根本原因

验证步骤	预期结果	实际结果	结论指向
`curl -I https://registry.ollama.ai/v2/library/whisper/manifests/latest`	HTTP 200 + JSON manifest	HTTP 404	官方库确无 whisper 模型
`ollama show --modelfile whisper:base`	输出 Modelfile 内容	"model not found"	本地未导入任何 whisper tag
尝试 `ollama run ghcr.io/simonepri/whisper.cpp:tiny`	成功加载（若存在第三方镜像）	404（Ollama 不解析 OCI registry）	Ollama 仅信任 ollama.com/library 命名空间

四、替代路径层：面向生产环境的 ASR 实施矩阵

下表对比主流 Whisper 部署方案与 Ollama 的兼容性：

graph LR A[Whisper 需求] --> B{部署目标} B --> C[轻量 CLI 工具] B --> D[API 服务化] B --> E[嵌入式边缘] C --> C1["faster-whisper
pip install faster-whisper
whisperx --model tiny"] D --> D1["Whisper API Server
- OpenAI-compatible /v1/audio/transcriptions
- 使用 whisper.cpp + REST wrapper"] E --> E1["Android/iOS SDK
- silero-whisper
- Core ML 转换版"] style C1 fill:#4CAF50,stroke:#388E3C style D1 fill:#2196F3,stroke:#1976D2 style E1 fill:#FF9800,stroke:#EF6C00

五、工程实践层：绕过 Ollama 的合规集成方案

GGUF 转译（谨慎推荐）：使用 whisper.cpp 的 convert-pt-to-ggml.py 脚本将 openai/whisper-tiny 转为 GGML，再用 quantize 工具生成 GGUF；但注意：Ollama 仍无法直接 load，需自行封装为 Modelfile 并 ollama create —— 此过程需重写 FROM 基础镜像为 scratch 并挂载 whisper.cpp 二进制，已超出 Ollama 设计范畴；
统一 API 网关：在本地启动 faster-whisper 服务（uvicorn server:app --host 0.0.0.0:8001），通过 Nginx 反向代理至 /v1/audio/transcriptions，使前端调用方式与 OpenAI API 一致，实现“伪 Ollama 集成”；
LLM+ASR 协同架构：用 Ollama 运行 llama3:8b 处理文本后处理（如标点修复、方言转写），Whisper 专注语音解码，二者通过 Redis Queue 解耦——此模式已被多家智能客服厂商验证。

六、前瞻层：Ollama 生态演进的关键观察点

根据 GitHub Issue #4287 与 PR #5120，Ollama 团队已在实验 multi-task adapter 支持，未来可能通过 adapter: whisper-v3 方式扩展非 LLM 任务。但截至 2024 年 Q3，其核心仍是 LLM-first，ASR 支持需等待 ollama serve 的插件化推理后端（类似 Triton Inference Server 的 backend 插件机制）落地。

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

大模型之Spring AI实战系列（三十三）：Spring Boot + Ollama 实现本地部署AI聊天应用（10分钟搞定）
2025-07-13 16:44

寻道AI小兵的博客 Ollama 作为一个开源的大语言模型框架，让我们可以在本地环境中轻松运行和管理各种大型语言模型。Spring AI 则是 Spring 生态系统中用于集成人工智能功能的框架。本文将带你从零开始搭建一个基于 Spring Boot 的项目...
PYTHON_DAY02_ollama私有化大模型部署_以及apifox和chatbox调用大模型
2026-03-18 21:33

迦南的迦亚索的索的博客通过安装Ollama工具，实现基于Ollama运行通义QWen大模型Ollama：是一款旨在简化大型语言模型本地部署和运行过程的开源软件。中文名：羊驼Ollama提供了一个轻量级、易于扩展的框架，让开发者能够在本地机器上轻松构建...
【AI大模型】私有化大模型部署本_基于ollama+ChatBox实现chatBot-基础篇
2026-03-23 18:48

海宁不掉头发的博客本文介绍了私有化大模型的必要性及主流解决方案，重点讲解了Ollama的安装与使用。随着AI技术普及，数据安全问题日益突出，企业需要私有化部署大模型以保护敏感数据。Ollama作为开源轻量级工具，支持多平台运行，具有...
如何通过LobeChat最大化利用GPU算力资源？
2025-12-16 20:14

Kimgoeunlaogong的博客 factory) throw new Error(`Plugin ${pluginName} not found`); const plugin = await factory(); // 按需实例化 const controller = new AbortController(); const timeoutId = setTimeout(() => controller.abort...
Flux模型系列之在没有 ComfyUI 的 Mac Mx 上运行 Flux.1 Dev/Schnell + Lora
2024-09-18 14:16

知识大胖的博客在本文中，我将向您展示如何在 Mac 上轻松运行 Flux.1 模型。本文的目的是提出在 Mac 上运行 Flux.1 的替代方法，大多数可用的教程都是基于ComfyUI 的。我尝试找到一种以简单的方式生成图像的方法，使用现在支持 ...
Dify 从入门到精通（第 81/100 篇）：Dify 的多模态模型监控（高级篇）
2025-09-02 15:34

逻极的博客 Dify 的多模态模型监控是指通过监控工具（如 Prometheus、Grafana、ELK Stack）实时跟踪多模态模型（如 LLaVA 处理文本+图像、Whisper 处理语音）在多租户（参考第五十六篇）、高可用性（参考第六十七篇）和多语言...
OpenClaw本地AI助手部署全指南
2026-03-18 20:40

悲怆的宁静的博客 OpenClaw是一款开源本地...3)Ollama环境搭建与本地模型部署；4)OpenClaw与本地LLM的集成配置；5)针对B端产品经理工作场景的功能优化；6)系统测试验证与常见问题解决方案。该方案实现了完全本地化的AI助手系统，保障数据
小白也能懂的Open Interpreter：保姆级安装使用教程
2026-01-16 07:59

咸鱼生气了的博客本文介绍了基于星图GPU...通过该平台，用户可快速搭建本地AI编程环境，结合Qwen3-4B模型实现自然语言生成代码、数据分析与文件处理等任务，适用于数据清洗、视频字幕生成及浏览器自动化等场景，兼顾效率与数据安全。
OpenClaw 在 WSL2 上的部署全指南 (2026 版)
2026-03-10 10:08

CarlowZJ的博客本手册详细记录了如何在 Linux (Ubuntu) 环境下从零开始配置 OpenClaw，解决常见的权限、路径及服务启动问题。
零成本玩转本地AI：LocalAI视频教程与实战指南
2025-09-03 02:59

班岑航Harris的博客本文将带你从零开始，通过视频教程和实战案例，掌握LocalAI在本地部署和运行AI模型的全流程，无需GPU也能体验强大的AI功能。读完本文，你将能够： - 快速搭建本地化AI服务，摆脱对云平台的依赖 - 部署文本生成、图像...
关注企业 RAG 应用私有部署，Jina AI 模型登陆 Amazon SageMaker
2024-04-18 15:16

Jina AI的博客 package/{model_name}", "ap-south-1": f"arn:aws:sagemaker:ap-south-1:077584701553:model-package/{model_name}", "sa-east-1": f"arn:aws:sagemaker:sa-east-1:270155090741:model-package/{model_name}", } ...
私有化大模型部署本_基于ollama+ChatBox实现chatBot
2025-03-26 09:55

满天星耶的博客 Ollama：是一款旨在简化大型语言模型本地部署和运行过程的开源软件。中文名：羊驼OllamaOllama提供了一个轻量级、易于扩展的框架，让开发者能够在本地机器上轻松构建和管理LLMs（大型语言模型）。通过Ollama，开发者...
零基础玩转Whisper-Large-v3：99种语言语音识别保姆级教程
2026-01-16 04:37

靠谱电竞的博客本文介绍了基于星图GPU平台自动化部署“Whisper语音识别-多语言-large-v3语音识别模型二次开发构建by113小贝”镜像的完整流程。该镜像支持99种语言自动检测与转录，适用于会议记录、字幕生成等场景，结合GPU加速...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月7日