Error: llama runner process has terminated: error loading model: unable to allocate backend buffer

ollama3.1：405b下载显示成功，为何后面又有报错？内存都有足够的空间，求解惑！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
weixin_50937580 2024-08-05 16:28
关注
405B的模型需要810G的内存，才能完整的运行，这个内存可以是内存+显卡内存，因为他没有量化模型，所以需要那么大的空间，好像时这样子。跑70B的吧，70B的8G显卡也能跑，我3060TI g6x就是跑70B的，相应速度在1-2秒左右。

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Error: llama runner process has terminated: error loading model: unable to allocate CUDA0 buffer
2025-02-06 00:21

==V==的博客 ollama在下载Deepseek开源模型本地部署时报GPU内存不足的错误，请问如何解决呢，是更换下载的模型吗。
error: llama runner process has terminated:error loading mode: unable to allocate CUDAO buffer
2025-03-03 23:31

13805029595的博客 error: llama runner process has terminated:error loading mode: unable to allocate CUDAO buffer 错误：llama runner进程已终止：加载模式错误：无法分配CUDAO缓冲区
Error: llama runner process has terminated: exit status 2
2025-07-01 08:46

Oculus Reparo！的博客 Error: llama runner process has terminated: exit status 2错误是近期刚刚由于某些软件版本原因爆发的错误。估计很多人都已经用大模型查过怎么处理了，所以我就不再做原因分析了和重复赘述了，如果别的办法都不行...
Docker+Ollama 报错 Error: llama runner process has terminated 解决方案
2025-04-30 12:18

南马的博客最新的Docker Desktop（4.41.0，2025-04-28）引入Model Runner（llama等dll），导致与Ollama冲突。有可能后续一段时间docker Desktop升级后都要如此处理，来解决与Ollama两者冲突问题。ip的11434端口依然在运行...
Ollama报错：Error: llama runner process has terminated: exit status 0xc0000409
2024-07-03 09:55

sagima_sdu的博客原因很简单，新的模型，在使用llama.cpp/convert-hf-to-gguf.py做格式转换时，使用的较高版本的llama.cpp库，而系统目前使用的版本偏低，导致不兼容。今天听说谷歌家的Gemma2性能很好，于是在Ollama上下载到本地测试...
【BUG】Error: llama runner process has terminated: exit status 127
2024-11-15 17:20

冷小鱼的博客 cannot open shared object file: No such file or directory time=2024-11-15T07:41:49.698Z level=ERROR source=sched.go:456 msg="error loading llama server" error="llama runner process has terminated:...
Error: llama runner process has terminated: exit status 0xc0000409 问题解决办法
2025-02-11 14:17

喜-喜的博客以我自身经历为例，之前由于 ollama 版本过旧，在部署时出现 “Error: llama runner process has terminated: exit status 0xc0000409” 的错误提示，升级 ollama 版本后，部署顺利完成，相关问题也得以解决。...
ollama出现fault和unable to allocate CUDA0 buffer的错误提示：Error: llama runner process has terminate...如何解决？
2026-02-03 10:01

bug菌¹的博客本文收录于《全栈 Bug 调优（实战版）》专栏。专栏聚焦真实项目中的各类疑难 Bug，从成因剖析 → 排查路径 → 解决方案 → 预防优化全链路拆解，形成一套可复用、可沉淀的实战知识体系。无论你是初入职场的开发者...
ollama运行qwen2出错Error: llama runner process has terminated: signal: aborted (core dumped) ，已解决
2024-06-11 18:24

原野AI的博客做格式转换时，使用的较高版本的llama.cpp库，而我们使用的版本偏低，导致不兼容。在网上查找资料，该种情况的原因是：qwen2的这些模型，在使用。升级后，版本：ollama version is 0.1.42。进入到ollama官网，选择...
Ollama运行大模型报错，Error：llama runner process no longer running：3221225785
2024-04-24 11:08

pinewaves111的博客在华为matebook 14上下载Ollama运行llama3:8b，命令行语句为ollama run llama3:8b，llama3:8b下载后，运行报错Error：llama runner process no longer running：3221225785。以为是内存不够或模型下载不正确，又运行...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月31日

Error: llama runner process has terminated: error loading model: unable to allocate backend buffer

3条回答 默认 最新

问题事件

3条回答默认最新