Bugbank_A 2024-07-31 19:15 采纳率: 0%
浏览 1339

Error: llama runner process has terminated: error loading model: unable to allocate backend buffer

img

img

img

img

img


ollama3.1:405b下载显示成功,为何后面又有报错?内存都有足够的空间,求解惑!

  • 写回答

3条回答 默认 最新

  • weixin_50937580 2024-08-05 16:28
    关注

    405B的模型需要810G的内存,才能完整的运行,这个内存可以是内存+显卡内存,因为他没有量化模型,所以需要那么大的空间,好像时这样子。跑70B的吧,70B的8G显卡也能跑,我3060TI g6x就是跑70B的,相应速度在1-2秒左右。

    评论 编辑记录

报告相同问题?

问题事件

  • 修改了问题 7月31日
  • 创建了问题 7月31日