最新最热精华悬赏待回答 筛选
  • 2

    回答

图片里是我做llm微调和自定义模块时候保存的权重文件,这个是最佳模型,同时还有一个全量的最佳模型,在做测试的时候加载这个增量权重的时候,结果低了10%以上(全量权重结果是正确的),但是同样一份代码,在

  • 1

    回答

使用max+395迷你主机,显存分配96G,但是在本地使用LMstudio加载模型时总是失败,在任务管理器里看到模型总是往内存里加载。重分配成64G内存/64G显存后,一部分30B左右的模型可以正常加

  • vllm
  • 10
  • 2026-02-09 00:41
回答 bg4toh
采纳率0%
  • 2

    回答

请教各位一个问题,gui task是怎么跑的,服务器上安装安卓模拟器吗,还是服务器有什么办法可以连接本地真机

  • 2

    回答

问题背景:我正在尝试实现 GRPO 算法训练 Qwen3-VL-8B-Thinking。采用“分布式训练 + 独立推理卡”的方案,在autodl上租了3张RTX PRO 6000 96G, 前两张卡用

  • vllm
  • 22
  • 2026-01-22 19:08
  • 3

PyCharm安装 通义灵码 \lingma-jetbrains\lib\cosy-intellij-2.7.0.jar' contains invalid plugin descriptor

m1546674994
采纳率50%
  • 2

    回答

docker和GPU是啥关系?docker中部署ragflow,ragflow怎么弄成用GPU跑?