程序员问答社区_开发者在线问题解答-CSDN问答

最新最热精华悬赏待回答筛选

llama本地部署硬件要求

本地部署llama3 8B需要电脑多大配置，我这个电脑（如图）能部署多大参数的llama3呀？谢谢

llama
6
2024-10-28 17:15

五只大鸭梨

采纳率85.7%

1

回答

llama3-Chinese微调对数字不敏感

问题遇到的现象和发生背景 1.llama3-8b-Chinese使用带含量的国标文件生成的数据集微调之后，对数字类的问答数据集学习能力不高；2.加载检查点之后，询问答案中带数字的问题，正确率只有33%

llama
自然语言处理
10
2024-10-15 15:49

回答 M,I,S,S

采纳率0%

windows安装llama-factory，报错CUDA environment was not detected.

windows安装llama-factory，报错CUDA environment was not detected.;但是采用nvcc -v检测，有信息这个是什么问题呀？

windows
llama
127
2024-09-21 10:39

路过的夏季

采纳率80%

13

回答

大模型llama-factory微调之后的模型给ollama怎么使用

llama-factory训练完的模型怎么给ollama使用？包括导出和格式转化，安装使用？有知道的嘛，麻烦给一个详细的教程

¥20
llama
88
2024-09-19 10:55

路过的夏季

采纳率80%

27

回答

llama3中文版微调

为什么llama3中文版使用LLaMA-Factory微调之后，选择检查点加载模型，返回的token很短，而且增加提示词和max_token参数调整都不起作用？

¥15
python
llama
35
2024-09-12 10:51

M,I,S,S

采纳率0%

13

回答

在Windows中运行ollama出现运行缓慢的情况

首次使用ollama时llama3.1:8b十分流畅，但是重启后llama3.1响应速度极慢十分钟才输出了一个hello

¥15
llama
人工智能
313
2024-09-01 13:48

Sweetptato

采纳率0%

1

回答

安装Docker报错求解答~~

安装完Docker，无法打开，通过命令安装Open WebUI报错这是什么原因啊，Hyper-V我也打开了，不过是在安装后打开的 docker run -d -p 3000:8080 --add-ho

docker
llama
9
2024-07-29 15:25

ZZZ_er

采纳率0%

1

回答

K80计算卡能跑什么模型

#最近买了一张NVIDIA的K80计算卡驱动的CUDA版本最高支持11.4，很多模型都跑不了想请教一下有没有能跑的请具体说明一下模型的名称，最好实测过，谢谢

AI作画
AIGC
llama
5
2024-07-05 21:36

回答 2401_83129524

采纳率0%

2

回答

可以部署个人大模型的在线平台

请问下，我想部署一个个人的模型，我自己已经训练好了，基于llama3+peft，我想找一个在线的平台部署我的私有模型，提供REST API的服务，请问有这样的平台吗，多谢!

llama
chatgpt
gpu算力
7
2024-06-25 18:42

回答 guolisen

采纳率0%

如何在 llama.cpp 服务器中实现用户登录功能的优化方案？(语言-c++)

我正在修改 llama.cpp/examples/server/public 目录下的 index.html 文件，以添加一个用户登录窗口。这个登录窗口将提示用户输入用户名和密码以访问服务器。我希望将

¥15
llama
c++
html
8
2024-05-23 17:19

Sean_Zhang__

采纳率100%

4

回答

运行llama2 70B 需要哪些硬件配置

运行llama2 70B 需要哪些硬件配置？内存需要多大，CPU和GPU的要求分别是什么？

llama
191
2024-05-12 14:42

回答 ginnfan

采纳率25%

3

回答

如何在本地使用llama2 70B

如何在本地使用llama2 70B，可以直接用吗，还是必须要部署？

llama
3
2024-05-12 14:36

回答 ginnfan

采纳率25%

5

回答

llama2-7b-hf和llama3-8b-h推理速度比较的问题

我写了一个用hf接口进行llama2和llama3模型推理测速的脚本，测试出来结果llama2-7b比llama3-8b要更快，请问大家是怎么样测试的呢？测试结果有没有什么不一样？脚本代码如下，代码是

人工智能
llama
nlp
44
2024-04-26 16:31

回答芙门泡芙

采纳率50%

3

回答

通过text-generation-webui部署Llama2-Chinese-7b-Chat模型时报错

问题遇到的现象和发生背景通过text-generation-webui部署Llama2-Chinese-7b-Chat模型时报错，不知道原因，并想知道机型是否支持运行模型： 23:15:09-83

有问必答
python
llama
74
2024-03-22 23:38

回答 JamXena

采纳率0%

3

回答

llama2部署问题

我的系统是cenos7 正在部署llama2，下载完权重执行下面俩个命令的时候出了 warnings.warn("Attempted to get default timeout for nccl b

llama
26
2024-03-13 16:37

回答 weixin_52564645

采纳率0%

1

回答

各种llm后训练量化方法都需要单独设计算子吗？

现在各种大模型后训练量化方法，权重长得都不一样，有的是scale，有的是ab，有的是scale和zero，每种量化方法具体推理的时候都需要单独实现算子来加速吗？

人工智能
chatgpt
llama
4
2024-01-14 22:41

回答小宝宝睡觉觉

采纳率0%

15

回答

llama-no checkpoint

今天用算力平台部署llama-2-7b的时候，在确认安装环境及使用平台预安装的模型的情况下，运行如下代码使用文本补全功能： ~/data/llama$ torchrun --nproc_per_nod

¥15
人工智能
llama
90
2023-12-21 13:31

清和廿六.

采纳率0%

2

回答

形状各向异性如何体现

按照这个简单当容器 60 60 60 磁滞回线矫顽力是400多容器 20 20 20 矫顽力900多容器 400 400 20矫顽力200 在增

llama
53
2023-12-06 09:27

回答 ⌒你给我过来∝

采纳率0%

2

回答

llama_recipes遇到的循环引用报错

在使用LLama_recipes对模型进行微调时，代码出现这个报错查阅资料后说是循环引用的问题，在加入一些懒加载，改名方法后也没解决。github上也有人遇到类似问题但没有解决方案这是llama_r

¥15
llama
11
2023-11-08 15:15

weixin_44222515

采纳率0%

2

回答

当前GPT在工作场景下能够发挥的作用

#LLM #GPT最近公司一直在让研究怎么能做到GPT本地化部署，用来上传学习业务流程，分析数据报表。不知道各位触们有没有实际使用过的分享一下感想，现在的GPT3.5和LLAMA等一些大模型是否能够实

chatgpt
gpt-3
llama
7
2023-09-07 14:09

回答 2301_76853257

采纳率0%