大模型部署工具该怎么挑选呢？

现在部署大模型都是使用什么工具呢？
我之前使用fastchat部署，但是fastchat有将近大半年没有出新版本了。最近看很多大模型也用ollma，vllm等工具部署openai的api服务，不知道现在大家都在用什么，说一下优点吧。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃不了席 2024-08-22 17:19
关注
以下回复参考：皆我百晓生、券券喵儿等免费微信小程序作答:

部署大型语言模型（LLM）的工具和平台在当前AI领域中非常关键，因为它们为大模型的实际运用提供了必要的桥梁。具体分析如下：

综合部署与服务管理平台

Ollama：高度定制化服务，强大的集成能力，以及实时优化和调整。
LM Studio：提供图形用户界面，预训练模型库丰富，支持团队协作工具。
Ray Serve：具有分布式架构，框架无关，易于扩展。

模型推理优化工具

TensorRT-LIm：专为NVIDIA GPU优化，降低延迟，提升吞吐量。
FasterTransformer：针对Transformer模型专优，支持多种硬件，高效率的推理。
DeepSpeed-MII：超大规模模型支持，资源优化，易于集成。

专用/特定任务模型部署框架

H2OGPT：针对特定业务场景优化，提供特定领域解决方案。
PrivateGPT：适用于需要高度隐私保护的部署环境。

通用的机器学习和深度学习库

PyTorch Transformer库：提供广泛的模型支持和开发工具，便于访问、训练和部署各种预训练模型。

特定语言实现

llama.cpp：针对C/C++语言优化，提供更好的性能和系统集成能力。

总的来说，在选择部署工具时，应考虑模型的大小、预期的应用场景、所需的集成级别、系统兼容性、性能需求等因素。例如，如果需要在本地服务器上部署大型模型并提供持续的服务，可能需要一个如Ollama或LM Studio这样的综合部署与服务管理平台。如果重点是提高模型的推理速度和效率，那么选择如TensorRT-LIm或FasterTransformer这样的模型推理优化工具可能更加合适。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

LDA模型运行时报错，如何解决？(语言-python) nlp python 有问必答自然语言处理
2022-03-08 09:36

回答 2 已采纳可能是路径中包含中文，在操作文件的过程中会因为中文字符的原因导致无法找到正常的路径，因此会出现 Users\ + xe6…那些报错。
想知道最新的New bing的语言模型版本人工智能自然语言处理语言模型
2023-03-09 21:01

回答 1 已采纳 Bing AI可能会利用微软深度学习框架中的预训练语言模型，例如Bert和GPT等。Bing AI也会结合自己的算法和数据集，不断优化和改进语言模型的性能，微软研究团队在不久前推出了最新的预训练语言模
chatGPT用用就这样是怎么回事呢？语言模型
2023-03-04 17:08

回答 1 已采纳网站压力太大，服务器响应不了，上亿用户呢，应该是没预见到会一下暴增这么多用户，所以服务器资源并不足够。
你想在本地部署大模型吗？本地部署大模型的三种工具
2024-07-19 09:59

知世不是芝士的博客人工智能的发展如火如荼，也让越来越...01本地部署大模型的三种工具gpt4all是一款可以本地部署大模型的客户端工具，其支持window，macOS和ubuntu(一款linux桌面系统)系列。其官网地址：https://gpt4all.io/index.html。
R语言bacon年龄深度模型指导 r语言有问必答
2022-03-18 19:51

回答 2 已采纳建议通过学习和研究文档来做。参考：https://mirrors.sjtug.sjtu.edu.cn/cran/web/packages/rbacon/vignettes/intro.htmlhttp
模型的batch_size与层的batch_size不一致，该怎么办呢？ batch python tensorflow
2023-04-07 15:25

回答 1 已采纳在tensorflow中，如果一个层没有指定输入的batch_size，则该层的输出将自动采用输入张量的batch_size，这意味着如果你的输入张量的batch_size为None，则输出也将是No
【R语言】加权线性回归模型，PSU问题 r语言线性回归
2023-03-01 23:28

回答 1 已采纳其中一个层（第 65 层）中只有一个 PSU（主要抽样单位），这导致调查设计出现问题。你参考一下这个： # Filter out Stratum 65 d_rec_filtered <- d_r
29种本地部署大模型和调用的工具平台分类与总结
2024-05-01 20:46

云博士的AI课堂的博客 29种本地部署大模型和调用的工具平台分类与总结
常用的迁移学习模型有哪些呢？人工智能机器学习深度学习神经网络
2020-03-11 22:00

回答 1 已采纳 Fine-tune, 多任务学习， zero-shot学习，持续学习
如何用粒子群算法解seri模型参数但效果很差？(语言-matlab) matlab 启发式算法
2022-05-11 13:54

回答 1 已采纳这个可能和你的粒子群算法的自身性能相关，导致陷入局部最优。建议先检查每一个步骤有错没，如果没有，那么可以调节粒子群算法的权重和学习因子，或者用改进的粒子群算法来进行拟合。
学过编程的人，知道这是什么意思吗？ list python 语言模型
2022-11-19 10:32

回答 2 已采纳 prinf("想%s了，没%s过", z, z)
一文读懂“大语言模型”
2023-05-22 08:00

明明如月学长的博客深度学习是机器学习的分支，大语言模型是深度学习的分支。机器学习是人工智能（AI）的一个子领域，它的核心是让计算机系统能够通过对数据的学习来提高性能。在机器学习中，我们不是直接编程告诉计算机如何完成任务，...
关于三维模型数据的测量，工具和源程序！？
2016-03-05 01:09

回答 2 已采纳如果是完整的三维模型，用Solidworks和ProE等打开后可以直接测量；如果是三维点云数据的话，可以用Imageware等先对数据进行拟合后进行测量。
本地部署大模型的几种工具（上-相关使用）
2024-03-26 10:35

龙井茶Sky的博客 — vLLMchatglm.cpp主要通过C++编译，实现性能的提升ollama主要简化了部署大模型的复杂度github地址：ollama/ollama：启动并运行 Llama 2、Mistral、Gemma 和其他大型语言模型。github上可以看ollama相关介绍，包括...
一文了解什么是大模型？到底大模型有什么用呢？
2024-06-28 14:45

AI大模型-搬运工的博客大模型在各种领域都有广泛的应用，包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征，具有更强大的泛化能力，可以对未见过的数据做出准确的预测。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月22日

悬赏问题

¥15 C++ 句柄后台鼠标拖动如何实现
¥15 有人会SIRIUS 5.8.0这个软件吗
¥30 comsol仿真等离激元
¥15 静电纺丝煅烧后如何得到柔性纤维
¥15 (标签-react native|关键词-镜像源)
¥100 照片生成3D人脸视频
¥15 伪装视频时长问题修改MP4的时长问题，
¥15 JETSON NANO
¥15 VS开发qt时如何在paintgl函数中用pushbutton控制切换纹理
¥20 关于 openpyxl 处理excel文件地问题

大模型部署工具该怎么挑选呢？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新