Langchain-Chatchat+ChatGLM2-6B如何设置batch_size的值

看了好多教你如何设置batch_size的帖子就是没教在哪设置想请问一下。最近搞了个学习机器 16G显存跑Langchain-Chatchat的时候就占用13G多了选中一个数据集进行训练直接提示oom了实在不知道如何优化看其他的帖子好像16G也够了啊

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2024-01-22 20:24
关注
【以下回答由 GPT 生成】

根据您描述的情况，如果Langchain-Chatchat+ChatGLM2-6B模型在使用16G显存时占用了大部分显存并提示OOM错误，说明模型的batch_size设置过大导致显存不足。

解决这个问题的方法是降低batch_size大小，以减少显存占用。下面是具体步骤：

首先，需要了解模型的训练过程中的显存占用情况。可以通过监测代码中的显存使用情况来获取准确的信息。例如，在PyTorch中，可以使用torch.cuda.memory_allocated()函数获取当前的GPU显存使用量。

接下来，根据训练数据的大小和模型的复杂度，选择一个较小的batch_size。一般情况下，较小的batch_size会占用较少的显存，但会增加训练时间。推荐从一个较小的batch_size开始，然后逐渐增加以找到一个适合您的GPU的合适大小。一般来说，一个合理的初始值可以是16或32。

当选择一个较小的batch_size后，可能需要调整模型的学习率。较小的batch_size往往会导致梯度估计的不准确性增加，因此需要增加学习率来进行补偿。可以逐步增加学习率，并根据实验结果进行调整，直到找到适合的学习率。

另外，您还可以尝试使用梯度累积（gradient accumulation）来减少显存的占用。梯度累积是指将多个batch的梯度累积起来，然后在更新参数时进行一次性的梯度更新。例如，如果将batch_size设置为8，但将梯度累积步骤设置为4，则会在处理每4个batch后进行一次梯度更新。这样虽然每次处理的batch数量相同，但显存占用量会减少一半。

最后，硬件升级也是一个可以考虑的选项。如果您的硬件限制不能满足您的需求，可以考虑升级到显存更大的GPU，或者使用分布式训练技术来利用多个GPU进行训练。

需要注意的是，以上方法仅为常见的优化策略，实际效果可能因不同情况而异。在进行任何更改之前，建议先进行小规模的实验来评估每个改变对训练过程的影响，并根据实际情况进行调整。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Langchain-chatchat+ChatGlm3-6b部署
2024-03-17 19:49

recover517的博客 LLM_DEVICE = "cuda" MODEL_PATH = { "embed_model": { "bge-large-zh": "E:\\git\\Langchain-Chatchat\\bge-large-zh" }, "llm_model": { "chatglm3-6b": "E:\\git\\Langchain-Chatchat\\chatglm3-6b", } } 运行 #...
python-Langchain-Chatchat+ChatGLM2-6B在16G内存电脑上运行
2024-06-18 15:01

liwulin0506的博客 python-Langchain-Chatchat+ChatGLM2-6B在16G内存电脑上运行
Langchain-Chatchat + chatglm2-6b-32k-int4 本地部署：属于自己的大模型
2023-11-28 16:47

1378YP的博客不属于预设llm模型,所以往下大概第160行左右,有个"llm_model"的字典,在里面添加自己用的llm模型名 "chatglm2-6b-32k-int4": "chatglm2-6b-32k-int4", 运行Langchain-Chatchat python startup.py -a 涉及的官方网址 ...
搭建Langchain-Chatchat-v0.2.10 + chatglm3-6b环境
2024-06-15 09:30

xuebodx0923的博客在linux上搭建Langchain-Chatchat-v0.2.10 + chatglm3-6b + bge-large-zh。3.2.2 修改文件configs/model_config.py。上下载Langchain-Chatchat的v0.2.10版本。ip是搭建langchain-chatchat的服务器ip地址。4.3 往知识...
从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库（完结篇）
2024-01-29 17:09

hya168的博客从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库。
从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库（一）
2024-01-26 10:05

hya168的博客操作系统：下载光盘镜像后，引导启动，进入安装界面：选择语言：跳过更新，直接安装：默认继续：选择安装 ubuntu server安装(不要最小化安装，省去后面依赖问题)配置网络，可以指定ip配置代理服务器（跳过即可）配置...
【Langchain-Chatchat】部署ChatGLM3-6B-32K教程
2024-03-23 17:49

太空眼睛的博客介绍 Langchain-Chatchat这个框架可以帮助我们更容易的部署大语言模型，之前也写过ChatGLM传统的部署教程，有兴趣的可以参考【ChatGLM3】第三代大语言模型多GPU部署指南【ChatGLM2-6B】从0到1部署GPU版本借助...
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库
2024-01-16 08:00

Blueeyedboy521的博客回答不准确参考手把手教你搭建本地知识库问答AI机器人 LangChain-Chatchat：基于LangChain和ChatGLM2-6B构建本地离线私有化知识库在家庭私有云上部署体验语言模型chatglm3-6b，打造私人助理手把手教大家在本地...
Langchain-Chatchat基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答
2024-01-25 17:09

基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，开源、可离线部署的检索增强生成(RAG)大模型知识库项目。版本0.2.9版本。受 GanymedeNil 的项目 document.ai 和 AlexZhangji 创建的 ChatGLM-6B Pull ...
基于Langchain-Chatchat + chatGLM3 轻松在本地部署一个知识库
2024-02-05 18:23

最美dee时光的博客一种利用 langchain 思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。该项目是一个可以实现 __完全本地化__推理的知识库增强方案, 重点解决...
Langchain-Chatchat源码
2023-10-18 22:53

Langchain-Chatchat（原Langchain-ChatGLM）基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM) QA app with ...
Langchain-Chatchat+Qwen实现本地知识库
2024-06-26 10:28

大飞攻城狮的博客 Langchain-Chatchat一种利用 [langchain] 思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。大致过程包括加载文件 -> 读取文本 -> 文本分割 ->...
大语言模型langchain+ChatGLM3-6B+本地知识库实战
2024-02-10 00:37

North_D的博客大语言模型langchain+ChatGLM3-6B+本地知识库实战文章目录大语言模型langchain+ChatGLM3-6B+本地知识库实战目标微调、本地知识库和 Prompt基本概念 1、环境准备 2、创建conda虚拟环境 3、langchain+chatglm3-6b...
langchain-chatchat代码使用
2024-04-13 22:26

langchain-chatchat代码结构思维导图
从零开始部署ubuntu+Anaconda3+langchain-chatchat+chatglm3-6b大模型，本地知识库（二）
2024-01-29 09:50

hya168的博客转到langchain chatchat目录下,安装langchain的一些pip依赖。等待安装完成，pytorch之类比较大，下载过程会比较长。安装完成后，进入python命令行，使用如下命令检查torch，cuda。如下图，shell命令行前面会出现...
基于langchain-chatchat-chatglm构建本地离线知识库大模型
2024-03-12 14:17

夏の在りか的博客基于langchain-chatchat-chatglm构建本地离线知识库大模型 1.操作系统 2.下载langchain-chatchat相关代码和模型 3.运行环境准备 3.1安装CUDA和cudnn 3.2创建虚拟环境 3.3 初始化 3.4 修改配置文件 3.5 windows部署...
Langchain-Chatchat本地搭建ChatGLM3模型和提取PDF内容
2024-03-08 07:30

penngo的博客文章目录 1、软件要求 2、安装CUDA 2.1、安装gcc 2.2、安装CUDA 3、安装Anaconda3 3.1、下载Anaconda3 3.2、创建python虚拟环境 4、部署系统 4.1、下载源码 4.2、安装依赖 4.3、下载模型 4.4、初始化配置和知识库 ...
本地部署 Langchain-Chatchat & ChatGLM
2024-06-18 19:51

菜鸟Python码农的博客确保机器安装了 git 环境：https://git-scm.com/ 因为模型过大，需要安装 lfs 支持： 4. 下载 ChatGLM2-6B 模型到本地,要根据自己的显卡显
无坑！部署langchain-chatchat + glm4-9b-chat，轻松实现知识库智能问答！
2024-06-27 20:56

zbc-的博客通过该项目可以轻松实现智能问答，由于chatglm4的开源，该项目最新版本0.3.0与0.2.0版本部署有所不同.这里 llm 模型使用 glm4-9b-chat, embedding 模型使用 bge-large-zh-v1.5
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月22日

悬赏问题

¥15 VESTA绘图原子颜色显示异常
¥15 天翼云搭建多ip l2tp
¥30 matlab求解刃位错方程
¥15 python实现CAD识图
¥15 如何实现在renpy中创建并应用不同大小尺寸对话框？
¥15 table表格有一列是固定列滑动到最下面时固定的那一列有几行没显示出来
¥20 单细胞数据注释时报错
¥15 vscode编译ros找不到头文件，cmake.list文件出问题，如何解决？(语言-c++|操作系统-linux)
¥15 通过AT指令控制esp8266发送信息
¥15 有哪些AI工具提供可以通过代码上传EXCEL文件的API接口，并反馈分析结果

Langchain-Chatchat+ChatGLM2-6B如何设置batch_size的值

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新