关于chatglm2-6b本地部署问题

我在运行train.sh时有如图所示报错怎么解决（Linux）
，用的是chatglm-6b，tuning文件是GitHub上的，用的路径是

并且没有创建output_dir对应空文件夹

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

8条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Kwan的解忧杂货铺@新空间代码工作室 2024-09-25 08:14
关注
上午好☀️☀️☀️️
本答案参考ChatGPT-3.5

这个问题似乎是在使用ChatGLM进行训练时遇到了错误。

下面是具体的解决步骤：

首先，你需要确保你的环境已经安装了ChatGLM和TensorFlow，并且正确配置了这些库。你可以参考以下链接来获取这些库的完整信息：https://github.com/RajeshLal诙/PyTorch-GraphConv。

使用以下命令安装ChatGLM和TensorFlow：

pip install chatglm torch torchvision transformers

在main.py中导入所需的模块并设置相关参数。

import torch import argparse import logging import os from torch.optim import Adam from transformers import ChatGLMForConditionalGeneration, TrainingArguments

设置模型参数。在这个例子中，我们想要一个全连接神经网络，输入维度为128，输出维度为64。

transformer_prefix_encoder.embedding.weight.data.zero_()

定义训练参数。这里我们设置了不同的学习率、批次大小、批评估和优化步数。

learning_rate = 1e-2 batch_size = 1 eval_batch_size = 1 gradient_accumulation_steps = 16 predict_with_generate = True max_steps = 20 logging_steps = 10 save_steps = 10

定义模型保存目录和主训练循环。

output_dir = "output/adgen-chatglm-6b-pt-" + PRESEQ_LEN * LR training_args = TrainingArguments( output_dir, overwrite_output_dir=True, max_source_length=64, max_target_length=64, per_device_train_batch_size=batch_size, per_device_eval_batch_size=batch_size, gradient_accumulation_steps=gradient_accumulation_steps, predict_with_generate=predict_with_generate, max_steps=max_steps, logging_steps=logging_steps, save_steps=save_steps, num_train_epochs=3, weight_decay=0.001, )

创建聊天GLM模型实例。

chatglm = ChatGLMForConditionalGeneration.from_pretrained("/home/fwl/exp/model/chatglm-6b")

训练模型。

optimizer = Adam(learning_rate) chatglm.train谈判 RecapOverheadLoss(p梯度归一化) chatglm.train

如果你想要对验证数据进行评估，你可以这样执行：

chatglm.eval(model=chatglm, args=training_args) chatglm.eval()

以上就是如何解决ChatGLM训练过程中出现的错误问题的步骤。如果你还有其他问题，欢迎随时向我询问。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于用c语言将ESP-32两个示例融合在一起的问题 c语言
2022-11-06 19:42

回答 2 已采纳 esp32/8266环境搭建之c语言篇（win和linux）_调库侠的博客-CSDN博客_esp8266用c语言本文将介绍用c语言开发e
关于#Microsoft#的问题，如何解决？(语言-python) java php python
2023-04-09 22:22

回答 1 已采纳不知道你这个问题是否已经解决, 如果还没有解决的话: 你可以看下这个问题的回答https://ask.csdn.net/questions/7640319如果你已经解决了该问题, 非常希望你能够分享一
SpringBoot2.7.0 Gradle7.4.2 排除默认Logging 换 Log4j2 问题 gradle spring boot
2022-06-12 15:16

回答 1 已采纳题主可以试着查看下依赖树，是否存在其他依赖于 spring-boot-starter-logging
ChatGLM3+更强大的基础模型： ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数
2024-01-11 09:29

ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了如下特性：更强大的基础模型： ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了...
关于#密码学RSA#的问题，如何解决？网络安全
2022-10-17 17:09

回答 2 已采纳 Python实现RSA加解密_我是个假程序员的博客-CSDN博客_python rsa加密解密
关于esp32睡眠模式的问题 c语言
2022-11-01 23:03

回答 1 已采纳提供参考链接【esp32 低功耗模式之深度休眠模式（deep sleep）】：https://zhuanlan.zhihu.com/p/130992695
RecyclerView 里面放ViewPager 照片问题 android-studio java 有问必答
2021-09-13 16:17

回答 3 已采纳我猜你的意思是这些图片如何放到viewpager里的imageview中。我建议你在recycleview里，创建viewpager的时候顺便把数据的list也传递下来，不然你不知道生成多少个view
chatglm3-6b.zip
2024-03-18 14:43

2. **模型微调**：将chatglm3-6b和bge-large-zh模型在特定的问答数据集上进行微调，使它们适应知识库问答的场景，提高对特定领域问题的理解和回答能力。 3. **融合策略**：将两个模型的输出进行融合，可以通过投票...
关于#for#的问题，如何解决？ c语言
2022-03-04 07:50

回答 1 已采纳看for循环，就是一步一步看呗，i从1开始到2结束，所以就取值1,2j当i=1时，取值0,1，当i=2时，取值0,1,2那么其实就是a[1][0]a[1][1]a[2][0]a[2][1]a[2][2
关于PHP和JAVA之间的AES加密互通问题 java php
2019-03-02 12:04

回答 2 已采纳可以试试下面这种AES加密解密方式看行不行 ``` class AES { /** * * @param string $string 需要加密的字符串
请问div后面跟的属性data-v-e20faf64是什么意思，爬虫爬取的话有什么不一样 python 爬虫
2022-03-20 15:45

回答 1 已采纳直接用class爬就行：//div[@class='so-items-normal']
ChatGLM2-6B本地化部署
2023-08-06 21:07

光法V3的博客 ChatGLM2-6B 是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2...
将返回的pdf流生成本地文件 java
2021-08-23 10:48

回答 2 已采纳 responseEntity.getContent() 只是获取流的上下文对象，并不是获取出来的直接就是文件 MultipartHttpServletRequest multipartRequest
ChatGLM2-6B 部署
2024-06-21 07:00

Linux猿的博客本文主要对 ChatGLM2-6B 模型的部署和推理过程进行介绍。
ChatGLM2-6B本地部署
2023-06-27 15:33

爱学习的小黑的博客 ChatGLM2-6B相较于第一代还是有较大的提升，按照Readme.md进行部署问题还是相对简单，本篇文章记录了我的一个部署过程，期间还是遇到了几个问题，但都很快就解决了。
ChatGLM2-6B本地部署，人人都可以用上LLM大语言模型！
2023-07-10 14:53

Java就是搞对象的博客 GLM2是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2-6B 的基座模型。
Windows10下ChatGLM2-6B模型本地化安装部署教程图解
2023-07-17 23:12

Steven灬的博客 ChatGLM2-6B 是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2更强大的性能：基于 ChatGLM 初代模型的开发经验，我们全面升级了 ChatGLM2...
ChatGLM2-6B本地部署踩坑
2023-09-14 10:09

Chat_lsm2024的博客对于源码，由于总体积较小，因此可直接从网页下载 zip 包后解压，也可使用 git 命令（电脑需要提前装好 git ）克隆至本地文件夹中： git clone https://github.com/THUDM/ChatGLM2-6B 对于模型，由于存在7个体积...
【02】ChatGLM3-6B部署：CentOS7.9本地部署ChatGLM3-6B模型
2024-01-28 20:31

比伯476的博客【02】ChatGLM3-6B部署：CentOS7.9本地部署ChatGLM3-6B模型
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 9月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月25日

悬赏问题

¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见
¥15 一共有五道问题关于整数幂的运算还有房间号码还有网络密码的解答？(语言-python)
¥20 sentry如何捕获上传Android ndk 崩溃
¥15 在做logistic回归模型限制性立方条图时候，不能出完整图的困难
¥15 G0系列单片机HAL库中景园gc9307液晶驱动芯片无法使用硬件SPI+DMA驱动，如何解决？

关于chatglm2-6b本地部署问题

8条回答 默认 最新

问题事件

悬赏问题

8条回答默认最新