ChatGLM4-9B推理报错


 
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Loading checkpoint shards: 100%|███████████████████████████████████████████████████████| 10/10 [00:11<00:00,  1.10s/it]
Some parameters are on the meta device because they were offloaded to the cpu.
Welcome to the GLM-4-9B CLI chat. Type your messages below.
 
You: hello
GLM-4:
Exception in thread Thread-2 (generate):
Traceback (most recent call last):
  File "D:\conda\envs\env_name\lib\threading.py", line 1016, in _bootstrap_inner
    self.run()
  File "D:\conda\envs\env_name\lib\threading.py", line 953, in run
    self._target(*self._args, **self._kwargs)
  File "D:\conda\envs\env_name\lib\site-packages\torch\utils\_contextlib.py", line 116, in decorate_context
    return func(*args, **kwargs)
  File "D:\conda\envs\env_name\lib\site-packages\transformers\generation\utils.py", line 1622, in generate
    result = self._sample(
  File "D:\conda\envs\env_name\lib\site-packages\transformers\generation\utils.py", line 2841, in _sample
    model_kwargs = self._update_model_kwargs_for_generation(
  File "C:\Users\Administrator\.cache\huggingface\modules\transformers_modules\glm-4-9b-chat\modeling_chatglm.py", line 929, in _update_model_kwargs_for_generation
    cache_name, cache = self._extract_past_from_model_output(outputs)
ValueError: too many values to unpack (expected 2)

transformers包换了4.40.0（官方要求）, 4.40.2, 4.39.3都没用，不知怎么办了

另外outputs.past_key_values的值是不是有问题？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
master_chenchengg 2025-01-23 19:14
关注
答案来星火AI，希望能对题主有所帮助！

ChatGLM4-9B推理报错可能涉及多个方面的问题，包括模型配置、输入数据格式、环境依赖等。以下是一些常见的原因和解决方法：

1. 模型配置问题

解释

模型配置文件中可能存在错误或不兼容的参数设置，导致推理时出现异常。

示例

{ "model_name": "chatglm4-9b", "max_length": 512, "temperature": 0.7, "top_p": 0.9 }

确保配置文件中的参数与模型要求一致。

2. 输入数据格式问题

解释

输入数据格式不正确，例如缺少必要的字段或字段值不符合预期格式，可能导致推理失败。

示例

input_data = { "prompt": "你好，今天天气怎么样？", "max_tokens": 100, "temperature": 0.7 }

确保输入数据包含所有必需的字段，并且字段值符合预期格式。

3. 环境依赖问题

解释

运行环境可能缺少某些依赖库或版本不兼容，导致推理过程中出现错误。

示例

pip install torch==1.10.0 transformers==4.15.0

确保安装的库版本与模型要求一致。

4. 代码实现问题

解释

代码实现中可能存在逻辑错误或未处理的异常情况，导致推理失败。

示例

import torch from transformers import AutoModelForCausalLM, AutoTokenizer def chat(prompt): model_name = "THUDM/chatglm4-9b" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name) inputs = tokenizer(prompt, return_tensors="pt") outputs = model.generate(**inputs, max_length=100, temperature=0.7) return tokenizer.decode(outputs[0], skip_special_tokens=True) try: response = chat("你好，今天天气怎么样？") print(response) except Exception as e: print(f"Error during inference: {e}")

在代码中添加异常处理，以便更好地调试和定位问题。

5. 硬件资源不足

解释

推理过程中可能需要大量的计算资源，如果硬件资源不足（如显存不足），可能导致推理失败。

示例

import torch if not torch.cuda.is_available(): raise RuntimeError("CUDA is not available. Please check your hardware configuration.") else: device = torch.device("cuda") model.to(device)

确保有足够的硬件资源，并正确配置设备。

总结

ChatGLM4-9B推理报错可能由多种原因引起，包括模型配置、输入数据格式、环境依赖、代码实现以及硬件资源等。通过逐一排查这些可能的原因，可以找到并解决问题。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

在CSDN gitcode AI平台实践ChatGLM4-9B聊天机器人@MindSpore
2024-10-14 07:00

skywalk8163的博客原来执行前mindspore版本为： 2.3.0rc1 执行后版本为：'2.3.1'模型区是没有ChatGLM4模型目前在gitcode的，但是我们可以先于官方尝鲜哦！现在的问题是，gitcode的AI环境可以用多少时间？MindSpore 下的ChatGLM4的效果...
在阿里云DSW部署ChatGLM3-6B常见报错解决
2024-10-14 15:19

小倍爱编程的博客报错1 ERROR: Could not build wheels for outlines-core, which is required to install pyproject.toml-based projects 报错2 成功解决后可以+V bianchen12345 交流远程帮忙解决
glm-4-9b-chat模型本地推理流程
2024-08-09 14:01

持续学习中～的博客解释glm-4-9b-chat的运行流程和一些常用参数。
在Windows系统下部署运行ChatGLM3-6B模型
2024-08-02 17:46

进击的AI的博客主要讲述关于清华ChatGLM3的部署应用
基于chatglm3-6b微调-中医信息问答模型
2024-05-28 17:48

XXmmood的博客 ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了如下特性：1、更强大的基础模型： ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了...
window 安装大模型 chatglm-6b
2024-04-27 10:06

shengjk1的博客你好，我是 shengjk1，多年大厂经验，努力构建通俗易懂的、好玩的编程语言教程。欢迎关注！你会有如下收益：了解大厂经验拥有和大厂相匹配的技术等希望看什么，评论或者私信告诉我！文章目录一、前言二、...
使用chatglm3-6b来帮助我们构建菜谱数据集
2024-09-24 19:09

skywalk8163的博客 chatglm3-6b是chatglm2-6b的升级版，使用方法是一样的，可以参考：人人都有大模型用！大模型ChatGLM2-6B新手速通！_jupyter notebook chatglm-CSDN博客为了使用最新的chatglm3-6b，我们需要使用最新的PaddleNLP，...
Youtu-2B vs ChatGLM4-9B：轻重模型GPU适配对比
2026-02-15 00:32

不卡不卡的博客本文介绍了如何在星图GPU平台上自动化部署 Youtu LLM 智能对话服务 - Youtu-2B镜像，该轻量级大语言模型专为低资源环境优化，支持在RTX 3060等消费级显卡上稳定运行，典型应用于实时客服问答、智能硬件语音中控及...
ChatGLM-6B部署、实战与微调
2023-06-29 19:37

AI智韵的博客 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB ...
AI大模型探索之路-应用篇15：GLM大模型-ChatGLM3-6B私有化本地部署
2024-04-18 08:01

寻道AI小兵的博客 ChatGLM3-6B 是 OpenAI 推出的一款强大的自然语言处理模型，它在前两代模型的基础上进行了优化和改进，具有更高的性能和更广泛的应用场景。本文将从技术角度对 ChatGLM3-6B 进行详细介绍，包括其特点、资源评估、...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月20日

ChatGLM4-9B推理报错

3条回答 默认 最新

1. 模型配置问题

解释

示例

2. 输入数据格式问题

解释

示例

3. 环境依赖问题

解释

示例

4. 代码实现问题

解释

示例

5. 硬件资源不足

解释

示例

总结

问题事件

3条回答默认最新