m0_73786595 2025-01-20 12:19 采纳率: 25%

ChatGLM4-9B推理报错


Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Loading checkpoint shards: 100%|███████████████████████████████████████████████████████| 10/10 [00:11<00:00,  1.10s/it]
Some parameters are on the meta device because they were offloaded to the cpu.
Welcome to the GLM-4-9B CLI chat. Type your messages below.

You: hello
GLM-4:
Exception in thread Thread-2 (generate):
Traceback (most recent call last):
  File "D:\conda\envs\env_name\lib\threading.py", line 1016, in _bootstrap_inner
    self.run()
  File "D:\conda\envs\env_name\lib\threading.py", line 953, in run
    self._target(*self._args, **self._kwargs)
  File "D:\conda\envs\env_name\lib\site-packages\torch\utils\_contextlib.py", line 116, in decorate_context
    return func(*args, **kwargs)
  File "D:\conda\envs\env_name\lib\site-packages\transformers\generation\utils.py", line 1622, in generate
    result = self._sample(
  File "D:\conda\envs\env_name\lib\site-packages\transformers\generation\utils.py", line 2841, in _sample
    model_kwargs = self._update_model_kwargs_for_generation(
  File "C:\Users\Administrator\.cache\huggingface\modules\transformers_modules\glm-4-9b-chat\modeling_chatglm.py", line 929, in _update_model_kwargs_for_generation
    cache_name, cache = self._extract_past_from_model_output(outputs)
ValueError: too many values to unpack (expected 2)
Traceback (most recent call last):
  File "E:\ChatGLM3\basic_demo\trans_cli_demo.py", line 112, in <module>
    for new_token in streamer:
  File "D:\conda\envs\env_name\lib\site-packages\transformers\generation\streamers.py", line 223, in __next__
    value = self.text_queue.get(timeout=self.timeout)
  File "D:\conda\envs\env_name\lib\queue.py", line 179, in get
    raise Empty
_queue.Empty

transformers包换了4.40.0（官方要求）, 4.40.2, 4.39.3都没用，不知怎么办了

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

master_chenchengg 2025-01-23 23:31

关注

答案来星火AI，希望能对题主有所帮助！

要解决 ChatGLM4-9B 推理报错的问题，首先需要了解具体的错误信息和上下文。通常，这类错误可能与模型加载、输入数据格式、依赖库版本或配置有关。以下是一些常见的解决方法：

1. 检查模型文件路径

确保你提供的模型文件路径是正确的，并且文件存在且未损坏。

import os

model_path = "path/to/your/model"
if not os.path.exists(model_path):
    raise FileNotFoundError(f"Model file not found at {model_path}")

2. 确认依赖库版本

确保所有必要的依赖库已经正确安装，并且版本兼容。例如，如果你使用的是 transformers 库，可以通过以下命令检查版本：

pip show transformers

如果版本不兼容，可以尝试升级或降级到合适的版本：

pip install transformers==4.20.0

3. 检查输入数据格式

确保输入数据的格式符合模型的要求。例如，对于文本生成任务，输入应该是一个字符串列表。

inputs = ["Hello, how are you?"]

4. 调试日志记录

启用详细的日志记录，以便更好地调试和排查问题。

import logging

logging.basicConfig(level=logging.DEBUG)
logger = logging.getLogger(__name__)

def log_debug_info(message):
    logger.debug(message)

5. 捕获并处理异常

在代码中添加异常捕获机制，以便更好地理解错误原因。

try:
    # Your inference code here
except Exception as e:
    logger.error("An error occurred during inference", exc_info=True)

6. 查看官方文档和社区支持

查阅 ChatGLM4-9B 的官方文档和社区支持，以获取更多帮助。例如，可以访问 Hugging Face 的 Transformers 文档或相关论坛。

示例代码

以下是一个完整的示例代码，展示了如何加载模型并进行推理，同时包含错误处理和日志记录：

import os
import logging
from transformers import AutoTokenizer, AutoModelForCausalLM

# 设置日志记录
logging.basicConfig(level=logging.DEBUG)
logger = logging.getLogger(__name__)

def log_debug_info(message):
    logger.debug(message)

# 检查模型文件路径
model_path = "path/to/your/model"
if not os.path.exists(model_path):
    raise FileNotFoundError(f"Model file not found at {model_path}")

# 加载模型和分词器
try:
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForCausalLM.from_pretrained(model_path)
    log_debug_info("Model and tokenizer loaded successfully")
except Exception as e:
    logger.error("Failed to load model or tokenizer", exc_info=True)
    raise e

# 准备输入数据
inputs = ["Hello, how are you?"]
try:
    inputs = tokenizer(inputs, return_tensors="pt")
    log_debug_info("Input data prepared successfully")
except Exception as e:
    logger.error("Failed to prepare input data", exc_info=True)
    raise e

# 进行推理
try:
    outputs = model.generate(**inputs)
    log_debug_info("Inference completed successfully")
except Exception as e:
    logger.error("Inference failed", exc_info=True)
    raise e

# 输出结果
try:
    result = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(result)
except Exception as e:
    logger.error("Failed to decode output", exc_info=True)
    raise e

通过以上步骤，你应该能够找到并解决 ChatGLM4-9B 推理报错的问题。如果问题依然存在，建议查阅相关文档或寻求社区支持。

报告相同问题？

关注问题

在CSDN gitcode AI平台实践ChatGLM4-9B聊天机器人@MindSpore
2024-10-14 07:00

skywalk8163的博客原来执行前mindspore版本为： 2.3.0rc1 执行后版本为：'2.3.1'模型区是没有ChatGLM4模型目前在gitcode的，但是我们可以先于官方尝鲜哦！现在的问题是，gitcode的AI环境可以用多少时间？MindSpore 下的ChatGLM4的效果...
在阿里云DSW部署ChatGLM3-6B常见报错解决
2024-10-14 15:19

小倍爱编程的博客报错1 ERROR: Could not build wheels for outlines-core, which is required to install pyproject.toml-based projects 报错2 成功解决后可以+V bianchen12345 交流远程帮忙解决
glm-4-9b-chat模型本地推理流程
2024-08-09 14:01

持续学习中～的博客解释glm-4-9b-chat的运行流程和一些常用参数。
在Windows系统下部署运行ChatGLM3-6B模型
2024-08-02 17:46

进击的AI的博客主要讲述关于清华ChatGLM3的部署应用
基于chatglm3-6b微调-中医信息问答模型
2024-05-28 17:48

XXmmood的博客 ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了如下特性：1、更强大的基础模型： ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了...
window 安装大模型 chatglm-6b
2024-04-27 10:06

shengjk1的博客你好，我是 shengjk1，多年大厂经验，努力构建通俗易懂的、好玩的编程语言教程。欢迎关注！你会有如下收益：了解大厂经验拥有和大厂相匹配的技术等希望看什么，评论或者私信告诉我！文章目录一、前言二、...
使用chatglm3-6b来帮助我们构建菜谱数据集
2024-09-24 19:09

skywalk8163的博客 chatglm3-6b是chatglm2-6b的升级版，使用方法是一样的，可以参考：人人都有大模型用！大模型ChatGLM2-6B新手速通！_jupyter notebook chatglm-CSDN博客为了使用最新的chatglm3-6b，我们需要使用最新的PaddleNLP，...
Youtu-2B vs ChatGLM4-9B：轻重模型GPU适配对比
2026-02-15 00:32

不卡不卡的博客本文介绍了如何在星图GPU平台上自动化部署 Youtu LLM 智能对话服务 - Youtu-2B镜像，该轻量级大语言模型专为低资源环境优化，支持在RTX 3060等消费级显卡上稳定运行，典型应用于实时客服问答、智能硬件语音中控及...
ChatGLM-6B部署、实战与微调
2023-06-29 19:37

AI智韵的博客 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB ...
AI大模型探索之路-应用篇15：GLM大模型-ChatGLM3-6B私有化本地部署
2024-04-18 08:01

寻道AI小兵的博客 ChatGLM3-6B 是 OpenAI 推出的一款强大的自然语言处理模型，它在前两代模型的基础上进行了优化和改进，具有更高的性能和更广泛的应用场景。本文将从技术角度对 ChatGLM3-6B 进行详细介绍，包括其特点、资源评估、...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月20日