各位.我在在huggingface加载一个模型出现这个错误.好像是环境问题.写着什么cache没有定义.该怎么解决o(╥﹏╥)o求帮助..

这是在 hugging face 复制的代码，不知道哪里运行错了，原来配置过 transformers 的环境

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

檀越@新空间 2024-10-07 18:21

关注

晚上好🌙🌙🌙
本答案参考ChatGPT-3.5

这个问题是由于Hugging Face的transformers库中使用了一个旧版本的Cache模块导致的。Cache模块在transformers库中已经被移除，并且它的工作原理和使用场景与原始的torch库不同。

为了解决这个问题，你需要使用torch的Cache模块来代替.Cache模块。以下是相应的修改代码：

import torch

from transformers import AutoModelForCausalLM, get_linear_schedule_with_warmup

# 配置模型和超参数
config = {
    "optimizer": "adam",
    "num_train_epochs": 3,
    "lr": 1e-5,
}

# 初始化模型和数据集
model = AutoModelForCausalLM.from_pretrained("q-future/compare2score", config=config)
train_dataset = ... # 你的训练数据集
test_dataset = ...

# 使用新模型训练数据集
model.train()
for epoch in range(num_train_epochs):
    for i, batch in enumerate(train_dataset):
        optimizer.zero_grad()
        outputs = model(batch)
        loss = outputs.loss
        loss.backward()
        optimizer.step()

# 在验证阶段使用优化器优化模型
optimizer = ... # 创建新的优化器
for epoch in range(num_val_epochs):
    for i, batch in enumerate(test_dataset):
        optimizer.zero_grad()
        outputs = model(batch)
        loss = outputs.loss
        loss.backward()
        optimizer.step()

注意：在更新transformers库时，需要确保你在正确的位置安装了该库，并且已经更新到最新版本。

报告相同问题？

关注问题

如何在HuggingFace镜像网站快速部署FLUX.1-dev大模型？全流程解析
2025-12-15 20:31

小馬锅的博客本文详解如何在国内环境下通过HuggingFace镜像站高效部署FLUX.1-dev大模型，涵盖权限申请、镜像加速、显存优化及多任务调用方法，支持文生图、图像编辑与视觉问答一体化应用。
解决SAM本地部署中的HuggingFace连接问题：从零开始加载本地模型
2025-11-11 04:44

kiwi8的博客本文详细介绍了如何解决SAM（Segment Anything Model）在本地部署中遇到的HuggingFace连接问题，提供从零开始加载本地模型的完整方案。内容包括模型架构解析、本地资源准备、缓存机制优化及生产环境部署策略，帮助...
HuggingFace加载模型失败的解决
2024-04-03 15:28

Tiffany:)的博客使用AutoModel手动加载本地的HuggingFace模型
HuggingFace 模型文件详解:如何加载本地模型？
2024-12-30 13:33

阿正的梦工坊的博客配置文件定义模型结构和任务参数。权重文件支持大模型分片存储，提高传输与加载速度。分词器设置决定模型对文本的处理能力。
使用llama.cpp把huggingface模型转换为ollama所需要的gguf格式
2025-03-11 17:15

NorthEdge的博客注：此文章用于记录自己在模型格式转换所遇到的一些问题和过程。
DeepSpeed训练得到checkpoint如何像Huggingface模型一样评测evaluation？zero_to_fp32.py有什么用？怎么用？
2025-01-01 13:01

阿正的梦工坊的博客具体步骤首先看一个样例：这是我用open-instruct框架，使用DeepSpeed训练1728个steps得到的一个checkpoint。请注意，下文我演示用的例子是基于step_1152，主要方法和step_1728这个名字没有任何区别。在使用 ...
【AI大模型应用开发】【Fine-Tuning】0. 从一个例子开始学习大模型Fine-Tuning
2024-02-23 07:00

同学小张的博客我们从一个简单的例子入手，先来感受下Fine-Tune微调到底是什么。这个例子可以在笔记本电脑上跑，需要的配置不高。在开始本文的实践案例前，你可以对模型训练一窍不通，本文将带你跑通整个过程，同时解释其中一些...
huggingface.co下载Qwen3-Embedding模型的步骤
2026-01-04 14:00

CodeCaptain的博客该模型针对中文优化，需Python 3.8+环境，推荐使用GPU加速。部署步骤包括：1）安装依赖包；2）通过命令行或代码下载模型（支持镜像加速）；3）验证模型功能，包括文本向量化和归一化处理。用户还可将其封装为OpenAI...
手把手教你用HuggingFace本地加载CLIP模型（附常见报错解决方案）
2025-08-29 15:53

蜜糖Py小兔的博客本文提供了一份详细的CLIP模型本地加载指南，旨在解决因网络问题导致的模型加载失败。内容涵盖从创建虚拟环境、使用pip安装依赖、下载完整模型文件到本地加载的完整流程，并针对常见的‘Can‘t load tokenizer’等...
用huggingface.transformers.AutoModelForSequenceClassification在文本分类任务上微调预训练模型
2022-04-09 22:35

诸神缄默不语的博客本文以文本分类任务为例，介绍transformers上如何微调预训练模型。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月7日

各位.我在在huggingface加载一个模型出现这个错误.好像是环境问题.写着什么cache没有定义.该怎么解决o(╥﹏╥)o求帮助..

3条回答 默认 最新

问题事件

3条回答默认最新