在进行命名实体识别模型微调后出现问题

想问一个跟微调模型有关的问题，就是Huggingface上面有一个课程token classification,然后想着跟着课程跑一边代码，按照它（课程）步骤进行数据处理，模型微调，到最后用微调模型测试时就返回了一个空格，没返回结果，出现这种情况是因为什么？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

专家-赤兔[在线] 全栈领域优质创作者 2024-04-26 21:10

关注

引自免费微信小程序：皆我百晓生

看起来你在尝试使用Hugging Face库中的transformers模块对预训练模型进行微调，并应用于命名实体识别任务。遇到返回空结果的情况，可能的原因有很多，包括但不限于数据预处理错误、模型配置不当、训练参数设置不正确等。我会提供一些排查建议和示例代码，帮助你解决这个问题。

首先，确保你的数据预处理是正确的。你需要将原始文本转换为适合输入到BERT或其他预训练模型的形式。这通常涉及到将文本分词，添加特殊标记（[CLS] 和 [SEP]），并填充/截断序列以达到固定的长度。下面是一个基本的数据预处理例子，使用了transformers库中的Tokenizer类：

from transformers import BertTokenizerFast

# 假设你的训练数据存储在一个列表中，每个元素包含一对文本和标签
train_data = [("This is a sample sentence.", "O"), ...]

# 加载预训练的tokenizer
tokenizer = BertTokenizerFast.from_pretrained('bert-base-uncased')

def preprocess_data(data):
    input_ids, attention_masks, labels = [], [], []
    
    for text, label in data:
        encoded_dict = tokenizer.encode_plus(
            text,
            add_special_tokens=True,
            max_length=512,  # 可根据实际情况调整最大长度
            pad_to_max_length=True,
            return_attention_mask=True,
            return_tensors='pt',
        )
        
        input_ids.append(encoded_dict['input_ids'])
        attention_masks.append(encoded_dict['attention_mask'])
        labels.append(encoded_dict['labels'])  # 如果数据已经编码为对应的数字标签
        
    return torch.cat(input_ids), torch.cat(attention_masks), torch.tensor(labels)

input_ids, attention_masks, labels = preprocess_data(train_data)

接下来，确认模型配置是否正确。在微调过程中，你可能需要调整模型的输出层，使其适应命名实体识别的任务。例如，如果你有3个不同的实体类别，你需要修改模型的分类头（classifier head）以产生3个输出值，而不是默认的1个。

from transformers import BertForTokenClassification

model = BertForTokenClassification.from_pretrained('bert-base-uncased', num_labels=3)  # 根据实际类别数替换3

然后检查训练过程，确保损失函数、优化器、学习率调度器以及训练轮数都设置得当。这是一个基本的训练循环示例：

from torch.utils.data import Dataset, DataLoader
import torch.optim as optim

class NERDataset(Dataset):
    def __init__(self, input_ids, attention_masks, labels):
        self.input_ids = input_ids
        self.attention_masks = attention_masks
        self.labels = labels

    def __len__(self):
        return len(self.input_ids)

    def __getitem__(self, idx):
        return {
            'input_ids': self.input_ids[idx],
            'attention_mask': self.attention_masks[idx],
            'labels': self.labels[idx]
        }

dataset = NERDataset(input_ids, attention_masks, labels)
dataloader = DataLoader(dataset, batch_size=8, shuffle=True)

optimizer = optim.AdamW(model.parameters(), lr=2e-5)
scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=40, gamma=0.1)

num_epochs = 3  # 调整为实际的训练轮数

for epoch in range(num_epochs):
    model.train()
    for batch in dataloader:
        optimizer.zero_grad()
        outputs = model(**batch)
        loss = outputs.loss
        loss.backward()
        optimizer.step()
        scheduler.step()

model.eval()

最后，在评估阶段，你需要从预测的softmax概率中找到概率最高的标签。这可以通过torch.argmax()实现。以下是评估代码示例：

def evaluate(model, dataloader):
    model.eval()
    predictions, true_labels = [], []

    with torch.no_grad():
        for batch in dataloader:
            outputs = model(**batch)
            logits = outputs.logits
            preds = torch.argmax(logits, dim=-1).tolist()
            true_labels.extend(batch["labels"].tolist())
            predictions.extend(preds)

    return predictions, true_labels

predictions, true_labels = evaluate(model, dataloader)

通过以上步骤，你应该能更好地理解模型的运行情况，并找出导致空结果的原因。如果有任何具体错误信息或更详细的调试信息，请提供，以便我能进一步帮助你分析。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(3条)

报告相同问题？

关注问题

命名实体识别数据标注问题自然语言处理
2020-04-11 20:36

回答 2 已采纳你要是有规则，就可以程序自动标注，没有规则，只能人工来做。
使用kashgari实现BERT+Bilstm命名实体识别，在保存模型时报错！！！求助！！！ python tensorflow 神经网络自然语言处理
2021-03-01 19:29

回答 5 已采纳你好。这个错误需要进入源码进行一下修正。我已经私信你了，请看一下。需要在D:\dev\anaconda\lib\site-packages\kashgari\tasks\abs_task_mode
请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 21:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
基于Bert预训练模型微调命名实体识别项目python源码+使用说明+模型(支持docker部署).zip
2024-01-09 20:00

基于Bert预训练模型微调命名实体识别项目python源码+使用说明+模型(支持docker部署).zip 基于Bert（或Robert）预训练模型微调命名实体识别任务，并提供基于docker的Tensor Serving部署模型方案实现过程。 # 1. 数据 ...
Pytorch命名实体识别P R F1全部为0但A为70%左右 python
2023-03-29 12:38

回答 2 已采纳如果命名实体识别的训练结果中P、R、F1值全部为0，但是A值比较高，有可能是模型过于保守，无法识别出任何实体。这可能是由于训练集和测试集之间存在较大的分布差异导致的。为了解决这个问题，可以尝试以下几个
事件抽取和命名实体抽取有什么关系吗？自然语言处理
2020-03-13 14:58

回答 2 已采纳命名实体抽取，指的是抽取某一类客观实例的词语，比如手机、张三、李四等事件抽取只得是抽取某一类动作，比如爆炸、开会、开车等命名实体抽取是事件抽取的基础，因为事件中都必须有至少一个主体，比如手机爆
R语言批量命名excel r语言
2023-04-06 16:41

回答 1 已采纳用for循环 for (i in names){ openxlsx::write.xlsx(x=data,paste(i,".xlsx")) }
【NLP】一文了解命名实体识别
2020-09-06 11:00

风度78的博客导读：从1991年开始，命名实体识别逐渐开始走进人们的视野，在各评测会议的推动下，命名实体识别技术得到了极大地发展，从最初的基于规则和字典的方法，到现在热门的注意力机制、图神经网络等方法...
关于引用命名空间的问题(语言-c++) c++
2023-03-04 20:28

回答 3 已采纳该回答引用ChatGPT 【问题1】这是在C++中使用命名空间的一种方式，它表示我们希望在代码中只使用 std 命名空间下的 next_permutation 函数。使用 using 关键字可以避
中文命名实体——语料处理 python 有问必答自然语言处理
2021-04-14 11:01

回答 4 已采纳 import re with open("输出文件.txt","w",encoding="utf-8") as outfile: with open("train.txt","r",enco
在学习Spring C命名空间时遇到问题 java spring
2022-02-15 01:13

回答 2 已采纳找到解决方法了https://www.zhihu.com/question/472157330/answer/2031255334可能是因为c命名空间还是使用的set注入的下标注入方式，给name和a
提升性能——NLP模型微调指南
2023-08-05 01:38

禅与计算机程序设计艺术的博客自然语言处理(NLP)是一个综合性的交叉学科，涉及计算机...因此，如何有效地利用有限的计算资源进行模型微调、优化、蒸馏等技术进步，是非常重要的。本文主要通过一个案例介绍了不加区别的提升性能——NLP模型微调方法。
为什么出现命名问题呀 python
2021-12-19 13:51

回答 1 已采纳把menu方法放在 main方法前面。python 是顺序执行的。
综述 | 少量标注数据下的命名实体识别研究
2020-12-20 22:51

zenRRan的博客来自：python遇见NLP导读近年来，深度学习方法在特征抽取深度和模型精度上表现优异，已经超过了传统方法，但无论是传统机器学习还是深度学习方法都依赖大量标注数据来训练模型，而现...
大语言模型原理与工程实践：挖掘大语言模型潜能：有监督微调
2024-06-07 00:39

禅与计算机程序设计艺术的博客大语言模型原理与工程实践：挖掘大语言模型潜能：有监督微调 1.背景介绍大语言模型（Large Language Models, LLMs）近年来在自然语言处理（NLP）领域取得了显著的进展。诸如GPT-3、BERT等模型在各种任务中表现出色...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月26日

悬赏问题

¥15 Questasim Error: (vcom-13)
¥15 船舶旋回实验matlab
¥30 SQL 数组，游标，递归覆盖原值
¥15 为什么我的数据接收的那么慢呀有没有完整的 hal 库并代码呀有的话能不能发我一份并且我用 printf 函数显示处理之后的数据，用 debug 就不能运行了呢
¥15 有关于推荐系统jupyter
¥20 gitlab 中文路径，无法下载
¥15 用动态规划算法均分纸牌
¥30 udp socket，bind 0.0.0.0 ，如何自动选取用户访问的服务器IP来回复数据
¥15 关于树的路径求解问题
¥15 yolo在训练时候出现File "D:\yolo\yolov5-7.0\train.py"line 638,in <module>

在进行命名实体识别模型微调后出现问题

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新