请问命名实体识别任务中如何在bilstm前加入embedding？

现有命名实体识别任务，想使用bilstm+crf训练，打算将NER模型解耦，分解为encoder和tagger，encoder负责文本特征变换，使用bilstm，tagger负责序列标注，使用crf，但是在使用bilstm前发现需要先进行embedding，

此为bilstm模型部分

此为crf模型部分

import torch
from transformers import BertTokenizer


class Config:
    def __init__(self):
        super(Config, self).__init__()
        self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

        self.bert_name = 'bert-base-cased'
        self.bert_path = 'emb'
        self.tokenizer = BertTokenizer.from_pretrained(self.bert_name, cache_dir=self.bert_path)

        self.pad_size = 128
        self.dropout = 0.5
        self.num_layers = 2

        self.batch_size = 16
        self.epoch_size = 1
        self.learning_rate = 2e-5
        self.weight_decay = 1e-4

        self.label2idx = dict()

        with open('data/label.txt', 'r', encoding='utf8') as file:
            tags = file.read().split('\n')
        for idx, t in enumerate(tags):
            if t:
                self.label2idx[t] = idx

        self.label_size = len(self.label2idx)
        self.tagger_input = 768


config = Config()

此为config.py
下为入口主函数文件

import torch
import random
import numpy as np

from config import config

from torch.utils.data import DataLoader
from util.dataTool import NERDataset

from util.model import BertModelEncoder, BiLSTMEncoder, BertBiLSTMEncoder, CRFTagger, SoftmaxTagger, NERModel
from util.trainer import train, test

from multiprocessing import cpu_count

# seed everything
# 设置随机数，保证相同环境下实验结果可复现
seed = 42
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed_all(seed)


if __name__ == '__main__':
    # 通过数据接口加载数据集并进行预处理
    print("Data Loading...")
    train_set = NERDataset('data/eng.train', config)
    test_set = NERDataset('data/eng.testa', config)
    val_set = NERDataset('data/eng.testb', config)

    # 计算CPU核心数量，设置为num_workers
    cpu_num = cpu_count()

    # 训练时使用DataLoader，方便获取mini-batch
    # batch_size：每次梯度更新使用的样本数量
    # drop_last：按照指定batch分割数据时，存在余数。训练时drop，测试时保留
    # shuffle：打乱数据集
    # pin_memory：将数据从CPU加载到GPU时，为该loader分配固定的显存，提高IO效率
    # num_workers：将数据加载到GPU的线程数量，合适的线程数量可以提高IO效率，从而提高GPU利用率
    train_loader = DataLoader(train_set, batch_size=config.batch_size,
                              drop_last=True, shuffle=True, pin_memory=True, num_workers=cpu_num)
    test_loader = DataLoader(test_set, batch_size=config.batch_size,
                             drop_last=False, shuffle=True, pin_memory=True, num_workers=cpu_num)
    val_loader = DataLoader(val_set, batch_size=config.batch_size,
                            drop_last=False, shuffle=True, pin_memory=True, num_workers=cpu_num)

    # encoder和tagger的初始化
    print("Model Loading...")
    # encoder = BertModelEncoder(config)
    encoder = BiLSTMEncoder(config)
    # encoder = BertBiLSTMEncoder(config)

    tagger = CRFTagger(config)
    # tagger = SoftmaxTagger(config)

    # 组装NER模型
    model = NERModel(encoder, tagger).to(config.device)

    # 设置优化器，常见的有SGD、Adam、RMSprop等
    optimizer = torch.optim.AdamW(params=model.parameters(),
                                  lr=config.learning_rate, weight_decay=config.weight_decay)

    # 通过训练接口训练模型
    print("Training")
    model = train(model, train_loader, val_loader, optimizer, config)

    # 测试
    test(model, test_loader, config)

请赐教，不胜感激。
具体代码可见仓库https://gitee.com/xin-yue-qin/resume-ner

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
YirongChen 2022-01-19 22:00
关注
可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 21:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
使用kashgari实现BERT+Bilstm命名实体识别，在保存模型时报错！！！求助！！！ python tensorflow 神经网络自然语言处理
2021-03-01 19:29

回答 5 已采纳你好。这个错误需要进入源码进行一下修正。我已经私信你了，请看一下。需要在D:\dev\anaconda\lib\site-packages\kashgari\tasks\abs_task_mode
使用TF2.4 构建bert-Bilstm-crf，出现这样的warning：“CRF Decoding does not work with KerasTensors in TF2.4”，怎么解决？ python tensorflow 自然语言处理
2022-05-19 21:17

回答 3 已采纳解决方法这是个警告，一般可能不影响但如果你想从问题上解决这个警告的话，或许可以尝试下安装这个tf2crf pip install tf2crf 然后 from tf2CRF import CRF
基于Bi-LSTM与CRF实现中文命名实体识别任务
2022-10-13 06:00

海洋之心的博客数据集分别命名为example.train,example.dev,example.test,保存在datasets目录下。1.训练集：包含文本和对应的标签，用于模型训练。2.验证集：包含文本和对应的标签，用于模型训练和参数调试。3.测试集：包含文本和...
tensorflow 怎么进行变长序列的embedding？ tensorflow 数据挖掘深度学习神经网络自然语言处理
2020-09-11 16:23

回答 1 已采纳 https://blog.csdn.net/qq_27825451/article/details/88991529
embedding的原理 matlab python 深度学习
2022-08-14 21:34

回答 2 已采纳 embedding的原理你可以去搜cbow和skip-gram，说白了就是用两边的字或词预测中间的，或者用中间的字或词预测两边的。第一，每个文本，我们可以取字也可以取词，以字为例，先生成字典{"以":
在多变量时序预测任务中，如何利用多头注意力机制计算各变量之间的相关系 python tensorflow 时序数据库
2023-04-04 20:05

回答 5 已采纳引用new bing作答：在多变量时序预测任务中，利用多头注意力机制求得各变量之间的相关系数，需要对输入的数据进行一些处理和调整。假设输入数据的维度为(batch_size, seq_len, num
[Python人工智能] 四十二.命名实体识别 (3)基于Bert+BiLSTM-CRF的中文实体识别万字详解（异常解决中）
2024-03-05 14:45

Eastmount的博客前文讲解如何实现中文命名实体识别研究，构建BiGRU-CRF模型实现。这篇文章将继续以中文语料为主，介绍融合Bert的实体识别研究，使用bert4keras和kears包来构建Bert+BiLSTM-CRF模型。然而，该代码最终结果有些问题，...
在编写flask接口封装人脸识别能力的时候，出现了一些问题 flask python
2022-12-22 16:11

回答 8 已采纳 ##你的函数中参数传错了，而且你并没有返回计算相似度的结果。我没有你的模型，用的自己的计算可以正常返回修改后的你试一下。有问题再看下 # -*- coding: utf-8 -*- impo
tensorflow中model.fit（）函数输入参数报错，如何解决？ python tensorflow 有问必答机器学习
2022-04-12 01:32

回答 2 已采纳 loss不是binary_crossentropy？
我可以在Golang中继承并重新定义方法吗？
2017-04-02 20:10

回答 1 已采纳 Can I subclass ... in Golang? Short answer: No. Go is not object oriented, therefore it has n
逐行讲解BiLSTM+CRF实现命名实体识别(NER)
2023-02-05 21:51

芒果不茫QAQ的博客使用BiLSTM+CRF做中文命名实体识别(NER)，数据处理、建立词表、模型构建、训练过程书写等，代码有详细注释，若有遗漏或不详细可评论补充。
如何在Symfony 2中嵌入子命名空间控制器的动作？ php symfony
2012-05-09 20:46

回答 3 已采纳 Either of these should work. Remember, backslashes in strings need to be escaped (i.e., doubled)
命名实体识别（NER）：BiLSTM-CRF原理介绍+Pytorch_Tutorial代码解析
2020-10-12 20:59

misite_J的博客本文较全面的介绍了命名实体识别（NER），包括NER定义、BiLSTM-CRF模型、Pytorch代码实现，未来将继续完善本文，以求涵盖NER众多方面。文章目录命名实体识别任务（NER）定义BiLSTM-CRF模型模型输入LSTMCRF真实路径...
详解BILSTM-CRF模型结构进行命名实体识别
2020-11-20 13:48

卖女孩的小火柴biu的博客 2.经由BILSTM特征提取，输出是每个单词对应的预测标签。 3.经CRF层约束，会对输出的分数进行校正，输出是最优标签序列。 Step1：Word Embedding 定义：Word Embedding是一个基于分布式假设的预训练模型。它假设两个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月17日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

请问命名实体识别任务中如何在bilstm前加入embedding？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新