请问命名实体识别任务中如何在bilstm前加入embedding？

现有命名实体识别任务，想使用bilstm+crf训练，打算将NER模型解耦，分解为encoder和tagger，encoder负责文本特征变换，使用bilstm，tagger负责序列标注，使用crf，但是在使用bilstm前发现需要先进行embedding，

此为bilstm模型部分

此为crf模型部分

import torch
from transformers import BertTokenizer


class Config:
    def __init__(self):
        super(Config, self).__init__()
        self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

        self.bert_name = 'bert-base-cased'
        self.bert_path = 'emb'
        self.tokenizer = BertTokenizer.from_pretrained(self.bert_name, cache_dir=self.bert_path)

        self.pad_size = 128
        self.dropout = 0.5
        self.num_layers = 2

        self.batch_size = 16
        self.epoch_size = 1
        self.learning_rate = 2e-5
        self.weight_decay = 1e-4

        self.label2idx = dict()

        with open('data/label.txt', 'r', encoding='utf8') as file:
            tags = file.read().split('\n')
        for idx, t in enumerate(tags):
            if t:
                self.label2idx[t] = idx

        self.label_size = len(self.label2idx)
        self.tagger_input = 768


config = Config()

此为config.py
下为入口主函数文件

import torch
import random
import numpy as np

from config import config

from torch.utils.data import DataLoader
from util.dataTool import NERDataset

from util.model import BertModelEncoder, BiLSTMEncoder, BertBiLSTMEncoder, CRFTagger, SoftmaxTagger, NERModel
from util.trainer import train, test

from multiprocessing import cpu_count

# seed everything
# 设置随机数，保证相同环境下实验结果可复现
seed = 42
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed_all(seed)


if __name__ == '__main__':
    # 通过数据接口加载数据集并进行预处理
    print("Data Loading...")
    train_set = NERDataset('data/eng.train', config)
    test_set = NERDataset('data/eng.testa', config)
    val_set = NERDataset('data/eng.testb', config)

    # 计算CPU核心数量，设置为num_workers
    cpu_num = cpu_count()

    # 训练时使用DataLoader，方便获取mini-batch
    # batch_size：每次梯度更新使用的样本数量
    # drop_last：按照指定batch分割数据时，存在余数。训练时drop，测试时保留
    # shuffle：打乱数据集
    # pin_memory：将数据从CPU加载到GPU时，为该loader分配固定的显存，提高IO效率
    # num_workers：将数据加载到GPU的线程数量，合适的线程数量可以提高IO效率，从而提高GPU利用率
    train_loader = DataLoader(train_set, batch_size=config.batch_size,
                              drop_last=True, shuffle=True, pin_memory=True, num_workers=cpu_num)
    test_loader = DataLoader(test_set, batch_size=config.batch_size,
                             drop_last=False, shuffle=True, pin_memory=True, num_workers=cpu_num)
    val_loader = DataLoader(val_set, batch_size=config.batch_size,
                            drop_last=False, shuffle=True, pin_memory=True, num_workers=cpu_num)

    # encoder和tagger的初始化
    print("Model Loading...")
    # encoder = BertModelEncoder(config)
    encoder = BiLSTMEncoder(config)
    # encoder = BertBiLSTMEncoder(config)

    tagger = CRFTagger(config)
    # tagger = SoftmaxTagger(config)

    # 组装NER模型
    model = NERModel(encoder, tagger).to(config.device)

    # 设置优化器，常见的有SGD、Adam、RMSprop等
    optimizer = torch.optim.AdamW(params=model.parameters(),
                                  lr=config.learning_rate, weight_decay=config.weight_decay)

    # 通过训练接口训练模型
    print("Training")
    model = train(model, train_loader, val_loader, optimizer, config)

    # 测试
    test(model, test_loader, config)

请赐教，不胜感激。
具体代码可见仓库https://gitee.com/xin-yue-qin/resume-ner

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
YirongChen 2022-01-19 22:00
关注
可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问命名实体识别任务中如何在bilstm前加入embedding？ lstm nlp 自然语言处理
2022-01-17 21:39

回答 1 已采纳可以把BERT的Embedding层拿来用，也可以把BEET的输出视为embedding，也可以自己使用NN..Embedding定义一层Embedding层，自己进行训练
使用kashgari实现BERT+Bilstm命名实体识别，在保存模型时报错！！！求助！！！ python tensorflow 神经网络自然语言处理
2021-03-01 19:29

回答 5 已采纳你好。这个错误需要进入源码进行一下修正。我已经私信你了，请看一下。需要在D:\dev\anaconda\lib\site-packages\kashgari\tasks\abs_task_mode
tensorflow 怎么进行变长序列的embedding？ tensorflow 数据挖掘深度学习神经网络自然语言处理
2020-09-11 16:23

回答 1 已采纳 https://blog.csdn.net/qq_27825451/article/details/88991529
基于Bi-LSTM与CRF实现中文命名实体识别任务
2022-10-13 06:00

海洋之心的博客数据集分别命名为example.train,example.dev,example.test,保存在datasets目录下。1.训练集：包含文本和对应的标签，用于模型训练。2.验证集：包含文本和对应的标签，用于模型训练和参数调试。3.测试集：包含文本和...
使用TF2.4 构建bert-Bilstm-crf，出现这样的warning：“CRF Decoding does not work with KerasTensors in TF2.4”，怎么解决？ python tensorflow 自然语言处理
2022-05-19 21:17

回答 3 已采纳解决方法这是个警告，一般可能不影响但如果你想从问题上解决这个警告的话，或许可以尝试下安装这个tf2crf pip install tf2crf 然后 from tf2CRF import CRF
embedding的原理 matlab python 深度学习
2022-08-14 21:34

回答 2 已采纳 embedding的原理你可以去搜cbow和skip-gram，说白了就是用两边的字或词预测中间的，或者用中间的字或词预测两边的。第一，每个文本，我们可以取字也可以取词，以字为例，先生成字典{"以":
在多变量时序预测任务中，如何利用多头注意力机制计算各变量之间的相关系 python tensorflow 时序数据库
2023-04-04 20:05

回答 5 已采纳引用new bing作答：在多变量时序预测任务中，利用多头注意力机制求得各变量之间的相关系数，需要对输入的数据进行一些处理和调整。假设输入数据的维度为(batch_size, seq_len, num
命名实体识别（NER）：BiLSTM-CRF原理介绍+Pytorch_Tutorial代码解析
2020-10-12 20:59

misite_J的博客本文较全面的介绍了命名实体识别（NER），包括NER定义、BiLSTM-CRF模型、Pytorch代码实现，未来将继续完善本文，以求涵盖NER众多方面。文章目录命名实体识别任务（NER）定义BiLSTM-CRF模型模型输入LSTMCRF真实路径...
在编写flask接口封装人脸识别能力的时候，出现了一些问题 flask python
2022-12-22 16:11

回答 8 已采纳 ##你的函数中参数传错了，而且你并没有返回计算相似度的结果。我没有你的模型，用的自己的计算可以正常返回修改后的你试一下。有问题再看下 # -*- coding: utf-8 -*- impo
我可以在Golang中继承并重新定义方法吗？
2017-04-02 20:10

回答 1 已采纳 Can I subclass ... in Golang? Short answer: No. Go is not object oriented, therefore it has n
如何在Symfony 2中嵌入子命名空间控制器的动作？ php symfony
2012-05-09 20:46

回答 3 已采纳 Either of these should work. Remember, backslashes in strings need to be escaped (i.e., doubled)
详解BILSTM-CRF模型结构进行命名实体识别
2020-11-20 13:48

卖女孩的小火柴biu的博客 2.经由BILSTM特征提取，输出是每个单词对应的预测标签。 3.经CRF层约束，会对输出的分数进行校正，输出是最优标签序列。 Step1：Word Embedding 定义：Word Embedding是一个基于分布式假设的预训练模型。它假设两个...
tensorflow中model.fit（）函数输入参数报错，如何解决？ python tensorflow 有问必答机器学习
2022-04-12 01:32

回答 2 已采纳 loss不是binary_crossentropy？
逐行讲解BiLSTM+CRF实现命名实体识别(NER)
2023-02-05 21:51

芒果不茫QAQ的博客使用BiLSTM+CRF做中文命名实体识别(NER)，数据处理、建立词表、模型构建、训练过程书写等，代码有详细注释，若有遗漏或不详细可评论补充。
命名实体识别任务：BiLSTM+CRF part2
2021-07-14 17:58

あずにゃん的博客 人工智能AI：Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战（不定时更新） 1.离线部分中的命名实体的审核模型 1.命名实体的审核模型：训练RNN模型让其学会判断结构化的未审核数据中的疾病名/...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月17日

悬赏问题

¥15 网络设备配置与管理这个该怎么弄
¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器

请问命名实体识别任务中如何在bilstm前加入embedding？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新