keras下self-attention和Recall, F1-socre值实现问题？

麻烦大神帮忙看一下：
(1)为何返回不了Precise, Recall, F1-socre值？
(2)为何在CNN前加了self-attention层，训练后的acc反而降低在0.78上下？
【研一小白求详解，万分感谢大神】

import os                                   #导入os模块，用于确认文件是否存在
import numpy as np
from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences
from keras.callbacks import Callback
from sklearn.metrics import f1_score, precision_score, recall_score

maxlen = 380#句子长截断为100
training_samples = 20000#在 200 个样本上训练
validation_samples = 5000#在 10 000 个样本上验证
max_words = 10000#只考虑数据集中前 10 000 个最常见的单词

def dataProcess():
    imdb_dir = 'data/aclImdb'#基本路径，经常要打开这个
    #处理训练集
    train_dir = os.path.join(imdb_dir, 'train')#添加子路径
    train_labels = []
    train_texts = []
    for label_type in ['neg', 'pos']:
        dir_name = os.path.join(train_dir, label_type)
        for fname in os.listdir(dir_name):#获取目录下所有文件名字
            if fname[-4:] == '.txt':
                f = open(os.path.join(dir_name, fname),'r',encoding='utf8')
                train_texts.append(f.read())
                f.close()
                if label_type == 'neg':
                    train_labels.append(0)
                else:train_labels.append(1)
    #处理测试集
    test_dir = os.path.join(imdb_dir, 'test')
    test_labels = []
    test_texts = []
    for label_type in ['neg', 'pos']:
        dir_name = os.path.join(test_dir, label_type)
        for fname in sorted(os.listdir(dir_name)):
            if fname[-4:] == '.txt':
                f = open(os.path.join(dir_name, fname),'r',encoding='utf8')
                test_texts.append(f.read())
                f.close()
                if label_type == 'neg':
                    test_labels.append(0)
                else:
                    test_labels.append(1)

    #对数据进行分词和划分训练集和数据集
    tokenizer = Tokenizer(num_words=max_words)
    tokenizer.fit_on_texts(train_texts)#构建单词索引结构

    sequences = tokenizer.texts_to_sequences(train_texts)#整数索引的向量化模型
    word_index = tokenizer.word_index#索引字典
    print('Found %s unique tokens.' % len(word_index))
    data = pad_sequences(sequences, maxlen=maxlen)
    train_labels = np.asarray(train_labels)#把列表转化为数组
    print('Shape of data tensor:', data.shape)
    print('Shape of label tensor:', train_labels.shape)
    indices = np.arange(data.shape[0])#评论顺序0，1，2，3
    np.random.shuffle(indices)#把评论顺序打乱3，1，2，0
    data = data[indices]
    train_labels = train_labels[indices]
    x_train = data[:training_samples]
    y_train = train_labels[:training_samples]
    x_val = data[training_samples: training_samples + validation_samples]
    y_val = train_labels[training_samples: training_samples + validation_samples]

    #同样需要将测试集向量化
    test_sequences = tokenizer.texts_to_sequences(test_texts)
    x_test = pad_sequences(test_sequences, maxlen=maxlen)
    y_test = np.asarray(test_labels)

    return x_train,y_train,x_val,y_val,x_test,y_test,word_index


embedding_dim = 100#特征数设为100

#"""将预训练的glove词嵌入文件，构建成可以加载到embedding层中的嵌入矩阵"""
def load_glove(word_index):#导入glove的词向量
    embedding_file='data/glove.6B'
    embeddings_index={}#定义字典
    f = open(os.path.join(embedding_file, 'glove.6B.100d.txt'),'r',encoding='utf8')
    for line in f:
        values = line.split()
        word = values[0]
        coefs = np.asarray(values[1:], dtype='float32')
        embeddings_index[word] = coefs
    f.close()
#    """转化为矩阵：构建可以加载到embedding层中的嵌入矩阵，形为(max_words（单词数）, embedding_dim（向量维数）) """
    embedding_matrix = np.zeros((max_words, embedding_dim))
    for word, i in word_index.items():#字典里面的单词和索引
        if i >= max_words:continue
        embedding_vector = embeddings_index.get(word)
        if embedding_vector is not None:
            embedding_matrix[i] = embedding_vector
    return embedding_matrix

if __name__ == '__main__':
    x_train, y_train, x_val, y_val,x_test,y_test, word_index = dataProcess()

embedding_matrix=load_glove(word_index)
    #可以把得到的嵌入矩阵保存起来，方便后面fine-tune"""
    # #保存

from keras.models import Sequential
from keras.layers.core import Dense,Dropout,Activation,Flatten
from keras.layers.recurrent import LSTM
from keras.layers import Embedding
from keras.layers import Bidirectional
from keras.layers import Conv1D, MaxPooling1D

import keras
from keras_self_attention import SeqSelfAttention

model = Sequential()
model.add(Embedding(max_words, embedding_dim, input_length=maxlen))
model.add(SeqSelfAttention(attention_activation='sigmod'))
model.add(Conv1D(filters = 64, kernel_size = 5, padding = 'same', activation = 'relu'))
model.add(MaxPooling1D(pool_size = 4))
model.add(Dropout(0.25))
model.add(Bidirectional(LSTM(64,activation='tanh',dropout=0.2,recurrent_dropout=0.2)))
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(1, activation='sigmoid'))
model.summary()

model.layers[0].set_weights([embedding_matrix])
model.layers[0].trainable = False

model.compile(optimizer='rmsprop',
                  loss='binary_crossentropy',
                  metrics=['acc'])

class Metrics(Callback):
    def on_train_begin(self, logs={}):
        self.val_f1s = []
        self.val_recalls = []
        self.val_precisions = []

    def on_epoch_end(self, epoch, logs={}):
        val_predict = (np.asarray(self.model.predict(self.validation_data[0]))).round()
        val_targ = self.validation_data[1]
        _val_f1 = f1_score(val_targ, val_predict)
        _val_recall = recall_score(val_targ, val_predict)
        _val_precision = precision_score(val_targ, val_predict)
        self.val_f1s.append(_val_f1)
        self.val_recalls.append(_val_recall)
        self.val_precisions.append(_val_precision)
        return

metrics = Metrics()

history = model.fit(x_train, y_train,
                    epochs=10,
                    batch_size=32,
                    validation_data=(x_val, y_val),
                   callbacks=[metrics])
model.save_weights('pre_trained_glove_model.h5')#保存结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-10-29 05:58
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
这篇博客也许可以解决你的问题👉 ：深度学习 — keras 性能评价指标实现（Precision，Recall，f1）

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何在深度学习中出现的keras库问题？(语言-python) python 深度学习
2023-04-02 16:33

回答 2 已采纳好问题！！抱歉我也不太懂，你问问chatGPT吧：https://new.quke123.com/ 或者其他Python群友：https://app.yinxiang.com
tensorflow.keras打开SGD的问题，如何解决？ keras python tensorflow 有问必答
2022-03-19 21:27

回答 3 已采纳是不是安装的模块版本不对
使用Keras编写的LSTM，训练时出现loss: nan - val_loss: nan，该如何调整？ keras lstm 有问必答深度学习
2022-05-03 18:40

回答 2 已采纳原数据第一列是时间形式的20220503这种，在读数据之后进行下面操作，你的数据是简单的1 2 34这种，数据可能在处理过程丢失或者变成nan了，你可以一步步看看每次处理后当前的数据现在是什么格式 d
NLP（二十五）实现ALBERT+Bi-LSTM+CRF模型
2020-03-12 21:49

山阴少年的博客在文章NLP（二十四）利用ALBERT实现命名实体识别中，笔者介绍了ALBERT+Bi-LSTM模型在命名实体识别方面的应用。在本文中，笔者将介绍如何实现ALBERT+Bi-LSTM+CRF模型，以及在人民日报NER数据集和CLUENER数据...
在windows和ubuntu上安装keras的区别？ keras
2021-06-14 18:23

回答 1 已采纳可以安装，只是兼容问题比较多点，可以尝试使用anaco
请问tensorflow中的tf.keras.models.Model和tf.keras.Model有什么区别啊？ keras tensorflow 深度学习
2022-10-27 20:21

回答 2 已采纳没有看过源码，但是我的使用经验告诉我这两个是一样的，很有可能是同一个代码封装了两个入口。
用Keras实现圆心的识别，输出层要怎么写？ tensorflow 人工智能深度学习神经网络
2019-07-10 15:22

回答 2 已采纳 softmax层一般是做分类，如果你要识别圆心，并且你的样本的标记就是圆心的坐标，那么激活函数可以选择relu 或者 tanh，最后输出值的维度=2，也就是输出一个x一个y
MATLAB算法实战应用案例精讲-【人工智能】语义分割（最终篇）(附实战应用案例及代码实现)
2023-01-02 17:44

林聪木的博客 SETR 是首个在分割任务上超越 CNN 的 Transformer 网络结构，该论文作者认为，虽然 FCN 及其...HRNet 通过将由高到低的分辨率特征结合起来的方式，实现对高分辨率特征的保留，并且不同分辨率的特征也进行了信息交换。
Keras 怎么把embeding输入层去掉直接变成one-hot输入 keras python 神经网络
2021-09-03 16:53

回答 1 已采纳看报错，期待的0层GRU输入是3维的数组，但是接收到的是2维的
关于Keras模型导出遇到Model expects 0 top-level weight(s). Received 1 saved top-level weight(s)的问题！ keras tensorflow
2022-04-17 11:12

回答 1 已采纳哦不好意思大家！我解决了，是在声明model时没有传入相关的参数，把第五行改成我定义的 model = FCN.get_fcn8s_model(input_shape=(256, 256, 3
tensorflow.keras训练问题 keras python tensorflow
2023-03-05 18:39

回答 2 已采纳尝试一下调整参数吧，或者加层数试试
NLP（四十五）R-BERT在人物关系分类上的尝试及Keras代码复现
2021-04-01 15:57

山阴少年的博客本文将介绍关系分类模型R-BERT和该模型在人物关系数据集上的表现，以及该模型的Keras代码复现。关系分类任务关系分类属于NLP任务中的文本分类，不同之处在于，关系分类提供了文本和实体。比如下面的例子：...
tensorflow.keras训练模型预测问题 keras python tensorflow
2023-03-04 11:08

回答 2 已采纳这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_los
BERT |（3）BERT模型的使用--pytorch的代码解释
2021-03-13 10:47

郭畅小渣渣的博客从名字可以看出来这个是做一个中文文本分类的的任务，具体就是做新闻文本分类的任务，具体有以下几个类，属于多分类的问题目录一、如何让你下载的代码跑起来二、bert模型的使用模型代码学习-CLS文本分类-...
云计算实战应用案例精讲-【深度学习】多模态融合（论文篇四）
2023-04-30 00:30

林聪木的博客能凸显数据特征，挖掘生理信号的时频域特征和时序特征的有效深度特征。学家们就情绪的基本特性达成了共识，认为情绪与人的生理变化相关联，持续时间短，连接和参数，网络模型的复杂度低，易于训练，该优势对于输入细...
没有解决我的问题, 去提问

悬赏问题

¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 关于大棚监测的pcb板设计
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器
¥15 如何用Labview在myRIO上做LCD显示？(语言-开发语言)
¥15 Vue3地图和异步函数使用