目前已用JNLPBA数据集对biobert 模型进行训练,训练已结束,但是训练结果不是很理想(如图)
准确率还算可以,但是召回率和F1值不是很好,validation loss 也比较高,想优化这个模型,应该怎样好呢,模型参数在下图(2),希望各位给点建议。然后再想做一个对比试验,不知道拿这个数据集在不同的模型上训练好还是拿不同的几个数据集去训练一个模型然后对它进行比较,或者拿两三个数据集和两三个模型分别进行训练,比较最后的性能。


目前已用JNLPBA数据集对biobert 模型进行训练,训练已结束,但是训练结果不是很理想(如图)
准确率还算可以,但是召回率和F1值不是很好,validation loss 也比较高,想优化这个模型,应该怎样好呢,模型参数在下图(2),希望各位给点建议。然后再想做一个对比试验,不知道拿这个数据集在不同的模型上训练好还是拿不同的几个数据集去训练一个模型然后对它进行比较,或者拿两三个数据集和两三个模型分别进行训练,比较最后的性能。


关注引自免费微信小程序:皆我百晓生
针对您提供的信息,我们可以从多个方面尝试优化您的模型。首先,让我们回顾一下您目前的设置,并提供一些可能的改进策略:
learning_rate = 1e-5
weight_decay = 0.001
batch_size = 16 # 原始值未知,这里只是一个示例
num_train_epochs = 10 # 如果6个周期还不够,尝试增加这个数值
Early Stopping:启用早停(EarlyStopping)。当验证损失不再显著降低时,停止训练,防止过拟合。
Dropout:在BiBERT模型中加入dropout层,以减轻过拟合。
数据增强:尝试使用数据扩增技术,如随机截断、替换等,以增加训练样本的多样性。
预处理优化:重新审视预处理步骤,确保文本编码正确且一致。
模型融合:尝试使用不同超参数配置训练多份模型,然后通过投票或者其他方法进行模型融合。
对于对比试验,您可以选择以下几种方式:
请根据实际情况调整这些策略,并记录每种变化带来的效果。此外,注意观察模型是否在训练过程中过拟合,可以通过监测验证集上的表现来判断。如果模型在训练初期就开始在验证集上表现不佳,可能是由于过拟合或者数据分布不均衡导致的,这时可以考虑使用正则化、调整学习率或进行类别平衡的方法。