训练集和验证集准确率可以达到>90%但是测试集的准确率只达到了30%多,无论是textcnn还是bi-lstm+attention,模型准确率都是这样。
泛化的措施比如加l2正则,dropout,BN层,数据增强等方式都用了,但是还是这样。
数据都是一个数据集随机划分的。
有没有可能是数据训练的语句和标签的关系不大导致的,不能通过语句推出这个标签(之前的标签都是不同人打的,可能规则不一样,不准确?)
各位有没有什么思路或想法赐教下?
训练集和验证集准确率可以达到>90%但是测试集的准确率只达到了30%多,无论是textcnn还是bi-lstm+attention,模型准确率都是这样。
泛化的措施比如加l2正则,dropout,BN层,数据增强等方式都用了,但是还是这样。
数据都是一个数据集随机划分的。
有没有可能是数据训练的语句和标签的关系不大导致的,不能通过语句推出这个标签(之前的标签都是不同人打的,可能规则不一样,不准确?)
各位有没有什么思路或想法赐教下?