讨厌代码! 2023-03-27 22:47 采纳率: 50%
浏览 74
已结题

Bert二分类结果分析

大家好,这是我基于pytorch的BERT二分类结果,两个类别分别是norisk(0)和risk(1),在标注的训练数据中,norisk句子的数量比risk句子的数量约为1:4。我使用了FocalLoss,设定的alpha值为0.95,用来改善数据不平衡的情况。
为什么risk类别的预测f1-score仍然为0?是由于什么原因呀?(已经跑了不下7次了,一直都是0,不知道怎么改变)

img

谢谢解答的朋友!

  • 写回答

3条回答 默认 最新

  • pzzhao 2023-03-27 22:59
    关注

    该回答引用自ChatGPT

    有几个可能的原因可以导致risk类别的预测f1-score始终为0:

    数据不平衡问题:尽管您使用了Focal Loss来改善数据不平衡问题,但如果risk类别的训练数据量非常少,模型可能仍然无法很好地学习该类别的特征。建议增加risk类别的训练数据量或采用数据增强技术,例如随机替换、删除、插入词汇等。

    超参数调节问题:除了alpha值,还有其他超参数需要进行调节,例如学习率、批次大小、隐藏层大小等。建议对这些超参数进行调整并观察结果。

    模型结构问题:BERT模型结构非常复杂,需要仔细调整和优化。您可以尝试使用其他的预训练模型,例如RoBERTa、ALBERT等,或者自行调整BERT模型的架构,例如修改隐藏层数、隐藏层大小等。

    标签错误问题:最后,也可能是标签错误导致risk类别的预测f1-score为0。建议再次检查标注数据,确保标签正确。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 3月28日
  • 已采纳回答 3月28日
  • 创建了问题 3月27日

悬赏问题

  • ¥20 wireshark抓不到vlan
  • ¥20 关于#stm32#的问题:需要指导自动酸碱滴定仪的原理图程序代码及仿真
  • ¥20 设计一款异域新娘的视频相亲软件需要哪些技术支持
  • ¥15 stata安慰剂检验作图但是真实值不出现在图上
  • ¥15 c程序不知道为什么得不到结果
  • ¥40 复杂的限制性的商函数处理
  • ¥15 程序不包含适用于入口点的静态Main方法
  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来