讨厌代码! 2023-03-27 22:47 采纳率: 50%
浏览 74
已结题

Bert二分类结果分析

大家好,这是我基于pytorch的BERT二分类结果,两个类别分别是norisk(0)和risk(1),在标注的训练数据中,norisk句子的数量比risk句子的数量约为1:4。我使用了FocalLoss,设定的alpha值为0.95,用来改善数据不平衡的情况。
为什么risk类别的预测f1-score仍然为0?是由于什么原因呀?(已经跑了不下7次了,一直都是0,不知道怎么改变)

img

谢谢解答的朋友!

  • 写回答

3条回答 默认 最新

  • pzzhao 2023-03-27 22:59
    关注

    该回答引用自ChatGPT

    有几个可能的原因可以导致risk类别的预测f1-score始终为0:

    数据不平衡问题:尽管您使用了Focal Loss来改善数据不平衡问题,但如果risk类别的训练数据量非常少,模型可能仍然无法很好地学习该类别的特征。建议增加risk类别的训练数据量或采用数据增强技术,例如随机替换、删除、插入词汇等。

    超参数调节问题:除了alpha值,还有其他超参数需要进行调节,例如学习率、批次大小、隐藏层大小等。建议对这些超参数进行调整并观察结果。

    模型结构问题:BERT模型结构非常复杂,需要仔细调整和优化。您可以尝试使用其他的预训练模型,例如RoBERTa、ALBERT等,或者自行调整BERT模型的架构,例如修改隐藏层数、隐藏层大小等。

    标签错误问题:最后,也可能是标签错误导致risk类别的预测f1-score为0。建议再次检查标注数据,确保标签正确。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 3月28日
  • 已采纳回答 3月28日
  • 创建了问题 3月27日

悬赏问题

  • ¥20 keepalive配置业务服务双机单活的方法。业务服务一定是要双机单活的方式
  • ¥50 关于多次提交POST数据后,无法获取到POST数据参数的问题
  • ¥15 win10,这种情况怎么办
  • ¥15 如何在配置使用Prettier的VSCode中通过Better Align插件来对齐等式?(相关搜索:格式化)
  • ¥100 在连接内网VPN时,如何同时保持互联网连接
  • ¥15 MATLAB中使用parfor,矩阵Removal的有效索引在parfor循环中受限制
  • ¥20 Win 10 LTSC 1809版本如何无损提升到20H1版本
  • ¥50 win10 LTSC 虚拟键盘不弹出
  • ¥30 微信小程序请求失败,网页能正常带锁访问
  • ¥15 Matlab求解微分方程,如何用fish2d进行预优?