foxnes 2021-04-05 13:09 采纳率: 0%
浏览 154

多任务学习样本标签极不均衡,冻结分支训练可行吗?

用多任务学习进行分类,比如任务A是分类3种风格,如阳光、低调、"其他风格",任务B是分类3种款式,如牛仔裤、西裤、"其他款式"。

任一样本被标记了风格和款式两个标签,但是95%的样本标签都是 任一风格+其他裤子 或者 任一裤子+其他风格 这样的。讲得可能不是很清楚,下图帮助理解:

这样数据集中阳光和低调、牛仔裤和西裤之间数量差不多,但是"其他款式"和"其他风格"占比非常大。

由于这是多任务学习网络,可不可一次只训练一个分支,即把另一个分支每个神经元的权重调成0,或者把另一个分支冻结,来进行训练?

或者还有没有其他更好的办法?

补充:

上面提到的数据集是个假想的例子,实际数据集中的标签要多得多。

我有考虑过数据增强和调样本权重。一开始我用了数据集中较少标签(只有款式和面料),训练出来的模型的F1值大小排序约为:数据增强>样本调权>数据增强+样本调权。

然后我打算使用更多标签(款式、面料、贴图、风格),并只用了数据增强,最后模型把他们全部都预测为了其他分类。

  • 写回答

1条回答 默认 最新

  • sunshineone128 2021-09-13 21:50
    关注

    我能想到的是一个任务数据增强,一个任务改变loss。。。。。。可以只用数据增强吗?我的多任务分类,用数据增强一个任务是平衡了,但是其他任务不平衡了

    评论

报告相同问题?

悬赏问题

  • ¥15 矩阵加法的规则是两个矩阵中对应位置的数的绝对值进行加和
  • ¥15 活动选择题。最多可以参加几个项目?
  • ¥15 飞机曲面部件如机翼,壁板等具体的孔位模型
  • ¥15 vs2019中数据导出问题
  • ¥20 云服务Linux系统TCP-MSS值修改?
  • ¥20 关于#单片机#的问题:项目:使用模拟iic与ov2640通讯环境:F407问题:读取的ID号总是0xff,自己调了调发现在读从机数据时,SDA线上并未有信号变化(语言-c语言)
  • ¥20 怎么在stm32门禁成品上增加查询记录功能
  • ¥15 Source insight编写代码后使用CCS5.2版本import之后,代码跳到注释行里面
  • ¥50 NT4.0系统 STOP:0X0000007B
  • ¥15 想问一下stata17中这段代码哪里有问题呀