纯氧羊 2022-05-24 18:07 采纳率: 57.1%
浏览 83
已结题

多标签分类数据集问题——如果训练集中多标签图像很少,多标签分类是否可行?

比如多标签分类,识别图像中的动物:猫、狗、兔子、老虎等等
而我的训练集中的大部分图像只包含了一种动物,有少数图像包含了多种动物,
那我用这个数据集做多标签分类是否可行?

  • 写回答

3条回答 默认 最新

  • youcans_ 人工智能领域优质创作者 2022-05-25 11:43
    关注

    1、训练集中大部分图像只包含一种动物,只要整个训练集能较好的覆盖所要分类的动物种类,就可以进行分类。
    如果大部分图像都是某一种动物——猫,而其它种类动物的样本都很少,则训练效果不好。
    如果虽然每张图片中包含一种动物,但各种动物,猫,狗,兔子 的样本数量都不少,那就没问题。
    2、少数图像包含了多种动物,有几种处理方式:
    (1)把包含多种动物的图片设为单独一类,进行学习和分类;这样的学习效果最好。
    (2)把包含多种动物的图片,裁剪后作为单独样本,分别标识为对应的动物分类。这样的分类效果最好,但如果遇到多种动物的图片还是会识别错误。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
  • 斯曦巍峨 Python领域新星创作者 2022-05-24 18:27
    关注

    多标签分类任务指的是一条数据可能有一个或者多个标签,因此你的数据集应该是可行的。

    评论
  • 一朵明媚的茶树菇 2022-05-24 20:41
    关注

    遇到题主这种情况,是可以直接进行多标签分类的。但若追求高精度,可以对数据集进行一定的预处理:
    1.若包含多种动物的图像对应的标签只有一个,可根据对应label对图像进行裁剪,裁去无关冗余背景;
    2.也可能同一张包含猫狗兔子的image,数据集中重复出现三次,且三张images的label都不同,则可根据分别的label进行裁剪;
    3.若仅极少数图像包含多种动物,可直接剔除这一部分数据

    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 6月2日
  • 已采纳回答 5月25日
  • 创建了问题 5月24日

悬赏问题

  • ¥15 我用C语言easyx图形库绘制了一个3d游戏方框透视,但进入游戏时候鼠标准星对准方框边缘 鼠标光标就会弹出来这是啥情况怎样让光标对准绘制的方框点击鼠标不弹出光标好烦这样
  • ¥20 用Power Query整合的问题
  • ¥20 基于python进行多背包问题的多值编码
  • ¥15 相同型号电脑与配置,发现主板有一台貌似缺少了好多元器件似的,会影响稳定性和使用寿命吗?
  • ¥15 要求编写稀疏矩阵A的转置矩阵的算法
  • ¥15 编写满足以下要求的停车场管理程序,设停车场只有一个可停放n辆车的狭窄通道且只有一个大门可供车辆进出。
  • ¥15 C语言:数据子序列基础版
  • ¥20 powerbulider 导入excel文件,显示不完整
  • ¥15 用keil调试程序保证结果进行led相关闪烁
  • ¥15 paddle训练自己的数据loss降不下去