数据集,其实就是coco数据集的节选:

第一行,文本包含了woman,所以是1类。像后面的man, boy, girl都是1类。1类就是people类。
第二行,包含了men,所以有1类;horse,所以是19类。19类就是horse类。
以此类推
有什么好的模型可以推荐一下吗。我尝试过BertForSequenceClassification,用huggingface的提供的transformers预训练模型,num_classes=19。并且这个模型太大了,有400多MB,要求模型要在100MB以内。