qq_43485677 2020-07-30 11:12 采纳率: 20%
浏览 873
已采纳

用深度学习做文本分类,需要多大的样本量?准备自己构建数据集,正负样本比例最大不能大于多少?

自己构建数据集,所有想知道最低样本量,还有正负样本比例可能会失衡,所有比例最大是多少?

  • 写回答

1条回答 默认 最新

  • threenewbee 2020-07-31 08:20
    关注

    这个不可一概而论。看你是在什么场景下分类,如果是特定的一些内容,比如用户简单的评价做正面负面分类,很少的样本就可以了。
    如果要在自然语境中无限的分类,那么就需要很大的样本。
    另外和你的模型、模型的参数/超参数、由此得到的模型的泛化能力也有关,和你的优化算法也有关。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错
  • ¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误,如何解决?
  • ¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
  • ¥15 c#逐行读取txt文本,但是每一行里面数据之间空格数量不同
  • ¥50 如何openEuler 22.03上安装配置drbd
  • ¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
  • ¥15 无线连接树莓派,无法执行update,如何解决?(相关搜索:软件下载)
  • ¥15 Windows11, backspace, enter, space键失灵
  • ¥15 cfx离心泵非稳态计算