qq_43485677 2020-07-30 11:12 采纳率: 20%
浏览 846
已采纳

用深度学习做文本分类,需要多大的样本量?准备自己构建数据集,正负样本比例最大不能大于多少?

自己构建数据集,所有想知道最低样本量,还有正负样本比例可能会失衡,所有比例最大是多少?

  • 写回答

1条回答 默认 最新

  • threenewbee 2020-07-31 08:20
    关注

    这个不可一概而论。看你是在什么场景下分类,如果是特定的一些内容,比如用户简单的评价做正面负面分类,很少的样本就可以了。
    如果要在自然语境中无限的分类,那么就需要很大的样本。
    另外和你的模型、模型的参数/超参数、由此得到的模型的泛化能力也有关,和你的优化算法也有关。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

    报告相同问题?

    悬赏问题

    • ¥15 (关键词-聊天软件)
    • ¥15 求大家看看这个编程的编法没有思路啊
    • ¥20 WSL打开图形化程序子窗口无法点击
    • ¥15 Jupyter Notebook 数学公式不渲染
    • ¥20 ERR_CACHE_MISS 确认重新提交表单
    • ¥20 关于vba使用HTMLfile执行js函数问题
    • ¥60 悬赏求解,通过实时现场摄像头的视频图像识别其他对家打出的麻将牌,识别麻将牌,识别牌墙位置,通过识别对家打出了什么牌
    • ¥15 关于#GPU jetson#的pcie驱动开发问题,如何解决?
    • ¥15 stm32f103zet6 串口5无法收发数据
    • ¥15 关于C语言使用线程队列实现多线程并发