Rhyme_7 2022-11-20 15:29
浏览 0
已结题

KD神经网络的超参数

初学者,试图在本地,利用神经网络复现一下知识蒸馏。
数据集是MNIST
三层全链接神经网络
epoch=500
教师网络隐层1500个神经元
预测准确率99%
学生网络隐层1500个神经元
预测准确率89%

请问loos=(1-γ)TTsoft loos + γhard loss
γ,T取值多少合适
0.9 20准确率降到85%

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 11月28日
    • 创建了问题 11月20日

    悬赏问题

    • ¥15 DIFY API Endpoint 问题。
    • ¥20 sub地址DHCP问题
    • ¥15 delta降尺度计算的一些细节,有偿
    • ¥15 Arduino红外遥控代码有问题
    • ¥15 数值计算离散正交多项式
    • ¥30 数值计算均差系数编程
    • ¥15 redis-full-check比较 两个集群的数据出错
    • ¥15 Matlab编程问题
    • ¥15 训练的多模态特征融合模型准确度很低怎么办
    • ¥15 kylin启动报错log4j类冲突