关于#深度学习知识蒸馏算法loss函数计算#的问题？

深度学习中的知识蒸馏算法loss函数计算哪种是正确的？

hard_loss=nn.CrossEntropyLoss()
soft_loss=nn.KLDivLoss(reduction="batchmean")
loss=hard_loss(student_out,label)
ditillation_loss=soft_loss(F.softmax(student_out/T,dim=1),F.softmax(teacher_output/T,dim=1))

方式一：

loss_total = loss*alpha+ditillation_loss*(1-alpha)

方式二：

loss_total = loss*alpha+ditillation_loss(T*T*2)*(1-alpha)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
kakaccys 2022-08-12 18:56
关注
原论文是第一种，所以用第一种肯定没问题，第二种也有人用，主要是为了保证两个loss贡献差不多，毕竟softloss里有做平滑，所以都可以哈，还是要看哪种收敛更快，效果很好

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于#深度学习知识蒸馏算法loss函数计算#的问题？ python 人工智能深度学习
2022-08-12 14:57

回答 1 已采纳原论文是第一种，所以用第一种肯定没问题，第二种也有人用，主要是为了保证两个loss贡献差不多，毕竟softloss里有做平滑，所以都可以哈，还是要看哪种收敛更快，效果很好
关于#深度学习#的问题：用adaboost或者xgboost算法把pytorch上的三个网络集成 pytorch 深度学习神经网络
2023-02-19 15:19

回答 1 已采纳对于集成多个PyTorch模型，可以使用以下步骤： 1.定义数据集并进行数据预处理。 2.分别定义和训练每个模型。可以使用不同的超参数和损失函数来训练每个模型以提高模型的多样性。 3.在每个模型上进行
关于#算法#的问题，如何解决？ linux nosql 算法
2022-11-21 10:44

回答 2 已采纳 class Solution { public: int maxEvents(vector<vector<int>>& events) { sort(
计算摄影：基于深度学习的畸变校正
2021-12-01 07:00

3Ｄ视觉工坊的博客点击上方“3D视觉工坊”，选择“星标”干货第一时间送达在手机中的计算摄影4-超广角畸变校正中，我为你描述了广角镜头的镜头畸变校正和透视畸变校正，尤其是花了很多篇幅讲述施易昌等人的论文如何校...
关于#学习#的问题，如何解决？(语言-matlab) matlab 图像处理算法
2023-03-13 17:00

回答 4 已采纳看看
关于#机器学习#的问题，如何解决？机器学习算法
2023-01-01 00:36

回答 2 已采纳我现在写，望采纳！！点击该回答右侧的“采纳”按钮即可采纳！！这是一个比较全面的任务，需要用到 Python 中的不同机器学习库和模型来完成。对于第一类数据集，我们可以使用 NumPy 库来生成数据
关于#优化算法#的问题，如何解决？ leetcode python 有问必答算法
2022-07-30 14:20

回答 2 已采纳时间复杂度为O(n4),一般超过O(n3)算法上就存在问题。参考： class UnionFind: def __init__(self, n: int): self.pare
如何训练一个 BERT 深度学习语言模型?
2023-09-11 01:14

禅与计算机程序设计艺术的博客本文作者是资深人工智能专家、资深程序员和软件架构师，他主要从事机器学习、深度学习以及自然语言处理领域的研究工作。近年来由于在自然语言处理、机器学习和图像识别等领域的突破性进展，人们越来越重视对人类语言...
SE-SSD："知识蒸馏"--助力3D目标检测问鼎SOTA
2021-11-09 07:00

3Ｄ视觉工坊的博客同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪...
深入理解计算机视觉中的损失函数
2022-03-27 20:23

Tom Hardy的博客在过去的十年中，在深度学习方面的创新，大量数据的方便获取以及GPU的使用已经将计算机视觉领域推到了聚光灯下。它甚至开始在一些任务中实现“超人”的性能，比如人脸识别和手写文本识别。(事实上，如今登机的自动...
IJCAI 2021 | 中科院计算所：自监督增强的知识蒸馏方法
2022-02-22 17:00

PaperWeekly的博客 知识蒸馏作为模型压缩里的一项重要技术，在学术界和工业界都得到了广泛的研究。近日，AI Drive 邀请中科院计算所在读博士生杨传广，分享其在 IJCAI 2021 上发表的最新工作：自监督...
【技术应用】模型微调：如何利用深度学习框架进行模型微调？
2023-07-14 02:28

禅与计算机程序设计艺术的博客作者：禅与计算机程序设计艺术模型微调（fine-tuning）是一种迁移学习方法，在不修改网络结构、直接对其最后几层的参数进行微调的同时，保留原网络前面的层参数不变，...最近，深度学习领域大量涌现了诸如ResNet、VGG
PKD-Bert：基于多层网络的Bert知识蒸馏
2020-11-30 23:45

zenRRan的博客来自：NLP从入门到放弃PKD[1]核心点就是不仅仅从Bert（老师网络）的最后输出层学习知识去做蒸馏，它还另加了一部分，就是从Bert的中间层去学习。简单说，PKD的知识来源有两部分：...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月12日

悬赏问题

¥15 求指导ADS低噪放设计
¥15 CARSIM前车变道设置
¥50 三种调度算法报错有实例
¥15 关于#python#的问题，请各位专家解答！
¥200 询问：python实现大地主题正反算的程序设计，有偿
¥15 smptlib使用465端口发送邮件失败
¥200 总是报错，能帮助用python实现程序实现高斯正反算吗？有偿
¥15 对于squad数据集的基于bert模型的微调
¥15 为什么我运行这个网络会出现以下报错？CRNN神经网络
¥20 steam下载游戏占用内存

关于#深度学习知识蒸馏算法loss函数计算#的问题？

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新