关于论文《A Comprehensive Overhaul of Feature Distillation》中的一些不明之处想向博主请教

博主您好，不好意思打扰您了。我是一名在读研究生，最近看了您写的关于《A Comprehensive Overhaul of Feature Distillation》这篇论文的博客，其中有些问题不太明白想咨询您，如果您在百忙之中有空愿意指点一二的话，不胜感激！
我的问题主要有以下两点：

为什么要用marginal relu？您在博客中提到“正值都保留，负值被抑制。这样的话就不用学习精确的“没有用”的负值，而集中精力学习“有用”的正值”。如果是这样的目的的话，既然觉得负值是没有用的，甚至论文中用到的词“有害的”，为什么不直接使用relu过滤掉所有负值呢？这样不是更能集中精力去学习正值？
为什么partial L2损失函数里面要对si<=Ti<=0的情况直接认为为0呢？您在博客提到“如果teacher小于0时，student比它小就不必惩罚，因为经过ReLU后是一样的”，那么如果teacher小于0时，student比它大但是比0小是不是也不需要惩罚呢？因为经过ReLU后是一样的都是0啊？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爆米花好美啊博客专家认证 2021-11-24 14:51
关注
具体细节有些忘了，只能大概解读一下

我猜测论文的意思是：负值不是完全没用的，少学一些负值就行了
因为marginal relu是作用到T上的，T的一些很小的负值会被clip。如果S的负值比T还小，这里T的负值不是精确的（有可能被clip了），所以干脆就不用惩罚了
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

关于论文《A Comprehensive Overhaul of Feature Distillation》中的一些不明之处想向博主请教深度学习神经网络
2021-11-23 22:20

回答 1 已采纳具体细节有些忘了，只能大概解读一下我猜测论文的意思是：负值不是完全没用的，少学一些负值就行了因为marginal relu是作用到T上的，T的一些很小的负值会被clip。如果S的负值比T还小，这里T
如何使用表单输入将表单中的数据拉入会话 html javascript php
2016-07-06 18:30

回答 1 已采纳 Are you able to add the hidden "cust-name" input to the html, or is this something that you are un
在当前正在运行的控制台应用程序中调用方法。 c# php
2011-09-07 13:51

回答 3 已采纳 You could create a Service like this: [ServiceContract] public interface IService { [Operatio
A Comprehensive Overhaul of Feature Distillation
2021-07-28 14:26

weixin_37958272的博客 A Comprehensive Overhaul of Feature Distillation 我们研究了实现网络压缩的特征蒸馏方法的设计方面，并提出了一种新的特征蒸馏方法，其中蒸馏损失的设计是为了使教师变换、学生变换、蒸馏特征位置和距离函数等...
使用mysql_fetch_assoc（）在PHP中构建继承的对象 mysql php
2012-02-26 00:06

回答 2 已采纳 I put an apostrophe in the wrong place. Feel free to throw humiliation my way!
创建DOMDocument：匹配PHP解析器中的某个元素 mysql php
2010-12-24 23:22

回答 1 已采纳 Here is the solution return the labels and values in a formatted array ready for input to mysql!
为什么不在 HTML 中使用表格进行布局？ [打烊] css html5
2008-09-17 13:19

回答 29 已采纳 I'm going to go through your arguments one after another and try to show the errors in them.
论文阅读--A Comprehensive Overhaul of Feature Distillation Heo
2024-04-28 17:10

__如果的博客 Abstract We investigate the design aspects of feature distillation methods achieving network compression and propose a novel feature distillation method in which the distillation loss is designed to ...
Overhaul Distillation（ICCV 2019）原理与代码解析
2023-06-13 20:09

00000cj的博客本文研究了知识蒸馏的各个方面，并提出了一种新的特征蒸馏方法，使蒸馏损失在教师特征变换、学生特征变换、...在ImageNet中，本文提出的方法使得ResNet-50取得了21.65%的top-1 error，优于教师网络ResNet-152的精度。
GW-AI-Overhaul:《行星歼灭》的Mod重点在于全面审查AI的个性和银河战争中的困难
2021-03-30 22:25

独特的型号独特个性独特的颜色根据他们的派系偏好的风格进行战斗从新手到老手的任何人都适合的八个新困难副指挥官的效能降低增加了系统中存在多个派系和发生FFA的可能性增加对共享军队敌人的支持老板显然比周围的...
【论文笔记_自监督知识蒸馏】Refine Myself by Teaching Myself : Feature Refinement via Self-Knowledge Distillation
2021-10-22 10:59

乱搭巴士的博客在图2中，在这个例子里，自下而上路径中的最浅的层T1和自下而上路径中最深的层T4，每一层都为了效率而分别直接使用了横向层L1和L4作为输入，而不是使用自上到下路径中的特征。在这些设置中，为了创造一个自上而下的...
【ChatGPT修改论文】【中/英双语】GPT论文指令合集（润色、语法修改、降重）
2023-12-12 21:34

1Ptt的博客对于我们需要改进的每一段，你需要把所有修改过的句子放在Markdown表中，每一列都包含以下内容：完整的原始句子；如果您理解，请回答：好的，下面我将为您执行。由于临近期末，大作业，项目以及报告的DDL接踵而至，...
Dark-Souls-1-Overhaul:“我们是黑暗之魂的计划M！”
2021-03-06 09:17

待办事项清单：平衡变化和建议：协作Ghidra数据库自定义存档文件（新的SFX，效果等）：要求这需要从源代码构建需要Visual Studio 2017，并需要访问一些私有存储库（询问metalcrow或SeanP）同时使用发布版本...
Tutorial: Knowledge Distillation
2019-11-14 22:03

爆米花好美啊的博客概述 Knowledge Distillation(KD)一般指利用一个大的teacher网络作为监督，帮助一个小的student网络...Feature Distillation Output Distillation Motivation 主要拉近teacher和student最终输出的距离，参考论文：...
【读点论文】PP-ShiTu: A Practical Lightweight Image Recognition System，百度推出的强大人工智能产品
2022-02-26 21:00

羞儿的博客 PP-ShiTu: A Practical Lightweight Image Recognition System 图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象的技术，是应用深度学习算法的一种实践应用。图像的传统识别...
Overhaul Distillation：深度学习模型压缩的新里程
2024-04-20 09:46

gitblog_00049的博客 Overhaul Distillation：深度...Overhaul Distillation 是由Clova AI团队开发的一个开源项目，旨在为深度学习模型的压缩和优化提供一种新的有效方法。该项目基于知识蒸馏（Knowledge Distillation）的理念，通过设...
数字飞机运营和维护的新挑战：知识管理的观点-研究论文
2021-05-20 18:28

飞机的运行和维护受到严格监管，以确保安全。这需要大量的文书工作作为正当程序的证据。文书工作流经多个利益相关方，包括原始设备制造商（OEM），出租人，维护修理和大修组织（MRO），供应商和航空公司。...
知识蒸馏(Knowledge Distillation)
2022-11-25 10:41

Q&Cui的博客关于知识蒸馏，你一定要了解的三类基础算法
【转】Knowledge-Distillation 知识蒸馏论文集合
2020-06-28 08:21

Phoenixtree_DongZhao的博客 Awesome Knowledge-Distillation 博客转自CTOLib码库：https://www.ctolib.com/FLHonker-Awesome-Knowledge-Distillation.html Awesome Knowledge-Distillation Different forms of knowledge Knowledge ...
overhaul-cls.rar
2020-07-31 06:31

overhaul distillation教师网络分类预训练权重，训练代码以放出，可以直接使用 overhaul distillation教师网络分类预训练权重，训练代码以放出，可以直接使用
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月23日

悬赏问题

¥15 微信会员卡等级和折扣规则
¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
¥15 随身WiFi网络灯亮但是没有网络，如何解决？
¥15 gdf格式的脑电数据如何处理matlab
¥20 重新写的代码替换了之后运行hbuliderx就这样了
¥100 监控抖音用户作品更新可以微信公众号提醒
¥15 UE5 如何可以不渲染HDRIBackdrop背景
¥70 2048小游戏毕设项目
¥20 mysql架构，按照姓名分表
¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分

关于论文《A Comprehensive Overhaul of Feature Distillation》中的一些不明之处想向博主请教

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新