weixin_43870657 2021-11-23 22:20 采纳率: 100%
浏览 50
已结题

关于论文《A Comprehensive Overhaul of Feature Distillation》中的一些不明之处想向博主请教

博主您好,不好意思打扰您了。我是一名在读研究生,最近看了您写的关于《A Comprehensive Overhaul of Feature Distillation》这篇论文的博客,其中有些问题不太明白想咨询您,如果您在百忙之中有空愿意指点一二的话,不胜感激!
我的问题主要有以下两点:

  1. 为什么要用marginal relu?您在博客中提到“正值都保留,负值被抑制。这样的话就不用学习精确的“没有用”的负值,而集中精力学习“有用”的正值”。如果是这样的目的的话,既然觉得负值是没有用的,甚至论文中用到的词“有害的”,为什么不直接使用relu过滤掉所有负值呢?这样不是更能集中精力去学习正值?

  2. 为什么partial L2损失函数里面要对si<=Ti<=0的情况直接认为为0呢?您在博客提到“如果teacher小于0时,student比它小就不必惩罚,因为经过ReLU后是一样的”,那么如果teacher小于0时,student比它大但是比0小是不是也不需要惩罚呢?因为经过ReLU后是一样的都是0啊?

  • 写回答

1条回答 默认 最新

  • 爆米花好美啊 博客专家认证 2021-11-24 14:51
    关注

    具体细节有些忘了,只能大概解读一下

    1. 我猜测论文的意思是:负值不是完全没用的,少学一些负值就行了
    2. 因为marginal relu是作用到T上的,T的一些很小的负值会被clip。如果S的负值比T还小,这里T的负值不是精确的(有可能被clip了),所以干脆就不用惩罚了
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 12月4日
  • 已采纳回答 11月26日
  • 创建了问题 11月23日

悬赏问题

  • ¥15 微信会员卡等级和折扣规则
  • ¥15 微信公众平台自制会员卡可以通过收款码收款码收款进行自动积分吗
  • ¥15 随身WiFi网络灯亮但是没有网络,如何解决?
  • ¥15 gdf格式的脑电数据如何处理matlab
  • ¥20 重新写的代码替换了之后运行hbuliderx就这样了
  • ¥100 监控抖音用户作品更新可以微信公众号提醒
  • ¥15 UE5 如何可以不渲染HDRIBackdrop背景
  • ¥70 2048小游戏毕设项目
  • ¥20 mysql架构,按照姓名分表
  • ¥15 MATLAB实现区间[a,b]上的Gauss-Legendre积分