为啥说激活函数最好具有关于零点对称的性质,不关于零点对称会导致收敛变慢?
网上查了一些文章也还是没有弄明白,要是能讲得通俗易懂、深入浅出一些就好了😝
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
也不是绝对关于零点对称就慢,如果是这样,那ReLU速度应该比Tanh慢才对,但是实际上ReLU可比Tanh快很多收敛。你说的应该是下面链接里面的情况,公式推理很详细了。
报告相同问题?
程序员都在用的中文IT技术交流社区
专业的中文 IT 技术社区,与千万技术人共成长
关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!