请教一下,为什么RNN无法处理长序列,
A不是继承了历史的输入的数据吗?为什么看到有些说法他只能联系附近时刻的数据?
收起
当前问题酬金
¥ 0 (可追加 ¥500)
支付方式
扫码支付
支付金额 15 元
提供问题酬金的用户不参与问题酬金结算和分配
支付即为同意 《付费问题酬金结算规则》
梯度爆炸或者梯度消失,你想想每个时刻都累加一点点,序列一长到后面是很可观的。这也是为什么会有LSTM出现的原因,就是为了解决长序列的问题
报告相同问题?