https://www.cnblogs.com/pinard/p/6519110.html
lstm反向传播中的:将损失函数L_t分为两部分,第一部分是t时刻的损失,第二部分是t时刻之后的损失函数L_(t+1),这什么意思,为什么t时刻的损失函数对于t时刻的加t时刻之后的损失函数?
https://www.cnblogs.com/pinard/p/6519110.html
lstm反向传播中的:将损失函数L_t分为两部分,第一部分是t时刻的损失,第二部分是t时刻之后的损失函数L_(t+1),这什么意思,为什么t时刻的损失函数对于t时刻的加t时刻之后的损失函数?