我利用torch搭建了一个神经网络但是需要神经网络的输出控制在0-1之间训练后发生了梯度消失

class NN1(nn.Module):
def __init__(self, d_in, d_hidden, d_out):
super(Actor, self).__init__()
self.linear1 = nn.Linear(d_in, d_hidden)
self.linear2 = nn.Linear(d_hidden, d_hidden)
self.linear3 = nn.Linear(d_hidden, d_hidden)
self.linear4 = nn.Linear(d_hidden, d_hidden)
self.linear5 = nn.Linear(d_hidden, d_out)

def forward(self, x):
x = self.linear1(x)
x = F.sigmoid(x)
x = self.linear2(x)
x = F.sigmoid(x)
x = self.linear3(x)
x = F.sigmoid(x)
x = self.linear4(x)
x = F.sigmoid(x)
x = self.linear5(x)
x = F.relu(x)
output = x.type(torch.float64)
return output

肯定的是softmax是不能用的(需求原因)，我查了能输出在0-1之间的激活函数只有Sigmoid。

跑出来结果收敛不了，收敛图一直在横幅震荡没有梯度。

我查了有关资料，说是Sigmoid和tanh都是会产生梯度消失的，请问大佬们有没有办法将relu的输出控制在0-1之间或者有别的办法，小弟毕业论文很赶跪谢...

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
影醉阏轩窗 2021-04-25 14:25
关注
1. 把loss函数也放出来看看

2. 先把中间的sigmoid改成Relu（或者其他变种），最后一层使用sigmoid

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

我利用torch搭建了一个神经网络但是需要神经网络的输出控制在0-1之间训练后发生了梯度消失

1条回答 默认 最新

悬赏问题

1条回答默认最新