小小葵花籽 2023-04-08 11:32 采纳率: 50%
浏览 32
已结题

深度学习训练网络时遇到问题

就是下面这个问题

img


搜到的所有答案都跟我的错误类型不一样,用了他们的方法都解决不了
主程序运行到这一步就结束了

img


函数运行到这一步,能打印出上面的total i,不能打印出下面的hello,希望各位帮我看看,到底要怎么解决啊

img

  • 写回答

3条回答 默认 最新

  • 阿里嘎多学长 2023-04-08 13:15
    关注

    以下内容部分参考ChatGPT模型:


    这个问题可能是由于在训练过程中出现了NaN(不是数字)的值导致的。可以尝试以下几个方法来解决:

    1. 检查训练数据是否包含NaN值,如果有,将其删除或通过插值替换。

    2. 尝试使用更小的学习率,这可以防止梯度爆炸和梯度消失。

    3. 使用Batch Normalization来规范化输入数据,防止梯度爆炸和梯度消失。

    4. 尝试使用不同的优化器,如Adam或RMSprop,这些优化器可以更好地处理梯度问题。

    5. 尝试减小网络的深度或宽度,这可以减少梯度问题的发生。

    6. 尝试使用数值稳定的损失函数,如tf.keras.losses.logcosh。

    7. 使用tf.debugging.check_numerics函数检查张量是否包含NaN或无穷大的值。

    例如,可以使用以下代码来检查张量是否包含NaN或无穷大的值:

    import tensorflow as tf
    
    tensor = tf.constant([1.0, 2.0, float('nan'), float('inf')])
    check_op = tf.debugging.check_numerics(tensor, 'Invalid tensor')
    with tf.Session() as sess:
        sess.run(check_op)
    

    希望这些方法可以帮助您解决问题。


    如果我的建议对您有帮助、请点击采纳、祝您生活愉快

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月10日
  • 已采纳回答 4月10日
  • 赞助了问题酬金15元 4月8日
  • 修改了问题 4月8日
  • 展开全部

悬赏问题

  • ¥20 易康econgnition精度验证
  • ¥15 线程问题判断多次进入
  • ¥15 msix packaging tool打包问题
  • ¥28 微信小程序开发页面布局没问题,真机调试的时候页面布局就乱了
  • ¥15 python的qt5界面
  • ¥15 无线电能传输系统MATLAB仿真问题
  • ¥50 如何用脚本实现输入法的热键设置
  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致