小小葵花籽 2023-04-08 11:32 采纳率: 50%
浏览 32
已结题

深度学习训练网络时遇到问题

就是下面这个问题

img


搜到的所有答案都跟我的错误类型不一样,用了他们的方法都解决不了
主程序运行到这一步就结束了

img


函数运行到这一步,能打印出上面的total i,不能打印出下面的hello,希望各位帮我看看,到底要怎么解决啊

img

  • 写回答

3条回答 默认 最新

  • 阿里嘎多学长 2023-04-08 13:15
    关注

    以下内容部分参考ChatGPT模型:


    这个问题可能是由于在训练过程中出现了NaN(不是数字)的值导致的。可以尝试以下几个方法来解决:

    1. 检查训练数据是否包含NaN值,如果有,将其删除或通过插值替换。

    2. 尝试使用更小的学习率,这可以防止梯度爆炸和梯度消失。

    3. 使用Batch Normalization来规范化输入数据,防止梯度爆炸和梯度消失。

    4. 尝试使用不同的优化器,如Adam或RMSprop,这些优化器可以更好地处理梯度问题。

    5. 尝试减小网络的深度或宽度,这可以减少梯度问题的发生。

    6. 尝试使用数值稳定的损失函数,如tf.keras.losses.logcosh。

    7. 使用tf.debugging.check_numerics函数检查张量是否包含NaN或无穷大的值。

    例如,可以使用以下代码来检查张量是否包含NaN或无穷大的值:

    import tensorflow as tf
    
    tensor = tf.constant([1.0, 2.0, float('nan'), float('inf')])
    check_op = tf.debugging.check_numerics(tensor, 'Invalid tensor')
    with tf.Session() as sess:
        sess.run(check_op)
    

    希望这些方法可以帮助您解决问题。


    如果我的建议对您有帮助、请点击采纳、祝您生活愉快

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月10日
  • 已采纳回答 4月10日
  • 赞助了问题酬金15元 4月8日
  • 修改了问题 4月8日
  • 展开全部

悬赏问题

  • ¥20 基于MSP430f5529的MPU6050驱动,求出欧拉角
  • ¥20 Java-Oj-桌布的计算
  • ¥15 powerbuilder中的datawindow数据整合到新的DataWindow
  • ¥20 有人知道这种图怎么画吗?
  • ¥15 pyqt6如何引用qrc文件加载里面的的资源
  • ¥15 安卓JNI项目使用lua上的问题
  • ¥20 RL+GNN解决人员排班问题时梯度消失
  • ¥60 要数控稳压电源测试数据
  • ¥15 能帮我写下这个编程吗
  • ¥15 ikuai客户端l2tp协议链接报终止15信号和无法将p.p.p6转换为我的l2tp线路