tensorflow加入Dropout后loss计算不准确？是不是踩坑了啊

tensorflow加入Dropout后loss计算不准确？是不是踩坑了啊，被整蒙圈了啊。如下文，我在全连接里加了一层layers.Dropout, 经过40次Epoch后，loss已经收敛得很小。但是此时无论是predict、还是直接call出来的结果都还是很真实值相差挺多，相差比例1-dropout_rate有那么一点相近，这个按理是不应该的啊，tf默认是inverted dropout啊传播时自动做了scale。只能怀疑时loss计算不准确了？

运行结果及报错内容

>>> model0 = tf.keras.Sequential()
>>> model0.add(layers.Dense(
...     32,
...     activation='relu',
...     kernel_initializer=initializers_v2.HeUniform()))
>>> model0.add(layers.Dense(
...     512,
...     activation='relu',
...     kernel_initializer=initializers_v2.HeUniform()))
>>> model0.add(layers.Dropout(0.5))
>>> model0.add(layers.Dense(
...     512,
...     activation='relu',
...     kernel_initializer=initializers_v2.HeUniform()))
>>> model0.add(layers.Dense(
...     1,
...     kernel_initializer=initializers_v2.HeUniform()))
>>> model0.compile(
...     optimizer=tf.keras.optimizers.Adam(learning_rate=0.0005),
...     loss=tf.keras.losses.MeanAbsoluteError(),
...     metrics=['mae'])
>>> model0.fit(
...     X_a, y_value_a,
...     epochs=40)
Epoch 40/40
625/625 [==============================] - 1s 2ms/step - loss: 0.2190 - mae: 0.2190
<keras.callbacks.History object at 0x000002E5CA4DB700>

预测值/真实值相差比例跟1-dropout_rate有那么一点相近

>>> y_pred_a = model0.predict(X_a)
625/625 [==============================] - 1s 826us/step
>>> y_call_a = model0.call(tf.convert_to_tensor(X_a))
>>> print(y_pred_a)
[[-13.342887 ]
 [ -5.501849 ]
 [ -6.9179006]
 ...
 [ 19.558184 ]
 [  1.6202304]
 [ -6.4136333]]
>>> print(y_call_a)
tf.Tensor(
[[-13.342106 ]
 [ -5.502385 ]
 [ -6.9180675]
 ...
 [ 19.557985 ]
 [  1.6198621]
 [ -6.413244 ]], shape=(20000, 1), dtype=float32)
>>> print(y_value_a)
[[-26.56738428]
 [-10.90707993]
 [-13.71867984]
 ...
 [ 38.34531367]
 [  3.16246066]
 [-12.71669086]]

这里手动计算mae、调用model的loss\evaluate计算的loss相同，但是跟metrics里的loss相差很多，更奇怪的是当evaluate完之后，再次metrics得到loss又变了，是不是踩到大坑了啊


```python
>>> model0.metrics[0].result().numpy()
0.21902849
>>> loss_a = y_value_a - y_pred_a
>>> abs(loss_a).mean()
7.838831122853866
>>> model0.metrics[0].result().numpy()
0.21902849
>>> model0.loss(y_value_a, y_pred_a)
<tf.Tensor: shape=(), dtype=float32, numpy=7.8388314>
>>> model0.metrics[0].result().numpy()
0.21902849
>>> model0.evaluate(X_a,y_value_a)
625/625 [==============================] - 1s 961us/step - loss: 7.8388 - mae: 7.8388
[7.838833808898926, 7.838833808898926]
>>> model0.metrics[0].result().numpy()
7.838834

```

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

keras训练二分类模型acc一直0.5 loss一直是0.69怎么办? tensorflow 人工智能深度学习
2021-03-18 16:11

回答 2 已采纳帮你改了下代码，路径你自己再改改，验证集acc能跑到0.8以上了。 import os import tensorflow as tf from tensorflow.keras import S
tensorflow中model.fit（）函数输入参数报错，如何解决？ python tensorflow 有问必答机器学习
2022-04-12 01:32

回答 2 已采纳 loss不是binary_crossentropy？
tensorflow怎么解决这个问题，是什么问题，解决方法？ python tensorflow 神经网络
2022-04-12 09:36

回答 1 已采纳代码用控件提交，你这代码乱的.这个报错你要检查下是不是你优化器中loss的问题，你的数据标签是什么样子的，直接类别id的话不能用CategoricalCrossentropy()换成SparseCat
Apple MacBook M1 Anaconda安装 Tensorflow
2021-08-10 17:31

快乐小码农的博客 MacBook Air M1芯片安装Tensorflow踩坑踩坑1：在mac m1上安装tensorflow报错“zsh: illegal hardware instruction” 环境： anaconda + python3.8 直接用 pip install tensorflow 安装，能够顺利安装tensorflow...
请问卷积后图片尺寸不改变，是不是因为卷积周围补0了人工智能机器学习
2021-07-26 19:50

回答 1 已采纳 padding='same'你的因果关系搞错了，是先padding，然后才卷积的，而不是卷积之后补0。
tensorflow.keras训练模型预测问题 keras python tensorflow
2023-03-04 11:08

回答 2 已采纳这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_los
tensorflow.GraphDef was modified concurrently during serialization python tensorflow 人工智能机器学习深度学习
2019-09-17 00:16

回答 2 已采纳用CheckpointSaverHook来做模型保存，不要自己写，session run的行为有可能是异步优化后并发的，不是依照python代码的串行关系执行的。所以一般在一个循环内不会串行调用s
TensorFlow开发者证书中文手册
2022-11-05 14:10

pepure的博客经过一个月的准备，终于通过了TensorFlow的开发者认证，由于官方的中文文档较少，为了方便大家了解这个考试，同时分享自己的备考经验，让大家少踩坑，我整理并制作了这个中文手册，请大家多多指正~
tensorflow.keras训练问题 keras python tensorflow
2023-03-05 18:39

回答 2 已采纳尝试一下调整参数吧，或者加层数试试
Tensorflow相关问题 python tensorflow 深度学习
2022-04-09 16:19

回答 1 已采纳感觉是len(train_data) // batch_size
验证集的loss和准确率变动大 pytorch 深度学习神经网络
2022-02-05 14:50

回答 2 已采纳少训练上一些轮或者提前终止，要不你就在训练集里加上一些错误的例子
AI预测-注意力机制/多头注意力机制及其tensorflow实现
2024-01-26 16:56

写代码的中青年的博客 AI预测相关目录 AI预测流程，包括ETL、算法策略、算法模型、模型评估、可视化等相关内容最好有基础的python算法预测经验 EEMD策略及踩坑 VMD-CNN-LSTM时序预测对双向LSTM等模型添加自注意力机制 K折叠交叉验证 ...
如何在进行数据训练是报KeyError: 'val_mape？ keras tensorflow 神经网络
2023-01-02 06:19

回答 6 已采纳出现 KeyError: 'val_mape' 的原因可能是在代码中没有计算并输出 val_mape 这个指标。在训练模型时使用了 ModelCheckpoint 回调函数来保存模型权重，并使用了
AI预测-迁移学习在时序预测任务上的tensoflow2.0实现
2024-01-24 14:03

写代码的中青年的博客迁移学习及tensorflow实现！
人工智能算法综述（一）
2023-02-25 18:43

hecius的博客 人工智能综述，概述性了解AI及几种常见的算法
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月5日

悬赏问题

¥20 公众号如何实现点击超链接后自动发送文字
¥15 用php隐藏类名和增加类名
¥15 算法设计与分析课程的提问
¥15 用MATLAB汇总拟合图
¥15 智能除草机器人方案设计
¥15 对接wps协作接口实现消息发送
¥15 SQLite 出现“Database is locked” 如何解决？
¥15 已经加了学校的隶属邮箱了，为什么还是进不去github education？😭
¥15 求会做聚类，TCN的朋友有偿线上指导。以下是目前遇到的问题
¥100 无网格伽辽金方法研究裂纹扩展的程序

tensorflow加入Dropout后loss计算不准确？是不是踩坑了啊

运行结果及报错内容

预测值/真实值 相差比例跟1-dropout_rate有那么一点相近

这里手动计算mae、调用model的loss\evaluate计算的loss相同，但是跟metrics里的loss相差很多，更奇怪的是当evaluate完之后，再次metrics得到loss又变了，是不是踩到大坑了啊

0条回答 默认 最新

问题事件

悬赏问题

预测值/真实值相差比例跟1-dropout_rate有那么一点相近

0条回答默认最新