TensorFlow2.0训练模型时，指标不收敛一直上升到1

我尝试着使用tf2.0来搭建一个DeepFM模型来预测用户是否喜欢某部影片，

optimizer选择Adam，loss选择BinaryCrossentropy，评价指标是AUC；

因为涉及到了影片ID，所以我用了shared_embedding，并且必须关闭eager模式；

选用binary_crossentropy作为损失函数时模型在训练时AUC很快就到1了，但选用categorical_crossentropy时loss没太大变化，并且AUC一直保持在0.5，准确率也一直在0.5附近震荡。

下面是选用binary_crossentropy时的输出日志：

图片说明

下面是我的代码：

one_order_feature_layer = tf.keras.layers.DenseFeatures(one_order_feature_columns)
one_order_feature_layer_outputs = one_order_feature_layer(feature_layer_inputs)

two_order_feature_layer = tf.keras.layers.DenseFeatures(two_order_feature_columns)
two_order_feature_layer_outputs = two_order_feature_layer(feature_layer_inputs)

# lr部分
lr_layer = tf.keras.layers.Dense(len(one_order_feature_columns), kernel_initializer=initializer)(
    one_order_feature_layer_outputs)

# fm部分
reshape = tf.reshape(two_order_feature_layer_outputs,
                     [-1, len(two_order_feature_columns), two_order_feature_columns[0].dimension])
sum_square = tf.square(tf.reduce_sum(reshape, axis=1))
square_sum = tf.reduce_sum(tf.square(reshape), axis=1)
fm_layers = tf.multiply(0.5, tf.subtract(sum_square, square_sum))

# DNN部分
dnn_hidden_layer_1 = tf.keras.layers.Dense(64, activation='selu', kernel_initializer=initializer,
                                           kernel_regularizer=regularizer)(two_order_feature_layer_outputs)
dnn_hidden_layer_2 = tf.keras.layers.Dense(64, activation='selu', kernel_initializer=initializer,
                                           kernel_regularizer=regularizer)(dnn_hidden_layer_1)
dnn_hidden_layer_3 = tf.keras.layers.Dense(64, activation='selu', kernel_initializer=initializer,
                                           kernel_regularizer=regularizer)(dnn_hidden_layer_2)
dnn_dropout = tf.keras.layers.Dropout(0.5, seed=29)(dnn_hidden_layer_3)

# 连接并输出
concatenate_layer = tf.keras.layers.concatenate([lr_layer, fm_layers, dnn_dropout])
out_layer = tf.keras.layers.Dense(1, activation='sigmoid')(concatenate_layer)
model = tf.keras.Model(inputs=[v for v in feature_layer_inputs.values()], outputs=out_layer)
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=learning_rate),
              loss=tf.keras.losses.BinaryCrossentropy(),
              metrics=['AUC'])
# tf.keras.utils.plot_model(model, 'test.png', show_shapes=True)
train_ds = make_dataset(train_df, buffer_size=None, shuffle=True)
test_ds = make_dataset(test_df)
with tf.compat.v1.Session() as sess:
    sess.run([tf.compat.v1.global_variables_initializer(), tf.compat.v1.tables_initializer()])
    model.fit(train_ds, epochs=5)
    loss, auc = model.evaluate(test_ds)
    print("AUC", auc)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-02-21 16:23
关注
不同的损失函数之间LOSS没有可比性。关键看你的auc（正确率）
因为你是2分类，所以0.5等于没有效果。在数据平衡的前提下，如果达到0.8 0.9就是有效果了。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

【Tensorflow2.0】Tensorflow2.0版本可以使用object_dectectionAPI吗 tensorflow 人工智能深度学习神经网络
2020-03-15 20:14

回答 4 已采纳 tensorflow2.X版本中没有contrib了，可以尝试使用修改或者使用1.1X（X>=2)版本.
tensorflow2.0训练自己的数据集，csv格式转换tfrecord时'utf-8'出错 python tensorflow
2021-03-16 14:20

回答 2 已采纳应该是你读取了哪个不是utf-8编码文件，然后你输出转成utf-8就会这样。建议读取文件的时候加上encoding='gbk'。
基于knn的tensorflow2.0的MNIST分类 pycharm python tensorflow 有问必答
2021-08-11 20:03

回答 1 已采纳应该是由于在下载数据集中连接中断，导致程序终止运行，可以尝试将数据集下载到本地运行，参考： https://blog.csdn.net/u012487272/article/details/79
tensorflow2.0训练目标检测模型
2021-07-21 10:02

weixin_48672949的博客 1.环境搭建与软件安装操作系统：win10 64位内存：8G Anaconda3-5.0.1 (自带python3.6.5) tensorflow2.5.0 1.1 Anaconda3-5.0.1版本安装包下载、安装流程、环境配置参考...
tensorflow2.0版本用1.0代码报错 python 有问必答
2021-07-06 19:11

回答 2 已采纳 tensorflow2.0将1.0的很多功能优化或去掉了，建议降低tensorflow版本
tensorflow2.0中文手写字识别，生成tfrecord文件每次都失败，求帮助 python 图像处理机器学习
2021-09-05 21:22

回答 1 已采纳首先说下你的cuda目测没有安装正确。其次，这行的代码是先验证你的命令行有无输入，如果没有输入就提示你输入类似的地址。而下面的else才是正确的地址。如果你不想通过命令行来执行，那么就将if el
tensorflow预训练模型input格式错误 python tensorflow 人工智能
2023-02-03 11:52

回答 4 已采纳后续增加numpy解决
TensorFlow 2.0实现BERT文本分类模型：使用预训练的BERT模型进行文本分类任务
2023-08-09 04:20

禅与计算机程序设计艺术的博客 2018年是NLP技术爆炸式...其中最火的当属预训练的BERT(Bidirectional Encoder Representations from Transformers)模型，它可以学习到大量的文本语义信息并用于许多NLP任务中，比如文本分类、文本匹配、序列标注等。
使用tensorflow-gpu无法训练模型？ python tensorflow ubuntu
2021-08-09 15:02

回答 2 已采纳看你的运行结果是你的cuda版本过于低，gpu的性能没有完全利用，观察你的loss几乎没有变化，loss要下降趋势才是正常运行结果，调整一下超参数试试
tensorflow2.0课程 tensorflow
2022-09-12 16:44

回答 1 已采纳这个应该是可以自定义的，你可以尝试写一个自定义的函数。
[Tensorflow 2.0] 深度网络建模初级问题 tensorflow 人工智能神经网络
2021-08-23 11:25

回答 1 已采纳 x = layers.Conv2D(64, kernel_size=7, strides=2, padding="SAME", activation="relu", name="conv2d_1"
tensorflow2.0 实现MTCNN、P_net数据生成，及训练-1
2021-04-06 17:53

Replete的博客 1.MTCNN 的优点及必须要了解基础点。MTCNN 的 “MT”是指多任务学习（Multi-Task）,在同一个任务中同时学习“分类识别”、...P-NET的网络模型时用单尺度（12X12）的图片训练出来的，想要识别各种尺度的人脸更准确...
新手学tensorflow2.0，自己制作的数据集，是不是不对？ tensorflow
2020-11-26 23:22

回答 1 已采纳 x = keras.layers.Dense(64 activation='relu')(inputs)之前应该先拉平成1维的
人工智能实践：Tensorflow2.0笔记北京大学MOOC（1-1）
2022-08-10 11:26

寂灭如一的博客系列内容整理自中国大学MOOC “北京大学-人工智能实践:Tensorflow笔记” 课程。本讲目标：理解神经网络计算过程，使用基于TF2原生代码搭建第一个神经网络训练模型本节内容：介绍神经网络相关的基本概念，剖析神经...
人工智能实践：Tensorflow2.0笔记北京大学MOOC（2-1）
2022-08-20 00:16

寂灭如一的博客系列内容整理自中国大学MOOC “北京大学-人工智能实践:Tensorflow笔记” 课程。本讲目标：学会神经网络优化过程，使用正则化减少过拟合，使用优化器更新网络参数。本节内容：本节将在上一讲的基础上进一步讨论神经...
没有解决我的问题, 去提问

悬赏问题

¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
¥20 软件测试决策法疑问求解答
¥15 win11 23H2删除推荐的项目，支持注册表等
¥15 matlab 用yalmip搭建模型，cplex求解，线性化处理的方法
¥15 qt6.6.3 基于百度云的语音识别不会改
¥15 关于#目标检测#的问题：大概就是类似后台自动检测某下架商品的库存，在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
¥15 神经网络怎么把隐含层变量融合到损失函数中？
¥15 lingo18勾选global solver求解使用的算法
¥15 全部备份安卓app数据包括密码，可以复制到另一手机上运行
¥20 测距传感器数据手册i2c

TensorFlow2.0训练模型时，指标不收敛一直上升到1

1条回答 默认 最新

悬赏问题

1条回答默认最新