tensorflow重载模型继续训练得到的loss比原模型继续训练得到的loss大，是什么原因？？

我使用tensorflow训练了一个模型，在第10个epoch时保存模型，然后在一个新的文件里重载模型继续训练，结果我发现重载的模型在第一个epoch的loss比原模型在epoch=11的loss要大，我感觉既然是重载了原模型，那么重载模型训练的第一个epoch应该是和原模型训练的第11个epoch相等的，一直找不到问题或者自己逻辑的问题，希望大佬能指点迷津。源代码和重载模型的代码如下：

原代码：
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
import os
import numpy as np

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

mnist = input_data.read_data_sets("./",one_hot=True)
tf.reset_default_graph()

###定义数据和标签
n_inputs = 784
n_classes = 10
X = tf.placeholder(tf.float32,[None,n_inputs],name='X')
Y = tf.placeholder(tf.float32,[None,n_classes],name='Y')

###定义网络结构
n_hidden_1 = 256
n_hidden_2 = 256
layer_1 = tf.layers.dense(inputs=X,units=n_hidden_1,activation=tf.nn.relu,kernel_regularizer=tf.contrib.layers.l2_regularizer(0.01))
layer_2 = tf.layers.dense(inputs=layer_1,units=n_hidden_2,activation=tf.nn.relu,kernel_regularizer=tf.contrib.layers.l2_regularizer(0.01))
outputs = tf.layers.dense(inputs=layer_2,units=n_classes,name='outputs')
pred = tf.argmax(tf.nn.softmax(outputs,axis=1),axis=1)
print(pred.name)
err = tf.count_nonzero((pred - tf.argmax(Y,axis=1)))
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=outputs,labels=Y),name='cost')
print(cost.name)

###定义优化器
learning_rate = 0.001

optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost,name='OP')
saver = tf.train.Saver()
checkpoint = 'softmax_model/dense_model.cpkt'
###训练
batch_size = 100
training_epochs = 11
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for epoch in range(training_epochs):
        batch_num = int(mnist.train.num_examples / batch_size)
        epoch_cost = 0
        sumerr = 0
        for i in range(batch_num):
            batch_x,batch_y = mnist.train.next_batch(batch_size)
            c,e = sess.run([cost,err],feed_dict={X:batch_x,Y:batch_y})
            _ = sess.run(optimizer,feed_dict={X:batch_x,Y:batch_y})
            epoch_cost += c / batch_num
            sumerr += e / mnist.train.num_examples
            if epoch == (training_epochs - 1):
                print('batch_cost = ',c)
        if epoch == (training_epochs - 2):
            saver.save(sess, checkpoint)
            print('test_error = ',sess.run(cost, feed_dict={X: mnist.test.images, Y: mnist.test.labels}))

重载模型的代码：
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
import os


os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

mnist = input_data.read_data_sets("./",one_hot=True)  #one_hot=True指对样本标签进行独热编码


file_path = 'softmax_model/dense_model.cpkt'

saver = tf.train.import_meta_graph(file_path + '.meta')
graph = tf.get_default_graph()


X = graph.get_tensor_by_name('X:0')
Y = graph.get_tensor_by_name('Y:0')
cost = graph.get_operation_by_name('cost').outputs[0]
train_op = graph.get_operation_by_name('OP')


training_epoch = 10
learning_rate = 0.001
batch_size = 100
with tf.Session() as sess:
    saver.restore(sess,file_path)
    print('test_cost = ',sess.run(cost, feed_dict={X: mnist.test.images, Y: mnist.test.labels}))
    for epoch in range(training_epoch):
        batch_num = int(mnist.train.num_examples / batch_size)
        epoch_cost = 0
        for i in range(batch_num):
            batch_x, batch_y = mnist.train.next_batch(batch_size)
            c = sess.run(cost, feed_dict={X: batch_x, Y: batch_y})
            _ = sess.run(train_op, feed_dict={X: batch_x, Y: batch_y})
            epoch_cost += c / batch_num


        print(epoch_cost)

值得注意的是，我在原模型和重载模型里都计算了测试集的cost，两者的结果是一致的。说明参数载入应该是对的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-02-28 00:03
关注
排除你模型本身的原因，loss变大可能是过拟合了。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

operator< 小于符号运算符重载问题，输出结果总是反的是什么原因呢？ c++ 开发语言蓝桥杯
2022-05-02 16:23

回答 1 已采纳重载函数需要返回True和False，而不是实际数值，否则if条件一直为True只会执行m1.message()，修改如下： int operator<(Mobile &x1, Mobile &
json类中的parseObject方法的重载是什么意思？ java json 后端
2021-10-28 15:45

回答 2 已采纳第三个，是转成json字符串时，key的排序方式
Java题，为什么选A呀，是考方法重载吗？为什么 java
2021-12-13 09:57

回答 4 已采纳方法重载，需要拥有不同的参数列表，A选项和类中已有的方法参数列表相同所以是不合法的。
Tensorflow基础教程2：Tensorflow模型建立与训练
2021-03-15 10:27

iFlyAI的博客在开始学习之前推荐大家可以多在 FlyAI竞赛服务平台多参加训练和竞赛，以此来提升自己的能力...　为什么模型类是重载 `call()` 方法而不是 `__call__()` 方法? 　本章介绍如何使用 TensorFlow 快速搭建动态模型。 ...
函数重载排序问题无法输出结果是为什么呢？ c++ 排序算法
2021-09-27 00:05

回答 1 已采纳 else if (a == 2) { for (i = 0; i <10; i++) { cin >> y;
为什么Java不支持运算符重载？ java
2023-03-09 13:35

回答 3 已采纳你这个问题，和一个面试题文章里面的一样，后面还有一些简单性和清晰性。清晰性是Java设计者的目标之一。设计者不是只想复制语言，而是希望拥有一种清晰，真正面向对象的语言。添加运算符重载比没有它肯定会
qwidget鼠标移动事件无法获取响应是什么原因？ qt
2021-09-06 21:50

回答 1 已采纳需要开启鼠标追踪才行，在构造函数中添加setMouseTracking(true)
如何通过数据并行、模型并行、混合精度训练等方法加速神经网络的训练速度？
2023-08-31 11:36

禅与计算机程序设计艺术的博客作者：禅与计算机程序设计艺术 1.简介 ...然而，目前的计算机和内存资源难以支持大规模的训练过程，使得用现有的方法进行复杂模型训练变得十分困难。为了解决这个问题，研究者们提出了分布式并行
link中运算符重载必须依附于类型这个怎么理解？什么是运算符重载的类型？
2015-04-15 04:32

回答 1 已采纳就是说，C++允许在类的定义外面定义运算符重载。你可以重载两个整数的加减。但是C#不允许，你不能改变现有类型的运算符，只能给你自己定义的类型重载运算符。
请问为什么这里的函数重载报错了？ c++ 有问必答
2021-08-24 17:02

回答 2 已采纳 codebloks上可以正常运行，应该是不同编译器的原因：
java方法重载参数可以是父类和子类么？ java 后端
2021-11-09 14:08

回答 2 已采纳优先匹配类型一致的那个方法，如果没有，将参数的类型向上升级为其父类，继续匹配；如果最终都没有匹配到合适的方法，则报错；所以一个方法有2个重载方法，一个参数为子类，一个方法参数为该子类的父类时，如果参
【入门教程】TensorFlow 2.0 模型：模型类的建立
2020-12-30 16:58

TensorFlow 社区的博客在《【入门教程】TensorFlow 2.0 基础：张量、自动求导与优化器》中，我们手工实现了一个简单的线性回归模型。不过，当模型变得日益复杂时，直接将模型代码写在主程序中就显得臃肿且难以重用了。于是，我们希望有一...
link中什么是运算符重载的局限性？局限性具体表现在哪些地方？
2015-04-15 03:33

回答 1 已采纳运算符重载首先不是所有的运算符都能重载，另一个，运算符重载必须依附于类型，和C++不同，你不能在类定义的外部重载运算符。也就是说你不能改变已有类型的运算符的功能。
基于tensorflow框架实现人脸识别算法（支持从头训练和摄像头测试）
2023-08-24 09:25

biyezuopinvip的博客本代码在训练开始前通过 MTCNN 网络对数据集的图片进行筛选，筛选出能识别的人脸图像，并通过人脸框将图片裁剪 resize 成一定尺度用于模型的输入，对于人脸检测 MTCNN 算法的讲解，我的另一篇项目中做了详尽的介绍和...
第三章：AI大模型的主要技术框架3.2 PyTorch3.2.2 PyTorch基本操作与实例
2024-01-24 02:13

禅与计算机程序设计艺术的博客 1.背景介绍 1. 背景介绍 PyTorch是一个开源的深度学习框架，由Facebook的Core Data Science Team开发。PyTorch的设计目标是简化...PyTorch支持Python编程语言，并提供了一个易于使用的接口来构建和训练深度学习模型。
没有解决我的问题, 去提问

悬赏问题

¥20 为什么我写出来的绘图程序是这样的，有没有lao哥改一下
¥15 js，页面2返回页面1时定位进入的设备
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥15 绘制多分类任务的roc曲线时只画出了一类的roc，其它的auc显示为nan
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败