tensorflow训练完模型直接测试和导入模型进行测试的结果不同，一个很好，一个略差，这是为什么？

在tensorflow训练完模型，我直接采用同一个session进行测试，得到结果较好，但是采用训练完保存的模型，进行重新载入进行测试，结果较差，不懂是为什么会出现这样的结果。注：测试数据是一样的。以下是模型结果：

训练集：loss：0.384，acc：0.931. 验证集：loss：0.212，acc：0.968. 训练完在同一session内的测试集：acc：0.96。导入保存的模型进行测试：acc：0.29

def create_model(hps):


    global_step = tf.Variable(tf.zeros([], tf.float64), name = 'global_step', trainable = False)
    scale = 1.0 / math.sqrt(hps.num_embedding_size + hps.num_lstm_nodes[-1]) / 3.0
    print(type(scale))
    gru_init = tf.random_normal_initializer(-scale, scale)

    with tf.variable_scope('Bi_GRU_nn', initializer = gru_init):
        for i in range(hps.num_lstm_layers):
            cell_bw = tf.contrib.rnn.GRUCell(hps.num_lstm_nodes[i], activation = tf.nn.relu, name = 'cell-bw')

            cell_bw = tf.contrib.rnn.DropoutWrapper(cell_bw, output_keep_prob = dropout_keep_prob)
            cell_fw = tf.contrib.rnn.GRUCell(hps.num_lstm_nodes[i], activation = tf.nn.relu, name = 'cell-fw')
            cell_fw = tf.contrib.rnn.DropoutWrapper(cell_fw, output_keep_prob = dropout_keep_prob)

        rnn_outputs, _ = tf.nn.bidirectional_dynamic_rnn(cell_bw, cell_fw, inputs, dtype=tf.float32)
        embeddedWords = tf.concat(rnn_outputs, 2)
        finalOutput = embeddedWords[:, -1, :]
        outputSize = hps.num_lstm_nodes[-1] * 2  # 因为是双向LSTM，最终的输出值是fw和bw的拼接，因此要乘以2
        last = tf.reshape(finalOutput, [-1, outputSize])  # reshape成全连接层的输入维度
        last = tf.layers.batch_normalization(last, training = is_training) 
    fc_init = tf.uniform_unit_scaling_initializer(factor = 1.0)

    with tf.variable_scope('fc', initializer = fc_init):
        fc1 = tf.layers.dense(last, hps.num_fc_nodes, name = 'fc1')
        fc1_batch_normalization = tf.layers.batch_normalization(fc1, training = is_training)
        fc_activation = tf.nn.relu(fc1_batch_normalization)
        logits = tf.layers.dense(fc_activation, hps.num_classes, name = 'fc2')

    with tf.name_scope('metrics'):
        softmax_loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits = logits, labels = tf.argmax(outputs, 1))

        loss = tf.reduce_mean(softmax_loss)
        # [0, 1, 5, 4, 2] ->argmax:2 因为在第二个位置上是最大的
        y_pred = tf.argmax(tf.nn.softmax(logits), 1, output_type = tf.int64, name = 'y_pred')
        # 计算准确率，看看算对多少个
        correct_pred = tf.equal(tf.argmax(outputs, 1), y_pred)
        # tf.cast  将数据转换成 tf.float32 类型
        accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))  


    with tf.name_scope('train_op'):
        tvar = tf.trainable_variables()
        for var in tvar:
            print('variable name: %s' % (var.name))
        grads, _ = tf.clip_by_global_norm(tf.gradients(loss, tvar), hps.clip_lstm_grads)
        optimizer = tf.train.AdamOptimizer(hps.learning_rate)
        train_op = optimizer.apply_gradients(zip(grads, tvar), global_step)
#    return((inputs, outputs, is_training), (loss, accuracy, y_pred), (train_op, global_step))
    return((inputs, outputs), (loss, accuracy, y_pred), (train_op, global_step))

placeholders, metrics, others = create_model(hps)
content, labels = placeholders
loss, accuracy, y_pred = metrics
train_op, global_step = others  

def val_steps(sess, x_batch, y_batch, writer = None):

    loss_val, accuracy_val = sess.run([loss,accuracy], feed_dict = {inputs: x_batch, outputs: y_batch, is_training: hps.val_is_training,  dropout_keep_prob: 1.0})
    return loss_val, accuracy_val

loss_summary = tf.summary.scalar('loss', loss)
accuracy_summary = tf.summary.scalar('accuracy', accuracy)

# 将所有的变量都集合起来
merged_summary = tf.summary.merge_all()
# 用于test测试的summary
merged_summary_test = tf.summary.merge([loss_summary, accuracy_summary])

LOG_DIR = '.'
run_label = 'run_Bi-GRU_Dropout_tensorboard'
run_dir = os.path.join(LOG_DIR, run_label)
if not os.path.exists(run_dir):
    os.makedirs(run_dir)
train_log_dir = os.path.join(run_dir, timestamp, 'train')
test_los_dir = os.path.join(run_dir, timestamp, 'test')
if not os.path.exists(train_log_dir):
    os.makedirs(train_log_dir)
if not os.path.join(test_los_dir):
    os.makedirs(test_los_dir)

# saver得到的文件句柄，可以将文件训练的快照保存到文件夹中去
saver = tf.train.Saver(tf.global_variables(), max_to_keep = 5)

# train 代码
init_op = tf.global_variables_initializer()
train_keep_prob_value = 0.2
test_keep_prob_value = 1.0
# 由于如果按照每一步都去计算的话，会很慢，所以我们规定每100次存储一次
output_summary_every_steps = 100
num_train_steps = 1000
# 每隔多少次保存一次
output_model_every_steps = 500
# 测试集测试
test_model_all_steps = 4000
i = 0

session_conf = tf.ConfigProto(
    gpu_options = tf.GPUOptions(allow_growth=True),
    allow_soft_placement = True,
    log_device_placement = False)

with tf.Session(config = session_conf) as sess:
    sess.run(init_op)
    # 将训练过程中，将loss，accuracy写入文件里，后面是目录和计算图，如果想要在tensorboard中显示计算图，就想sess.graph加上
    train_writer = tf.summary.FileWriter(train_log_dir, sess.graph)
    # 同样将测试的结果保存到tensorboard中，没有计算图
    test_writer = tf.summary.FileWriter(test_los_dir)
    batches = batch_iter(list(zip(x_train, y_train)), hps.batch_size, hps.num_epochs)

    for batch in batches:
        train_x, train_y = zip(*batch)
        eval_ops = [loss, accuracy, train_op, global_step]
        should_out_summary = ((i + 1) % output_summary_every_steps == 0)

        if should_out_summary:
            eval_ops.append(merged_summary)
        # 那三个占位符输进去
        # 计算loss, accuracy, train_op, global_step的图
        eval_ops.append(merged_summary)
        outputs_train = sess.run(eval_ops,
                               feed_dict={
                                   inputs: train_x,
                                   outputs: train_y,
                                   dropout_keep_prob: train_keep_prob_value,
                                   is_training: hps.train_is_training
                               })
        loss_train, accuracy_train = outputs_train[0:2]
        if should_out_summary:
            # 由于我们想在100steps之后计算summary，所以上面 should_out_summary = ((i + 1) % output_summary_every_steps == 0)成立，
            # 即为真True，那么我们将训练的内容放入eval_ops的最后面了，因此，我们想获得summary的结果得在eval_ops_results的最后一个
            train_summary_str = outputs_train[-1]
            # 将获得的结果写训练tensorboard文件夹中，由于训练从0开始，所以这里加上1，表示第几步的训练
            train_writer.add_summary(train_summary_str, i + 1)

            test_summary_str = sess.run([merged_summary_test], 
                                        feed_dict = {inputs: x_dev, 
                                                     outputs: y_dev, 
                                                     dropout_keep_prob: 1.0,
                                                     is_training: hps.val_is_training
                                                     })[0]
            test_writer.add_summary(test_summary_str, i + 1)
        current_step = tf.train.global_step(sess, global_step)
        if (i + 1) % 100 == 0:
            print("Step: %5d, loss: %3.3f, accuracy: %3.3f"  % (i + 1, loss_train, accuracy_train))

        # 500个batch校验一次
        if (i + 1) % 500 == 0:
            loss_eval, accuracy_eval = val_steps(sess, x_dev, y_dev)
            print("Step: %5d, val_loss: %3.3f, val_accuracy: %3.3f"  % (i + 1, loss_eval, accuracy_eval))
        if (i + 1) % output_model_every_steps == 0:
            path = saver.save(sess,os.path.join(out_dir, 'ckp-%05d' % (i + 1)))
            print("Saved model checkpoint to {}\n".format(path))
            print('model saved to ckp-%05d' % (i + 1))
        if (i + 1) % test_model_all_steps == 0:
#            test_loss, test_acc, all_predictions= sess.run([loss, accuracy, y_pred], feed_dict = {inputs: x_test, outputs: y_test, dropout_keep_prob: 1.0})
            test_loss, test_acc, all_predictions= sess.run([loss, accuracy, y_pred], feed_dict = {inputs: x_test, outputs: y_test, is_training: hps.val_is_training, dropout_keep_prob: 1.0})
            print("test_loss: %3.3f, test_acc: %3.3d" % (test_loss, test_acc))
            batches = batch_iter(list(x_test), 128, 1, shuffle=False)

            # Collect the predictions here
            all_predictions = []
            for x_test_batch in batches:
                batch_predictions = sess.run(y_pred, {inputs: x_test_batch, is_training: hps.val_is_training, dropout_keep_prob: 1.0})
                all_predictions = np.concatenate([all_predictions, batch_predictions])
            correct_predictions = float(sum(all_predictions == y.flatten()))

            print("Total number of test examples: {}".format(len(y_test)))
            print("Accuracy: {:g}".format(correct_predictions/float(len(y_test))))

            test_y = y_test.argmax(axis = 1)
            #生成混淆矩阵
            conf_mat = confusion_matrix(test_y, all_predictions)

            fig, ax = plt.subplots(figsize = (4,2))

            sns.heatmap(conf_mat, annot=True, fmt = 'd', xticklabels = cat_id_df.category_id.values, yticklabels = cat_id_df.category_id.values)
            font_set = FontProperties(fname = r"/usr/share/fonts/truetype/wqy/wqy-microhei.ttc", size=15)
            plt.ylabel(u'实际结果',fontsize = 18,fontproperties = font_set)
            plt.xlabel(u'预测结果',fontsize = 18,fontproperties = font_set)
            plt.savefig('./test.png')
            print('accuracy %s' % accuracy_score(all_predictions, test_y))
            print(classification_report(test_y, all_predictions,target_names = cat_id_df['category_name'].values))
            print(classification_report(test_y, all_predictions))
        i += 1

以上的模型代码，请求各位大神帮我看看，为什么出现这样的结果？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
AIShark 2019-12-31 09:00
关注
检查模型中有没有BN操作，如果有Check下BN参数有没有得到更新并保存到模型中，关于BN操作参数更新的写法，百度一下有很多示例。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Tensorflow训练好模型后再进行预测精度没有训练时候评价的好？ python tensorflow 深度学习
2023-02-18 11:34

回答 4 已采纳方案来自梦想橡皮擦狂飙组基于 GPT 编写的 “程秘” 这个问题可能是由于在重新训练时没有正确处理数据集的划分而导致的，特别是训练数据集和测试数据集的划分。在划分数据集时，通常会将数据集分为训练
tensorflow 训练完后如何测试？尝试读取文件，报错了。 python tensorflow 深度学习
2022-08-01 00:41

回答 1 已采纳 Set up your data format vector and pass it into the Model for inference
使用tensorflow-gpu无法训练模型？ python tensorflow ubuntu
2021-08-09 15:02

回答 2 已采纳看你的运行结果是你的cuda版本过于低，gpu的性能没有完全利用，观察你的loss几乎没有变化，loss要下降趋势才是正常运行结果，调整一下超参数试试
tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题
2022-07-22 09:38

sifang_baweng的博客 tensorflow.keras 训练模型直接测试结果与导入模型文件测试结果不一致的问题
我安装了tensorflow，为什么import tensorflow时显示没有这个模型 python tensorflow 人工智能机器学习深度学习
2019-09-03 19:56

回答 3 已采纳你在电脑的cmd窗口安装的tensorflow只能在cmd窗口用，如果你要在其他的软件里用这个包，就要在那个软件重新安装一遍.比如你要在jupyter notebook里用，就要在jupyter 里面
tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？ python tensorflow 图像处理
2022-05-19 17:31

回答 2 已采纳 batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。
tensorflow 中怎么查看训练好的模型的参数呢？ tensorflow 神经网络
2018-09-18 03:37

回答 2 已采纳 https://blog.csdn.net/zwwhsxq/article/details/80525016 https://blog.csdn.net/AManFromEarth/article/
tensorark:Tensorark是一个Web应用程序，为使用TensorFlow进行深度学习的任务提供了图形界面
2021-04-06 11:44

上载的数据集必须包含以下结构，这一点很重要：设计神经网络的结构训练和测试神经网络查看与培训和测试过程相关的准确性和图形百分比导出训练好的模型导入模型以使用新数据对其进行测试安装过程要使用TensorArk，...
tensorflow.keras训练模型预测问题 keras python tensorflow
2023-03-04 11:08

回答 2 已采纳这种情况可能是由于模型在训练过程中出现了过拟合的现象。过拟合通常是指模型在训练集上表现很好，但在测试集上表现不佳的情况。在训练过程中，模型过度适应了训练集的噪声和特定的样本，从而导致了 val_los
tensorflow预训练模型input格式错误 python tensorflow 人工智能
2023-02-03 11:52

回答 4 已采纳后续增加numpy解决
tensorflow怎么解决这个问题，是什么问题，解决方法？ python tensorflow 神经网络
2022-04-12 09:36

回答 1 已采纳代码用控件提交，你这代码乱的.这个报错你要检查下是不是你优化器中loss的问题，你的数据标签是什么样子的，直接类别id的话不能用CategoricalCrossentropy()换成SparseCat
Tensorflow加载预训练模型和保存模型
2017-11-10 19:07

走召大爷的博客使用tensorflow过程中，训练结束后我们需要用到模型文件。有时候，我们可能也需要用到别人训练好的模型，并在这个基础上再次训练。这时候我们需要掌握如何操作这些模型数据。看完本文，相信你一定会有收获！
tensorflow.keras训练预测模型输出一直都是直线 keras python tensorflow
2023-03-06 22:21

回答 3 已采纳可能是因为模型训练不充分或者数据集不够多造成的，可以尝试增加训练次数或者增加数据集来提高模型的准确性。同时，也可以检查一下模型的结构和参数是否设置合理。
tensorflow加载训练好的模型、计算图和变量
2019-06-13 09:34

RF-or的博客 python不会像MATLAB一样，可以很方便的查看程序运行过程中生成的各个变量或参数值，但是有时候，需要查看某些变量的取值，比如，训练神经网络模型时，可能需要查看权重和偏置的取值。现总结一下利用python加载并输出...
两种方法--tensorflow训练好的模型保存和导入
2019-10-17 15:46

Brandon懂你的博客一、前言本文将会介绍tensorflow保存和恢复模型的两种方法，一种是传统的Saver类save保存和restore...
没有解决我的问题, 去提问

悬赏问题

¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！
¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示

tensorflow训练完模型直接测试和导入模型进行测试的结果不同，一个很好，一个略差，这是为什么？

2条回答 默认 最新

悬赏问题

2条回答默认最新