奇奇1031261277 2022-06-16 15:29 采纳率: 100%
浏览 249
已结题

tensorflow断点续训报错

tensorflow断点续训报错,求解

checkpoint_save_path = "./checkpoint/mnist.ckpt"
if os.path.exists(checkpoint_save_path + '.index'):
    print('-------------load the model-----------------')
    model.load_weights(checkpoint_save_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_save_path,
                                                 save_weights_only=True,
                                                 save_best_only=True)
history = model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1,
                    callbacks=[cp_callback])

运行结果:

2022-06-16 15:10:06.532407: W tensorflow/core/framework/op_kernel.cc:1745] OP_REQUIRES failed at save_restore_v2_ops.cc:283 : UNKNOWN: Failed to rename: ./checkpoint\mnist.ckpt_temp/part-00000-of-00001.data-00000-of-00001 to: ./checkpoint\mnist.ckpt.data-00000-of-00001 : ���ļ��Ѵ���ʱ���޷��������ļ���
; Unknown error
Traceback (most recent call last):
  File "D:/tensorflow/class4/class4/MNIST_FC/p16_mnist_train_ex3.py", line 29, in <module>
    callbacks=[cp_callback])
  File "D:\Python37\lib\site-packages\keras\utils\traceback_utils.py", line 67, in error_handler
    raise e.with_traceback(filtered_tb) from None
  File "D:\Python37\lib\site-packages\tensorflow\python\eager\execute.py", line 55, in quick_execute
    inputs, attrs, num_outputs)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 137: invalid start byte
  • 写回答

3条回答 默认 最新

  • 奇奇1031261277 2022-06-23 17:27
    关注

    执行model.load_weights(filepath)后,filepath这个文件会被占用,无法删除或重命名,导致后面的回调函数ModelCheckpoint(filepath)无法自动保存权重文件。暂时想到的方法是,model.load_weights(filepath1)和ModelCheckpoint(filepath2)使用两个不同的文件名,经测试可行。只是每次运行都需要修改model.load_weights(filepath)的参数。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 7月1日
  • 已采纳回答 6月23日
  • 创建了问题 6月16日

悬赏问题

  • ¥15 对于这个复杂问题的解释说明
  • ¥50 三种调度算法报错 采用的你的方案
  • ¥15 关于#python#的问题,请各位专家解答!
  • ¥200 询问:python实现大地主题正反算的程序设计,有偿
  • ¥15 smptlib使用465端口发送邮件失败
  • ¥200 总是报错,能帮助用python实现程序实现高斯正反算吗?有偿
  • ¥15 对于squad数据集的基于bert模型的微调
  • ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
  • ¥20 steam下载游戏占用内存
  • ¥15 CST保存项目时失败