奇奇1031261277 2022-06-16 15:29 采纳率: 100%
浏览 258
已结题

tensorflow断点续训报错

tensorflow断点续训报错,求解

checkpoint_save_path = "./checkpoint/mnist.ckpt"
if os.path.exists(checkpoint_save_path + '.index'):
    print('-------------load the model-----------------')
    model.load_weights(checkpoint_save_path)

cp_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_save_path,
                                                 save_weights_only=True,
                                                 save_best_only=True)
history = model.fit(x_train, y_train, batch_size=32, epochs=5, validation_data=(x_test, y_test), validation_freq=1,
                    callbacks=[cp_callback])

运行结果:

2022-06-16 15:10:06.532407: W tensorflow/core/framework/op_kernel.cc:1745] OP_REQUIRES failed at save_restore_v2_ops.cc:283 : UNKNOWN: Failed to rename: ./checkpoint\mnist.ckpt_temp/part-00000-of-00001.data-00000-of-00001 to: ./checkpoint\mnist.ckpt.data-00000-of-00001 : ���ļ��Ѵ���ʱ���޷��������ļ���
; Unknown error
Traceback (most recent call last):
  File "D:/tensorflow/class4/class4/MNIST_FC/p16_mnist_train_ex3.py", line 29, in <module>
    callbacks=[cp_callback])
  File "D:\Python37\lib\site-packages\keras\utils\traceback_utils.py", line 67, in error_handler
    raise e.with_traceback(filtered_tb) from None
  File "D:\Python37\lib\site-packages\tensorflow\python\eager\execute.py", line 55, in quick_execute
    inputs, attrs, num_outputs)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 137: invalid start byte
  • 写回答

3条回答 默认 最新

  • 奇奇1031261277 2022-06-23 17:27
    关注

    执行model.load_weights(filepath)后,filepath这个文件会被占用,无法删除或重命名,导致后面的回调函数ModelCheckpoint(filepath)无法自动保存权重文件。暂时想到的方法是,model.load_weights(filepath1)和ModelCheckpoint(filepath2)使用两个不同的文件名,经测试可行。只是每次运行都需要修改model.load_weights(filepath)的参数。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 7月1日
  • 已采纳回答 6月23日
  • 创建了问题 6月16日

悬赏问题

  • ¥15 Excel表只有年月怎么计算年龄
  • ¥50 资源管理器无法使用且一直崩溃重启
  • ¥15 用sql语句完成下列问题
  • ¥50 yalmip+Gurobi 求解线性规划
  • ¥15 微信开发者工具/云函数/数据库
  • ¥15 如何导出数据库中的表格
  • ¥15 Torch not compiled with CUDA enabled
  • ¥15 三种节点编号优化算法比较
  • ¥15 比特币ord程序wallet_constructor.rs文件支持一次性铸造1000个代币,并将它们分配到40个UTXO上(每个UTXO上分配25个代币),并设置找零地址
  • ¥115 用Java解决探地雷达dzt文件的解析过程