如何保存训练好的模型，并且调用训练好的模型使用其他的测试集来测试与求解目标总延迟最小。

这段代码是柔性job车间动态调度使用输入为Jnum,M_num, O_num.J, Processing_time, D,A的一套训练集训练dqn的代码，请问我该如何保存训练好的模型，并且调用训练好的模型使用其他的测试集来测试与求解目标总延迟最小。训练和测试的输入都是
Jnum,M_num, O_num.J, Processing_time, D,A，怎么传入这些参数。


import numpy as np
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "-1" #设置环境变量，以便在运行时仅使用CPU，而不是GPU
import random
from collections import deque
from tensorflow.keras import layers,models
import tensorflow as tf
from Job_Shop import Situation
from tensorflow.keras.optimizers import Adam
from Instance_Generator import Processing_time,A,D,M_num,Op_num,J,O_num,J_num
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False  # 用来正常显示负号
'''
回放Memory处应该有点问题。需要改一下。
'''
class DQN:
    def __init__(self,):
        self.Hid_Size = 30
        # ------------Hidden layer=5   30 nodes each layer--------------
        model = models.Sequential()
        model.add(layers.Input(shape=(7,)))
        model.add(layers.Dense(self.Hid_Size, name='l1'))
        model.add(layers.Dense(self.Hid_Size, name='l2'))
        model.add(layers.Dense(self.Hid_Size, name='l3'))
        model.add(layers.Dense(self.Hid_Size, name='l4'))
        model.add(layers.Dense(self.Hid_Size, name='l5'))
        model.add(layers.Dense(6, name='l6'))
        model.compile(loss='mse',
                      optimizer=Adam(learning_rate=0.001))
        # # model.summary()
        self.model = model
        #------------Q-network Parameters-------------
        self.act_dim=[1,2,3,4,5,6]                        #神经网络的输出节点
        self.obs_n=[0,0,0,0,0,0,0]                            #神经网路的输入节点
        self.gama = 0.95  # γ经验折损率
        # self.lr = 0.001  # 学习率
        self.global_step = 0
        self.update_target_steps = 200  # 更新目标函数的步长
        self.target_model = self.model
        #-------------------Agent-------------------
        self.e_greedy=0.6
        self.e_greedy_decrement=0.0001
        self.L=2         #Number of training episodes L 训练集数!!!!40 
        #---------------Replay Buffer---------------
        self.buffer=deque(maxlen=2000)
        self.Batch_size=10       # Batch Size of Samples to perform gradient descent
    def replace_target(self):
        self.target_model.get_layer(name='l1').set_weights(self.model.get_layer(name='l1').get_weights())
        self.target_model.get_layer(name='l2').set_weights(self.model.get_layer(name='l2').get_weights())
        self.target_model.get_layer(name='l3').set_weights(self.model.get_layer(name='l3').get_weights())
        self.target_model.get_layer(name='l4').set_weights(self.model.get_layer(name='l4').get_weights())
        self.target_model.get_layer(name='l5').set_weights(self.model.get_layer(name='l5').get_weights())
        self.target_model.get_layer(name='l6').set_weights(self.model.get_layer(name='l6').get_weights())
    def replay(self):
        if self.global_step % self.update_target_steps == 0:
            self.replace_target()
        # replay the history and train the modelUC1.#回放历史并训练模型
        minibatch = random.sample(self.buffer, self.Batch_size)
        for state, action, reward, next_state, done in minibatch:
            target = reward
            if not done:
                k=self.target_model.predict(next_state)
                target = (reward + self.gama *
                          np.argmax(self.target_model.predict(next_state)))
            target_f = self.model.predict(state)
            target_f[0][action] = target
            self.model.fit(state, target_f, epochs=1, verbose=0)
        self.global_step += 1
    def Select_action(self,obs):
        # obs=np.expand_dims(obs,0)
        if random.random()<self.e_greedy:
            act=random.randint(0,5)
        else:
            act=np.argmax(self.model.predict(obs))
        self.e_greedy = max(
            0.01, self.e_greedy - self.e_greedy_decrement)  # 随着训练逐步收敛，探索的程度慢慢降低
        return act
    def _append(self, exp):
        self.buffer.append(exp)
    def main(self,J_num, M_num, O_num, J, Processing_time, D, A):
        k = 0
        x=[]
        Total_tard=[]
        TR=[]
        for i in range(self.L):
            Total_reward = 0
            x.append(i+1)
            print('-----------------------开始第',i+1,'次训练------------------------------')
            obs=[0 for i in range(7)]
            obs = np.expand_dims(obs, 0)
            done=False
            Sit = Situation(J_num, M_num, O_num, J, Processing_time, D, A)
            for i in range(O_num):
                k+=1
                # print(obs)
                at=self.Select_action(obs)
                # print(at)
                if at==0:
                    at_trans=Sit.rule1()
                if at==1:
                    at_trans=Sit.rule2()
                if at==2:
                    at_trans=Sit.rule3()
                if at==3:
                    at_trans=Sit.rule4()
                if at==4:
                    at_trans=Sit.rule5()
                if at==5:
                    at_trans=Sit.rule6()
                # at_trans=self.act[at]
                print('这是第',i,'道工序>>','执行action:',at,' ','将工件',at_trans[0],'安排到机器',at_trans[1])
                Sit.scheduling(at_trans)
                obs_t=Sit.Features()
                if i==O_num-1:
                    done=True
                #obs = obs_t
                obs_t = np.expand_dims(obs_t, 0)
                # obs = np.expand_dims(obs, 0)
                # print(obs,obs_t)
                r_t = Sit.reward(obs[0][6],obs[0][5],obs_t[0][6],obs_t[0][5],obs[0][0],obs_t[0][0])
                self._append((obs,at,r_t,obs_t,done))
                if k>self.Batch_size:
                    # batch_obs, batch_action, batch_reward, batch_next_obs,done= self.sample()
                    self.replay()
                Total_reward+=r_t
                obs=obs_t
            total_tadiness=0
            Job=Sit.Jobs
            E=0
            K=[i for i in range(len(Job))]
            End=[]
            for Ji in range(len(Job)):
                End.append(max(Job[Ji].End))
                if max(Job[Ji].End)>D[Ji]:
                    total_tadiness+=abs(max(Job[Ji].End)-D[Ji])
            print('<<<<<<<<<-----------------total_tardiness总延迟:',total_tadiness,'------------------->>>>>>>>>>')
            Total_tard.append(total_tadiness)
            print('<<<<<<<<<-----------------reward奖励:',Total_reward,'------------------->>>>>>>>>>')
            TR.append(Total_reward)
            plt.plot(K,End,color='y') #绘制每个工件的结束时间，黄色
            plt.plot(K,D,color='r') #绘制每个工件的交货期，红色
            #plt.show() #显示绘制的图形
            plt.savefig("第%d次训练.png" % (i+1))
            plt.clf() #清楚当前绘画，以防下次迭代叠加到后续图形上
        plt.plot(x,Total_tard)
        plt.xlabel(u'训练步数', fontsize=14, color='r')# x,y坐标轴名称设置,可以同时设置标签的字体大小颜色等
        plt.ylabel(u'总延迟时间', fontsize=14, color='b')
        plt.title(u"DQN在每个训练步骤中获得的总延迟时间", fontsize=14, color='k') # 设置图形标题
        plt.savefig('总延迟.png')
        plt.show()
        return Total_reward
d=DQN()
d.main(J_num, M_num, O_num, J, Processing_time, D, A)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
笑面虎 2024-05-09 13:50
关注
以下内容由CHATGPT及笑面虎共同生成、有用望采纳：

问题概括

这个问题是关于如何保存一个使用深度强化学习（DQN）训练好的模型，并使用该模型来测试其他测试集以求解目标总延迟最小化的问题。

问题出现原因

这个问题出现的原因是用户需要知道如何将训练好的模型保存到磁盘上，并且在之后加载这个模型来对新的数据集进行预测。在机器学习项目中，这是一个常见的需求，特别是在训练完成后需要将模型部署到生产环境或者进行进一步的测试时。

问题解决方案

为了解决这个问题，我们需要做两件事：一是在模型训练完成后保存模型；二是在需要的时候加载模型并用它来进行预测。

提供代码

以下是修改后的代码，展示了如何保存和加载模型：

import tensorflow as tf class DQN: # ... [其余代码保持不变] ... def save_model(self, filepath): self.model.save(filepath) def load_model(self, filepath): self.model = tf.keras.models.load_model(filepath) # 假设训练完成后保存模型 dqn = DQN() # ... [训练过程代码] ... dqn.save_model('dqn_model.h5') # 之后，当你需要加载模型进行测试时： dqn.load_model('dqn_model.h5') # 此时，dqn.model 包含了训练好的模型，可以用来进行预测

代码运行方式

运行这段代码，你需要有Python环境，并且安装了TensorFlow。保存模型的代码应该在训练过程结束后执行，加载模型的代码可以在任何需要使用模型进行预测的时候执行。

代码预期运行结果

保存模型后，你会在指定的路径下得到一个名为dqn_model.h5的文件，这个文件包含了训练好的模型。加载模型后，你可以使用dqn.model来进行预测，就像使用训练好的模型来测试新的数据集一样。

推荐相关链接

TensorFlow 官方文档
Keras 官方文档
深度强化学习（DQN）介绍
如何保存和加载TensorFlow模型
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

如何调用训练好的机器学习模型处理新数据集？人工智能数据挖掘机器学习
2022-02-07 01:05

回答 1 已采纳直接加载模型然后对新数据集进行预测啊，结果就是0或者1，然后把结果按照之前训练的数据集格式写入一个新的csv，这就是相当于打上标签了，但是这个标签不一定是全部对的，除非你能保证你的模型推理结果一定是正
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
请问YOLO已经训练好了自己的模型文件，best.pt的文件，如何写代码调用这个文件，输出检测的数量和准确度等信息。 opencv pytorch 计算机视觉
2021-12-20 12:49

回答 2 已采纳 model的输入一般是是4维的【bs,c,h,w】,你这么写只有三个维度，而且也没有转成tensor，能运行就是奇迹了，没有报维度不匹配？
LLM（大语言模型）——大模型简介
2024-06-04 20:53

AGI大模型资料分享官的博客深度学习先驱Bengio在他的经典论文《A Neural Probabilistic LanguageModel》中，首次将深度学习的思想融入到语言模型中，使用了更强大的神经网络模型，这相当于为计算机提供了更强大的“大脑”来理解语言。
求助--web自动化测试，断言测试结果和实际结果的时候，断言失败怎么保存截图和打印日志信息 python selenium 人工智能开发语言测试用例
2020-02-29 14:59

回答 1 已采纳 except捕获异常后，截完图，再手动raise一个错误出来就可以
Python 2.7 测试代码能不能争取使用姓、名、中间名并调用 python
2018-06-02 12:55

回答 2 已采纳最后两个字串的拼接少了空白符
C++与Python训练出来的TensorFlow或者Caffe 模型的文件是一样的吗？ tensorflow 人工智能深度学习神经网络
2020-05-09 10:47

回答 2 已采纳 Caffe如果模型完全一样的话，是可以通用的。tf的话，不同版本模型可能不兼容。
LLM（大语言模型）深度解析
2024-06-14 10:25

heaven522的博客深度学习先驱Bengio在他的经典论文《A Neural Probabilistic Language Model》中，首次将深度学习的思想融入到语言模型中，使用了更强大的神经网络模型，这相当于为计算机提供了更强大的“大脑”来理解语言。...
采用kaggle训练yolov5口罩模型，出现Dataset not found问题 opencv 人工智能计算机视觉
2022-10-22 11:19

回答 1 已采纳
jmeter 测试同一账户登录后，先调用一个接口，再调用一个接口，如何查看两个接口响应时间之和 java postman selenium 测试用例
2020-05-27 16:57

回答 1 已采纳将两个接口放在同一个事务控制器中，位置-添加--》逻辑控制器--》事务控制器然后勾选Generate parent sample,则事务控制器的响应时间就是两个接口响应时间之和了
动态库内部是怎么根据调用者的编程语言来决定使用什么内存堆栈模式呢？
2016-08-11 12:59

回答 1 已采纳 https://segmentfault.com/q/1010000000634864
最新语言大模型综述 Large Language Models A Survey
2024-04-09 13:26

数智笔记的博客 LLMs通过在大量文本数据上训练数十亿个模型参数获得了通用语言理解和生成能力，这符合缩放定律的预测。LLMs的研究领域虽然非常新颖，但在许多不同方面迅速发展。本文回顾了一些最著名的LLMs，包括三个流行的LLM系列...
动态链接库函数使用的编程语言和调用动态库的编程语言是怎么协调堆内存的？
2016-08-13 13:49

回答 1 已采纳 http://www.cnblogs.com/oandg5/p/3335988.html
AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.03.10-2024.03.15
2024-03-15 15:39

小小帅AIGC的博客因果推理通过捕捉变量之间的因果关系，在提高自然语言处理（NLP）模型的预测准确性、公平性、稳健性和可解释性方面显示出潜力。生成式大型语言模型（LLM）的出现极大地影响了各种 NLP 领域，尤其是通过其先进的推理...
克服资源障碍：大模型量化技术与高效部署策略全解析
2024-06-27 17:35

源大模型的博客本文综述了大模型量化的方法、适用场景以及最新的研究进展，为读者解决部署使用大模型时遇到的计算资源不足的情景提供了一种视角
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月9日

悬赏问题

¥20 找辅导初学者想实现一个项目没有方向
¥15 关于渗漏场的电场分布模拟
¥24 matlab怎么修改仿真初始时间
¥15 两分段线性回归模型分析阈值效应
¥15 前端和后端代码都没报错，但是点登录没反应的？
¥100 需要远程解决QSQLITE问题！
¥15 利用光场表达式画出初始光场强度分布图像等几个问题在这两个图片里
¥15 gozero求手把手教学，400一天
¥15 泥浆冲清水的泥浆分布
¥15 LASSO回归分析筛选关键基因，适合多大样本量？

如何保存训练好的模型，并且调用训练好的模型使用其他的测试集来测试与求解目标总延迟最小。

4条回答 默认 最新

问题概括

问题出现原因

问题解决方案

提供代码

代码运行方式

代码预期运行结果

推荐相关链接

问题事件

悬赏问题

4条回答默认最新