关于强化学习状态的输入问题，python

我看到一篇论文中的强化学习的状态是手动输入的，即通过导入状态数据集进行训练网络，但是之前学习的强化网络都是只输入初始状态，进而自动更新下一时刻的状态，从而训练网络，请问导入状态数据集的做法是否正确？

论文：Deep Reinforcement Learning for Online Computation Offloading
论文源码解析：

【源码解析】Deep Reinforcement Learning for Online Computation Offloading_cherry-CSDN博客 main.py# ################################################################## Deep Reinforcement Learning for Online Ofﬂoading in Wireless Powered Mobile-Edge Computing Networks## This file contains the main code of DROO. It loads the training sam..

https://blog.csdn.net/qq_40472181/article/details/114148163

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

关于excel多级表头合并问题python解决方案 python
2022-06-06 16:47

回答 3 已采纳 1，2 差不多吧，就是第一行，第二行内容合并在一起，一个有连接符，一个没有给你一个合并A1,A2单元格，逗号分隔的例子 import openpyxl import pandas as pd p
python怎么让用户输入列表 list python
2022-05-27 00:56

回答 2 已采纳用户如果输入是列表的话，直接用eval()函数就可以了 def isPrime(n): if n<2:return False for i in range(2,int(n**0
Python有关制作英文学习词典问题。 python
2021-12-31 21:48

回答 4 已采纳可以参考下这个 #英文字典 def oppendict(): dir = 'mydict.txt' dicts = {} tf=open(dir,'r+')
深度强化学习求解作业车间调度问题的python实现
2022-03-23 10:33

深度强化学习在现代人工智能领域中占据着重要地位，特别是在解决复杂优化问题方面展现出了巨大的潜力。本项目聚焦于使用深度强化学习求解作业车间调度问题（Job Shop Scheduling Problem，简称JSP），这是一种典型的...
人口增长问题python python
2022-10-20 16:13

回答 3 已采纳 start = 2018 t = 14 r = float(input())/100 i = 0 while 1: i += 1 t *= 1+r if t > 16:
python如何实现不满足条件重新输入 python
2021-11-13 15:12

回答 2 已采纳 while True: data = input('输入信息：') if data in ['yes', 'ok', 'good', 'nice']: # 符合的字符串信息
python输入学号找到名字 python
2022-03-09 23:37

回答 1 已采纳你需要将这些列表放在一个列表中如这种格式 names = [ [ ], [ ], [ ], ]
DQN深度强化学习解决三维在线装箱问题python源码+项目说明.zip
2024-04-08 22:07

DQN深度强化学习解决三维在线装箱问题python源码+项目说明.zip ## 问题描述物流公司在流通过程中，需要将打包完毕的箱子装入到一个货车的车厢中，为了提高物流效率，需要将车厢尽量填满，显然，车厢如果能被100%填...
关于使用python jaydebeapi 异常问题 python
2020-08-04 16:55

回答 1 已采纳我一般用 pymysql 安装：pip pymysql import pymysql conn = pymysql.connect(host,port,user,pwd,databa
python存款买房1问题解答 python 开发语言
2022-10-26 17:29

回答 1 已采纳 total_cost = float(input("请输入总房价: ")) # total_cost为当前房价 annual_salary = float(input("请输入年薪: ")) #
用Python编程输入的数字以0结束 python
2021-10-29 22:19

回答 1 已采纳 s1=s2=0 while 1: n=int(input()) if n==0: break if n%3==0: s1+=1 if n
Python深度强化学习求解动态旅行商问题源码
2024-03-07 20:14

在本项目中，"Python深度强化学习求解动态旅行商问题源码" 是一个利用Python编程语言和深度强化学习（Deep Reinforcement Learning, DRL）技术来解决动态旅行商问题（Dynamic Traveling Salesman Problem, DTSP）的...
python关于歌手大赛得分输出的问题 python
2022-05-15 21:43

回答 2 已采纳 with open('score.txt','r') as f: data = f.read() scores = [s.split(',') for s in data.split('\n
深度强化学习应用无人机附python代码.zip
2024-05-21 23:30

在给定的压缩包文件“深度强化学习应用无人机附python代码.zip”中，我们可以找到一系列与DRL在无人机控制方面的实践应用相关的Python代码。首先，DRL的基础是强化学习，它通过智能体与环境的交互来学习最优策略。...
Python-TensorFlow实现的强化学习算法集锦
2019-08-11 07:27

本文将围绕"Python-TensorFlow实现的强化学习算法集锦"这一主题，深入探讨相关知识点。 1. **强化学习基础**： - 强化学习的基本元素：智能体（Agent）、环境（Environment）、动作（Action）、状态（State）和...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 11月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月9日

悬赏问题

¥15 手机应用程序安装异常
¥15 grbl的G92修改MPos的问题。
¥15 vue2中，Ant Design Pro s-table中，使用服务端排序怎么做
¥15 阿里巴巴国际站的商品详细页如何做到图文分离
¥15 根据质因子个数求因式个数
¥15 matlab模糊控制隶属函数设计
¥45 C++上传文件到SFTP
¥20 组态王海康Vision Master
¥15 思科WS-C4503-E核心交机
¥15 批量提取WORD信息到EXCEL

关于强化学习状态的输入问题，python

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新