我看到一篇论文中的强化学习的状态是手动输入的,即通过导入状态数据集进行训练网络,但是之前学习的强化网络都是只输入初始状态,进而自动更新下一时刻的状态,从而训练网络,请问导入状态数据集的做法是否正确?
1条回答 默认 最新
- 有问必答小助手 2021-11-11 09:49关注
你好,我是有问必答小助手,非常抱歉,本次您提出的有问必答问题,技术专家团超时未为您做出解答
本次提问扣除的有问必答次数,已经为您补发到账户,我们后续会持续优化,扩大我们的服务范围,为您带来更好地服务。解决 无用评论 打赏 举报
悬赏问题
- ¥50 远程桌面打开Mastercam、没有许可证、物理机打开正常
- ¥15 ubuntu安装gdal后java读取tif文件报错
- ¥15 请问lammps怎么做两种金属连接的原子浓度分布图
- ¥15 求jacquard数据集
- ¥15 w10部分软件不能联网
- ¥15 关于安装hbase的问题(操作系统-windows)
- ¥15 novnc连接pve虚拟机报错安全协议不支持262
- ¥15 设备精度0.03给多少公差能达到CPK1.33
- ¥15 qt+ffmpeg报错non-existing PPS 0 referenced
- ¥15 FOC simulink