强化学习为什么要引入马尔可夫决策过程?为什么要把马尔可夫决策过程作为理论依据?马尔可夫性质对强化学习有什么关键点是不能被替代的?
1条回答 默认 最新
- ·星辰大海 2022-09-30 21:46关注
大部分带有随机的算法证明收敛都是用马尔可夫来做的,比如pso的收敛验证,ga的收敛等一众进化演化算法
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 PADS Logic 原理图
- ¥15 PADS Logic 图标
- ¥15 电脑和power bi环境都是英文如何将日期层次结构转换成英文
- ¥20 气象站点数据求取中~
- ¥15 如何获取APP内弹出的网址链接
- ¥15 wifi 图标不见了 不知道怎么办 上不了网 变成小地球了
- ¥50 STM32单片机传感器读取错误
- ¥50 power BI 从Mysql服务器导入数据,但连接进去后显示表无数据
- ¥15 (关键词-阻抗匹配,HFSS,RFID标签天线)
- ¥15 机器人轨迹规划相关问题