强化学习为什么要引入马尔可夫决策过程?为什么要把马尔可夫决策过程作为理论依据?马尔可夫性质对强化学习有什么关键点是不能被替代的?
1条回答 默认 最新
- ·星辰大海 2022-09-30 21:46关注
大部分带有随机的算法证明收敛都是用马尔可夫来做的,比如pso的收敛验证,ga的收敛等一众进化演化算法
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 教务系统账号被盗号如何追溯设备
- ¥20 delta降尺度方法,未来数据怎么降尺度
- ¥15 c# 使用NPOI快速将datatable数据导入excel中指定sheet,要求快速高效
- ¥15 再不同版本的系统上,TCP传输速度不一致
- ¥15 高德地图点聚合中Marker的位置无法实时更新
- ¥15 DIFY API Endpoint 问题。
- ¥20 sub地址DHCP问题
- ¥15 delta降尺度计算的一些细节,有偿
- ¥15 Arduino红外遥控代码有问题
- ¥15 数值计算离散正交多项式