ZenMoore6345 2021-08-26 00:06 采纳率: 20%
浏览 7
已结题

SARSA/Q-Learning 为什么是模型无关的?

img

img

按道理,模型有关是指转移概率和即时奖励都是已知的。
然而这里,SARSA/Q-Learning 显然是可以计算出 r 和 s' 的,那为什么我们还说他是模型未知的,既然未知,我们怎么能算出 r 和 s' 呢?

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 9月3日
    • 创建了问题 8月26日

    悬赏问题

    • ¥15 系统 24h2 专业工作站版,浏览文件夹的图库,视频,图片之类的怎样删除?
    • ¥15 怎么把512还原为520格式
    • ¥15 MATLAB的动态模态分解出现错误,以CFX非定常模拟结果为快照
    • ¥15 求高通平台Softsim调试经验
    • ¥15 canal如何实现将mysql多张表(月表)采集入库到目标表中(一张表)?
    • ¥15 wpf ScrollViewer实现冻结左侧宽度w范围内的视图
    • ¥15 栅极驱动低侧烧毁MOSFET
    • ¥30 写segy数据时出错3
    • ¥100 linux下qt运行QCefView demo报错
    • ¥50 F1C100S下的红外解码IR_RX驱动问题