Kw!G 2021-10-27 20:34 采纳率: 60%
浏览 12
已结题

DQN,图中计算价值函数的部分是什么意思?

img

如图,Q直接用self.qnet(b_o)不可以吗,tf.reduce_sum(self.qnet(b_o) * tf.one_hot(b_a, action_dim), 1)想表达什么意思?

b_o是当前状态,也就是当前的图像
b_a是当前状态下的动作
b_r是当前状态下的奖励
b_o_是下一个状态

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 11月4日
    • 创建了问题 10月27日

    悬赏问题

    • ¥20 怎么用dlib库的算法识别小麦病虫害
    • ¥15 华为ensp模拟器中S5700交换机在配置过程中老是反复重启
    • ¥15 java写代码遇到问题,求帮助
    • ¥15 uniapp uview http 如何实现统一的请求异常信息提示?
    • ¥15 有了解d3和topogram.js库的吗?有偿请教
    • ¥100 任意维数的K均值聚类
    • ¥15 stamps做sbas-insar,时序沉降图怎么画
    • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
    • ¥15 关于#Java#的问题,如何解决?
    • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算