panbaoran913 2021-08-10 22:28 采纳率: 71.4%
浏览 28
已结题

A Deep Reinforcement Learning Framework for Rebalancing Dockless Bike Sharing Systems求答疑

img
在DDPG的基础上加入了分层结构。在这里有几个问题想要咨询一下。

  1. 算法模型中出现的GRU是否所有的参数共享?
  2. 在actor_network中出现的GRU输入数据是【sj1,sj2,..sjT】,输出的结果是【yj1,yj2,..yjT】,而在critic_network中输入的数据是【(sj1,pj1),(sj2,pj2),..,(sjT,pjT)】,是这个样子嘛?
  3. 在critic_network中的localized Module是经过一个两层全连接网络,其这个网络的参数是如何变化与更新的那 ?这部分在求Q(st,at)中属于偏置项,是代表着网络的参数不变的嘛?这个偏置量的来源是什么呢?
  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 8月18日
    • 创建了问题 8月10日

    悬赏问题

    • ¥15 is not in the mmseg::model registry。报错,模型注册表找不到自定义模块。
    • ¥15 安装quartus II18.1时弹出此error,怎么解决?
    • ¥15 keil官网下载psn序列号在哪
    • ¥15 想用adb命令做一个通话软件,播放录音
    • ¥30 Pytorch深度学习服务器跑不通问题解决?
    • ¥15 部分客户订单定位有误的问题
    • ¥15 如何在maya程序中利用python编写领子和褶裥的模型的方法
    • ¥15 Bug traq 数据包 大概什么价
    • ¥15 在anaconda上pytorch和paddle paddle下载报错
    • ¥25 自动填写QQ腾讯文档收集表