weixin_45650618 2022-05-16 13:47 采纳率: 0%
浏览 109
已结题

如何用DDPG解决离散和连续问题

想问下如果动作空间既有连续的,又有离散的,可以使用DDPG吗,该如何使用,actor网络输出该如何设置,在actor输出层对连续动作使用tanh,离散动作用softmax,这样可行吗

  • 写回答

0条回答 默认 最新

      编辑
      预览

      报告相同问题?

      问题事件

      • 系统已结题 5月23日
      • 修改了问题 5月17日
      • 创建了问题 5月16日

      悬赏问题

      • ¥15 点云密度大则包围盒小
      • ¥15 nginx使用nfs进行服务器的数据共享
      • ¥15 C#i编程中so-ir-192编码的字符集转码UTF8问题
      • ¥15 51嵌入式入门按键小项目
      • ¥30 海外项目,如何降低Google Map接口费用?
      • ¥15 fluentmeshing
      • ¥15 手机/平板的浏览器里如何实现类似荧光笔的效果
      • ¥15 盘古气象大模型调用(python)
      • ¥15 传人记程序做的plc 485从机程序该如何写
      • ¥15 已知手指抓握过程中掌指关节、手指各关节和指尖每一帧的坐标,用贝塞尔曲线可以拟合手指抓握的运动轨迹吗?
      手机看
      程序员都在用的中文IT技术交流社区

      程序员都在用的中文IT技术交流社区

      专业的中文 IT 技术社区,与千万技术人共成长

      专业的中文 IT 技术社区,与千万技术人共成长

      关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

      关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

      客服 返回
      顶部