哈喽啊，老铁们。有伙伴研究强化学习中的DDPG算法吗，我现在的问题是：算法中对于actor网络，目标

哈喽啊，老铁们。有伙伴研究强化学习中的DDPG算法吗，我现在的问题是：算法中对于actor网络，目标网络权值w'的更新与当前网络权值w有关，也就是w'=tau*w+(tau-1)*w'。当前网络权值w是基于梯度下降法更新的，而目标网络权值w'更新是基于上面那个式子的，那目标网络对于权值的训练是不是就不需要梯度下降法了?

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
我的名字是！伊！泽！瑞！尔! 2021-12-30 22:50
关注
对的，在训练过程结束时进行目标网络和当前网络的软更新，也就是上面那个式子

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

JAVA语法学习1（完结）
2023-08-20 13:57

一只黑鹿的博客 JAVA基础学习一. java环境的配置及JDK下载安装二.基本HelloWorld语法及IDEA下载三.IDEA的入门使用及快捷键四.JAVA基础语法 1. 注释 2. 字面量 3. 变量 4.二进制 5.数据类型的分类 6. 关键字 7.标识符 8.自动强制...
51c深度学习~合集9
2024-12-10 22:15

whaosoft-143的博客我们知道，神经网络，哪怕是最简单的多层感知机（MLP），都有着很强的泛化能力：训练完毕后，对于训练集里完全没见过的输入，网络也能给出很正确的输出。这反映了神经网络的连续性：如果输入的变化是连续的，那么...
JavaEE：多线程(2)：线程状态，线程安全
2024-01-22 21:43

cx努力编程中的博客内存可见性引起的线程安全问题等待和通知机制线程饿死 wait notify 线程状态就绪：线程随时可以去CPU上执行，也包含在CPU上执行的线程阻塞：这个线程暂时不方便去CPU上执行 Java中，线程有下面几个状态 1....
DAPP三三复制公排矩阵互助滑落模式系统开发详细规则/源码版
2024-04-30 17:04

huaxinjiayou的博客我想找Java后端的工作，想起来去年的这个时候，我刚刚从百度提桶跑路，在回家的高铁上，赶着回家毕业，与朋友见面，兵荒马乱的写下。# 线上，为啥不能线上，50个人的公司，告诉我等毕业到公司线下面。
【中文】【吴恩达课后编程作业】Course 5 - 序列模型 - 第二周作业 - 词向量的运算与Emoji生成器
2018-10-24 14:42

何宽的博客在本博客中，我们将学习到：如何加载训练好了的词向量使用余弦相似性计算相似度使用词嵌入来解决“男人与女人相比就像国王与____ 相比”之类的词语类比问题修改词嵌入以减少性别偏见等我们先来加载所...
Java入门到精通(干就完了)
2022-10-08 22:35

MaNong125的博客文章目录 1、Java语言概述 2、Java开发环境的准备:JDK简介、安装、常用命令 3、Java入门程序 3.1、Hello World 3.2 常见问题 3.3 Java程序的执行原理 3.4 JDK组成、跨平台原理 3.5 JDK安装后Path和Java_home环境变量...
见微知细之超分辨率GAN！附70多篇论文下载！
2020-03-06 23:46

机器学习与AI生成创作的博客点击上方“机器学习与生成对抗网络”，关注"星标"获取有趣、好玩的前沿干货！这日，你伸着懒腰，打着呵欠，对着窗外，正感慨时光已逝，红了樱桃绿了芭蕉……忽然，桌面上的手机传来...
MySQL的事务以及锁详解
2020-08-20 21:55

寻烟的衣袖的博客老铁有一提问“MySQL的可重复读级别能解决幻读吗”，一听就有猫腻，实话说，之前从未思考到这个问题，很是懵逼，于是深入查看，发现了自己的细节欠缺是在太多，补上！事务基础知识：数据库原理理论事务...
200000000 Token! 这样的生日礼物, 简直不可思议...
2019-04-13 12:05

区块链大本营的博客来源 | 《深入理解EOS·原理解析与开发实战》作者 | 李万才、林琪钧编辑 | 乔治出品 | 区块链大本营（blockchain_camp）hi，老铁们！今天营长分享一...
一文看懂以太坊2.0最新进展
2019-04-02 18:05

区块链大本营的博客开发者们即将开始着手解决这些棘手的问题：更多内容详见下文。这就是以太坊2.0现在的情况。过去的9个月是一段令人震惊的时期。我想我们大概已经走了四分之一到三分之一的路程。按照这个速度，以太坊2.0将在英国正式...
牛客面经
2018-05-13 14:50

weixin_33933118的博客作者：给个offer养家糊口 ...order=3&pos=13&page=1 来源：牛客网一共投了20家简历 ...网易云音乐，笔试挂 ...百度，三面结束至今没消息（凉没凉透也...腾讯，二面挂两次（再次感谢第二次面试的时候一面小哥请我...
没有解决我的问题, 去提问

哈喽啊，老铁们。有伙伴研究强化学习中的DDPG算法吗，我现在的问题是：算法中对于actor网络，目标

1条回答 默认 最新

1条回答默认最新