tensorflow2+ 版本梯度带断流问题

大致思路如下：
模型A 预测输入x的标签y_pred
模型B 根据输入的y_pred和真实标签y输出一个数值loss_A作为模型A 的损失
根据loss_A计算模型A的梯度，并更新模型A
更新的A重新预测x的标签，为y_pred_new
此时计算y和y_pred_new的交叉熵损失loss，更新模型B，但是在loss对模型B的求梯度时，梯度全为none

请问该如何修改下面代码才能实现这个功能？

代码如下


ModelA(x)  #  param: theta
# 网络# 
return  y_pred


ModelB(y, y_pred)  # param: beta
# 网络 # 
return z  # 该代码中z作为modelA的loss更新A


with tf.GradientTape() as tape_1:
    with tf.GrandientTape() as tape:
        y_pred = ModelA(x)
        loss_A = ModelB(y, y_pred)
    grads = tape.gradient(loss_A, ModelA.trainable_variables)
    optimizer.apply_gradients(zip(grads, ModelA.trainable_variables)
    y_pred_new = ModelA(x)
    loss = categorical_crossentropy(y, y_pred_new)
grads_1 = tape_1.gradient(loss, ModelB.trainable_variables)  #  ！！！！此处出现问题，梯度全为none
optimizer.apply_gradients(zip(grads_1, ModelB.trainable_variables)

公式过程大致如下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
影醉阏轩窗 2021-11-04 14:49
关注
不愿意花时间看你的代码，仅看问题描述比较简单，直接定义AB模型，手动更新和控制梯度即可。

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

用tensorflow做梯度下降 python tensorflow 机器学习
2022-09-22 09:25

回答 2 已采纳以使网络模型更快地输出优质的 one-hot 编码 ->这个说的更明显http://t.csdn.cn/DzXTX ，但总的意思就是为加快网络输出结果尽快向 one-hot 编码收敛需要做一个变
tensorflow2.x 深度学习使用相同梯度进行梯度下降的两个相同神经网络，得到的结果却不同 tensorflow 深度学习神经网络
2021-03-12 00:07

回答 2 已采纳在上面给的代码的第164行处插入 optimizer = optimizers.Adam(lr=1e-4) 重新初始化optimizer，这样两个模型训练后的测试结果就一样了，望采纳
TensorFlow中的梯度下降函数的疑问 tensorflow
2017-12-19 17:17

回答 2 已采纳对平方差求导，指数项下来就是那个2
dnn_tensorflow_cpp:该项目是仅使用TensorFlow C ++进行训练的简单深度神经网络
2021-05-17 19:29

在深度学习领域，TensorFlow是一个广泛使用的开源框架，它提供了Python和C++两种主要的编程接口。本项目“dnn_tensorflow_cpp”专注于利用TensorFlow的C++ API来构建和训练一个简单的深度神经网络（DNN）。这为...
梯度下降算法、牛顿迭代算法的相关问题人工智能机器学习算法
2022-02-08 11:56

回答 2 已采纳这些知识属于工程数学原理的内容，具体分支是最优化理论，您可以参考相关教材。一般地，优化问题可以分为无约束优化和有约束优化，您提到的梯度法和牛顿法都属于无约束优化中的梯度类方法，此外无约束优化中还有非梯
tensorflow中神经网络优化器问题 tensorflow
2018-11-09 08:17

回答 1 已采纳梯度下降算法的优化器就是一种BP算法除了梯度下降（GD）或者随机梯度下降（SGD），还有很多别的BP算法，比如Adam、Adadelta、RMSprop，通称“优化器”，所谓优化器就是调整模型权重
用tensorflow做机器翻译时训练代码有问题 python tensorflow 神经网络
2019-05-27 16:45

回答 2 已采纳谢谢大家，已经解决了
基于TensorFlow中自定义梯度的2种方式
2020-09-18 00:42

在深度学习中，自定义梯度是解决特定问题的关键技术，尤其当标准的反向传播算法无法满足某些操作的需求时。TensorFlow 提供了多种方法来实现自定义梯度，这里我们将详细介绍两种主要的方式。首先，第一种方法是**...
生成式对抗网络中梯度消失的问题
2017-10-19 07:38

回答 1 已采纳请搜索关于wgan的内容，自然会明白
深度学习有关梯度的问题 python 机器学习深度学习
2022-08-02 19:28

回答 2 已采纳没啥问题，在你 a 的初值为 a = 0.0827 的情况下，d 最终为可以表达为 d = (2^14) * a = 16384 * a，所以 d 关于 a 的偏导数为 dd/da = 16384，属
tensorflow中的.numpy()函数是啥 python tensorflow 机器学习
2022-09-22 14:57

回答 4 已采纳因为这里的loss是tensor，所以调用loss.numpy()将其转换为numpy数组。这里最主要的原因是loss_all一开始不是tensor类型，如果loss_all是tensor类型，则可以
Win10+Tensorflow1.7.0+Python3.6+Spyder配置
2018-04-12 16:40

* 安装TensorFlow 1.7.0，支持GPU和CPU两种版本二、安装TensorFlow * 使用pip安装TensorFlow-gpu或TensorFlow，视GPU支持情况而定 * 需要安装CUDA 9.0和cuDNN 7.0，以支持GPU加速三、安装Spyder * 使用conda...
关于机器学习梯度下降求 w 和 b 的问题人工智能机器学习深度学习
2020-02-22 14:04

回答 2 已采纳 fit函数里面的while循环里的第一个if语句是想判断当前求得的self.w的精度，如果self.w和b的改变小于precision即认为精度达到要求，退出循环！而第一次while循环时明显
Tensorflow实现部分参数梯度更新操作
2020-09-18 01:39

本文将深入探讨如何在 TensorFlow 中实现部分参数的梯度更新。首先，迁移学习常常涉及到在预训练模型的基础上微调部分层。为保持某些层的参数不变，可以使用 Variable Scope 来筛选出需要更新的变量。`get_...
tensorflow 查看梯度方式
2020-09-18 00:41

了解如何在 TensorFlow 中查看梯度对于调试和优化模型至关重要。下面我们将深入探讨为什么需要查看梯度，以及在 TensorFlow 中如何实现这一操作。首先，我们来谈谈为什么要在训练过程中查看梯度。梯度是损失函数相...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月4日

悬赏问题

¥20 指导如何跑通以下两个Github代码
¥15 大家知道这个后备文件怎么删吗，为啥这些文件我只看到一份，没有后备呀
¥15 C++为什么这个代码没报错运行不出来啊
¥15 一道ban了很多东西的pyjail题
¥15 关于#r语言#的问题：如何将生成的四幅图排在一起，且对变量的赋值进行更改，让组合的图漂亮、美观@（相关搜索：森林图）
¥15 C++识别堆叠物体异常
¥15 微软硬件驱动认证账号申请
¥15 GPT写作提示指令词
¥20 根据动态演化博弈支付矩阵完成复制动态方程求解和演化相图分析等
¥15 华为超融合部署环境下RedHat虚拟机分区扩容问题

tensorflow2+ 版本梯度带断流问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新