tensorflow2.x 更新时梯度为none的问题

问题如下图，部分操作简化，最近在尝试实现meta SGD方法，使用tf.GrandientTape 时遇到梯度为none的问题，去百度找了一圈还是找不到哪里出错，各位仙男仙女们帮忙看看，感激不尽
下面为代码

with tf.GradientTape() as tape:
    with tf.GradientTape() as tape_1:
        loss_1 = operation_A  # 计算损失
    grads_1 = tape_1.gradient(loss_1, meta_model.trainable_variables)  # 此处梯度没问题

    # 更新权重
    # task_lr形状与grads相同（也就是和trainable_variables形状完全相同），且为变量，对模型权重进行更新
    adapted_params = []
    for i in range(len(task_lr)):
        adapted_params.append(
            meta_model.trainable_variables[i] - tf.multiply(task_lr[i], grads_1[i]))  # 步骤1

    weights = operation_C   # 载入更新的权重adapted_params
    loss = operation_B  # 在新权重下计算损失

# 对 meta_model.trainable_variables 和 task_lr 计算梯度
# 这次更新不只对trainable_variables，并且对task_lr
# 查看梯度， 其中属于trainable_variables的梯度均正常，但是task_lr的梯度全部为none

grads = tape.gradient(loss, meta_model.trainable_variables + task_lr)
optimizer.apply_gradients(zip(grads, meta_model.trainable_variables + task_lr))

# task_lr 形状与trainable_variables完全一样且类型为变量，并且在上面“步骤1”处也使用了（也仅在步骤1处使用），
# 且上述操作均在 “ with tf.GradientTape() as tape: ” 下进行，为什么求不出task_lr梯度呢？
# 是因为task_lr没有直接参与loss计算么？

梯度图如下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
「已注销」 2021-09-28 13:25
关注
你这个代码写的有问题啊

解决
无用 2
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

tensorflow2.x 深度学习使用相同梯度进行梯度下降的两个相同神经网络，得到的结果却不同 tensorflow 深度学习神经网络
2021-03-12 00:07

回答 2 已采纳在上面给的代码的第164行处插入 optimizer = optimizers.Adam(lr=1e-4) 重新初始化optimizer，这样两个模型训练后的测试结果就一样了，望采纳
tensorflow中的.numpy()函数是啥 python tensorflow 机器学习
2022-09-22 14:57

回答 4 已采纳因为这里的loss是tensor，所以调用loss.numpy()将其转换为numpy数组。这里最主要的原因是loss_all一开始不是tensor类型，如果loss_all是tensor类型，则可以
用tensorflow做梯度下降 python tensorflow 机器学习
2022-09-22 09:25

回答 2 已采纳以使网络模型更快地输出优质的 one-hot 编码 ->这个说的更明显http://t.csdn.cn/DzXTX ，但总的意思就是为加快网络输出结果尽快向 one-hot 编码收敛需要做一个变
TensorFlow 2.x
2022-10-17 21:22

eight_Jessen的博客 TensorFlow2.0基础
用tensorflow做机器翻译时训练代码有问题 python tensorflow 神经网络
2019-05-27 16:45

回答 2 已采纳谢谢大家，已经解决了
用tensorflow写一个简单的神经网络识别mnist出现问题（python） python tensorflow 神经网络
2017-08-25 02:45

回答 1 已采纳 b1 = tf.Variable(tf.zeros([784,100]))改成b1 = tf.Variable(tf.zeros([100,])) 应该可以解决这个报错
Python BP神经网络两分类反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
TensorFlow2.x基础与mnist手写数字识别示例
2024-06-08 16:26

逢生博客的博客 TensorFlow2.x基础与mnist手写数字识别示例
tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？ python tensorflow 图像处理
2022-05-19 17:31

回答 2 已采纳 batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。
python如何实现绘制光流梯度直方图HOF python 深度学习计算机视觉
2022-12-31 21:52

回答 2 已采纳这就是梯度方向直方图 HOG，用 Numpy 可以实现，用 OpenCV 也可以。可以参考：【OpenCV 例程 300篇】248. 特征描述之HOG描述符 (https://blog.csdn.ne
python K210颜色梯度识别 opencv python 计算机视觉
2022-02-24 15:54

回答 1 已采纳原理上是可以的，实际上精度不一定高，原因是实际使用时用于图像获取条件（拍照设备、光源、信号转换）的限制，识别精度不一定高。以灰度图像为例，也就是说，你做的识别模型，以灰度数字图像测试可能很好——其实这
tensorflow1.x代码转换到tensorflow2.x
2020-11-23 21:04

竹叶青lvye的博客 stddev=1, seed=1),name="w2") return tf.matmul(aa, w2) x=tf.placeholder(tf.float32,shape=[None,2],name="x") #y=tf.placeholder(tf.float32,shape=[None,1],name="y") a=f1(x) y=f2(a) init=tf.global_...
深度学习有关梯度的问题 python 机器学习深度学习
2022-08-02 19:28

回答 2 已采纳没啥问题，在你 a 的初值为 a = 0.0827 的情况下，d 最终为可以表达为 d = (2^14) * a = 16384 * a，所以 d 关于 a 的偏导数为 dd/da = 16384，属
Tensorflow 2.x入门教程
2022-03-02 01:13

u012804784的博客 Python微信订餐小程序课程视频 https://edu.csdn.net/course/detail/36074 Python实战量化交易理财系统 https://edu.csdn.net/course/detail/35475 目录前言层次结构概述创建张量计算图自动微分数据输入Numpy构建...
基于Tensorflow2.x低阶API搭建神经网络模型并训练及解决梯度爆炸与消失方法实践
2022-09-27 16:14

肖永威的博客 Python Tensorflow1.x升级到2.x，使用低阶API，以继承tf.module类的方法搭建神经网络模型，并训练，以及解决梯度爆炸与消失方法的实践。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月28日

悬赏问题

¥20 指导如何跑通以下两个Github代码
¥15 大家知道这个后备文件怎么删吗，为啥这些文件我只看到一份，没有后备呀
¥15 C++为什么这个代码没报错运行不出来啊
¥15 一道ban了很多东西的pyjail题
¥15 关于#r语言#的问题：如何将生成的四幅图排在一起，且对变量的赋值进行更改，让组合的图漂亮、美观@（相关搜索：森林图）
¥15 C++识别堆叠物体异常
¥15 微软硬件驱动认证账号申请
¥15 GPT写作提示指令词
¥20 根据动态演化博弈支付矩阵完成复制动态方程求解和演化相图分析等
¥15 华为超融合部署环境下RedHat虚拟机分区扩容问题

tensorflow2.x 更新时梯度为none的问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新