针对神经网络模型，二阶偏导始终为0

因为课题需求，需要求神经网络的二阶偏导，但是经过数次尝试，发现无论怎么实现，神经网络的二阶偏导结果都为0，以为对神经网络的理论知识掌握不是特别扎实，所以无法确定原因，但是猜想是不是神经网络较难拟合高次幂函数呢。

实现的目的如下:
f(x,y)=x²+y
用神经网络拟合f(x,y)，即model(x,y)=f(x,y)
求model"xx，即∂²model/∂x²

使用的模型如下

model = keras.Sequential([
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(1),
])

模型已完成学习，随后用自动求导求偏分

with tf.GradientTape(persistent=True) as tape3:
    tape3.watch(X)
    tape3.watch(Y)
    with tf.GradientTape(persistent=True) as tape4:
        tape4.watch(X)
        tape4.watch(Y)
        Z = tf.concat([X, Y], 1)
        ff = model(Z)
        dy = tape4.gradient(ff, Y)
        dx = tape4.gradient(ff, X)
        print(tf.concat([dx, dy], 1))
    dxdx = tape3.gradient(dx, X)
    print(dxdx)

dx和dy都基本正确，但dxdx全部为0，按理说dxdx应该为2左右。找不到问题的原因，是我哪里写的不对吗，还是说，神经网络的拟合，是只针对x和y进行一次线性拟合，所以二阶导均为0...应该不是吧……

import tensorflow as tf
import numpy as np
from tensorflow import keras
import sys
import random

np.set_printoptions(threshold=np.inf)
np.set_printoptions(suppress=True)

x = np.arange(0, 101, dtype=float)
y = np.arange(0, 101, dtype=float)
for i in range(101):
    x[i]=np.round(random.random()*10,2)
    y[i]=np.round(random.random()*10,2)
x=x.reshape(101,1)
y=y.reshape(101,1)

z = np.arange(1, 203, dtype=float).reshape(101, 2)
lis = np.arange(2, dtype=float)
for i in range(101):
    lis[0]=float(x[i])
    lis[1]=float(y[i])
    z[i] = lis

ans=(x*x+y).reshape(101,1)

X=tf.convert_to_tensor(x, dtype=float)
Y=tf.convert_to_tensor(y, dtype=float)


model = keras.Sequential([
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(100, activation='relu'),
    keras.layers.Dense(1),
])

optimizer = tf.keras.optimizers.Adam(learning_rate=0.001, epsilon=1e-07)


for i in range(2000):
    with tf.GradientTape(persistent=True) as tape:
        tape.watch(X)
        tape.watch(Y)
        with tf.GradientTape(persistent=True) as tape2:
            tape2.watch(X)
            tape2.watch(Y)
            Z = tf.concat([X, Y], 1)
            f=model(Z)
            loss = tf.reduce_mean(tf.square(ans - f))
            grads = tape2.gradient(loss, model.variables)
            dx = tape2.gradient(f, X)
            dy = tape2.gradient(f, Y)
        dxdx=tape.gradient(dx, X)
        #print(dxdx)
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))

    if i%10==0:
        print(i, loss)


with tf.GradientTape(persistent=True) as tape3:
    tape3.watch(X)
    tape3.watch(Y)
    with tf.GradientTape(persistent=True) as tape4:
        tape4.watch(X)
        tape4.watch(Y)
        Z = tf.concat([X, Y], 1)
        ff = model(Z)
        dy = tape4.gradient(ff, Y)
        dx = tape4.gradient(ff, X)
        print(tf.concat([dx, dy], 1))
    dxdx = tape3.gradient(dx, X)
    print(dxdx)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2021-07-28 09:24
关注
你模型的输入输出呢？输入是什么，输出又是什么？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

神经网络训练集损失值降为0而且一直保持 python 深度学习神经网络
2022-02-25 12:13

回答 1 已采纳（1）你没有给出模型，数据情况，谁也分析不了（2）训练误差小，测试误差大，这是典型的过拟合（3）损失值降为 0，还是下降很快，接近于 0，这是完全不同的，从问题描述和图中看不出来
一道人工智能神经网络的题人工智能深度学习神经网络
2022-06-09 23:27

回答 5 已采纳输出层线性激活函数的话，预测结果为[1,0]
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
人脸识别神经网络是什么,人脸识别神经网络模型
2022-09-02 10:37

「已注销」的博客也不需要人工的对人脸特征进行分析或是抽取模板，而是通过使用特定的方法(如主成分分析方法(PCA)、支持向量机(SVM)、神经网络方法(ANN)等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度，...
神经网络中的模型和算法有什么区别？深度学习神经网络
2022-04-06 10:05

回答 2 已采纳模型就是一堆参数，可以理解为算法中的变量；算法是一堆数学公式，这些公式使用模型中的参数作为变量值来进行计算，以达到预测或分类功能。算法分为训练和预测两个部分，训练算法用训练数据来构建模型，预测算法用模
请大家帮我看看神经网络算法误差函数求出偏导数为什么会有一个负号神经网络算法
2017-05-08 12:31

回答 1 已采纳负号是y前面的负号。到2与1/2消掉的部分都是对(t-y)求导，而最后要对y求导，所以还需要加个负号。
人工智能神经网络反向传播问题深度学习神经网络
2023-02-14 14:10

回答 4 已采纳 W1：一个横向矩阵b1：一个列向量W2：一个横向矩阵b2：一个列向量以上回答来自ChatGPT
用Python实现神经网络（附完整代码）！
2020-12-01 19:59

Datawhale的博客 ↑↑↑关注后"星标"Datawhale每日干货&每月组队学习，不错过Datawhale干货作者：[美]霍布森·莱恩，科尔·霍华德在学习神经网络之前，我们需...
python构建神经网络训练模型的问题？ python 有问必答深度学习神经网络
2021-04-11 17:39

回答 3 已采纳 input_shape=(7787,)这里是不是少了一个参数
为什么我改变图像通道会导致神经网络分类准确率下降？人工智能深度学习神经网络
2021-02-25 16:07

回答 2 已采纳这证明经过dct变换、局部二值模式处理后，损失了部分有效图像特征；或者灰度图、二值处理图、dct图在三个通道对应分量上的特征无法组合成更优图像特征。这在神经网络调参过程中是很常见的，明明觉得处理一下分
神经网络模型的压缩和加速都有哪些方法？人工智能
2021-03-25 11:32

回答 2 已采纳 神经网络模型的压缩与加速方法,从大的方面来讲一共有七类，分别是：参数剪枝、参数量化、紧凑网络、知识蒸馏、低秩分解、参数共享和混合方式。下面分别简单阐述一下： (1) 参数剪枝是指在预训练好的大型模型
神经网络求解优化问题,人工神经网络优化算法
2022-08-15 21:41

「已注销」的博客 神经网络就像多项式或者线性模型一样，是个看不见表达式的模型，它的表达式就是网络，它比一般模型具有更高的自由度和弹性；同时它是一个典型的黑箱模型方法；比多项式等模型还黑。优化算法，就是寻优的算法，所谓寻...
神经网络的输出为啥不变呀？(语言-python) python 机器学习神经网络
2023-02-18 23:26

回答 5 已采纳你模型的训练代码呢？你不会每次训练之后没有反向传播更新下权重和梯度信息吧。看你打印的输出，基本上都是初始化之后的权重，不然按照你100个epoch存一下模型来看，不可能都是一样的权重
神经网络教材推荐,神经网络经典书籍
2022-08-26 17:10

快乐的小荣荣的博客 1．神经网络领域的成就提出了样条权函数神经网络算法与代数算法，形成了独立的学派和理论体系。提出的这些理论与方法彻底克服了困扰学术界多年的传统方法的局部极小、收敛速度慢、难以求得全局最优点等困难。特别是...
神经网络方法研究及应用,基于神经网络的控制
2022-09-09 16:16

快乐的小荣荣的博客谷歌人工智能写作项目：神经网络伪原创神经网络控制技术是一项复杂的系统控制技术，一般应用在变频器的控制中，它是通过对系统的辨识、运算后对变频器进行控制的一种新技术文案狗。而且神经网络控制可以同时控制多个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 7月27日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月27日

悬赏问题

¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler

针对神经网络模型，二阶偏导始终为0

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新