tensorflow训练过程权重不更新，loss不下降，输出保持不变，只有bias在非常缓慢地变化？

模型里没有参数被初始化为0 ，学习率从10的-5次方试到了0.1，输入数据都已经被归一化为了0-1之间，模型是改过的vgg16，有四个输出，使用了vgg16的预训练模型来初始化参数，输出中间结果也没有nan或者inf值。是不是不能自定义损失函数呢？但输出中间梯度发现并不是0，非常奇怪。

train.py的部分代码

def train():
    x = tf.placeholder(tf.float32, [None, 182, 182, 2], name = 'image_input')
    y_ = tf.placeholder(tf.float32, [None, 8], name='label_input')  
    global_step = tf.Variable(0, trainable=False)  
    learning_rate = tf.train.exponential_decay(learning_rate=0.0001,decay_rate=0.9, global_step=TRAINING_STEPS, decay_steps=50,staircase=True)

    # 读取图片数据，pos是标签为1的图，neg是标签为0的图
    pos, neg = get_data.get_image(img_path)
    #输入标签固定，输入数据每个batch前4张放pos，后4张放neg
    label_batch = np.reshape(np.array([1.0, 1.0, 1.0, 1.0,  0.0, 0.0, 0.0, 0.0]),[1, 8])

    vgg = vgg16.Vgg16()
    vgg.build(x)

    #loss函数的定义在后面
    loss = vgg.side_loss( y_,vgg.output1, vgg.output2, vgg.output3, vgg.output4)

    train_step = tf.train.AdamOptimizer(learning_rate).minimize(loss, global_step=global_step)
    init_op = tf.global_variables_initializer()

    saver = tf.train.Saver()

    with tf.device('/gpu:0'):
        with tf.Session() as sess:
            sess.run(init_op)

            for i in range(TRAINING_STEPS):

                                #在train.py的其他部分定义了batch_size= 4
                start = i * batch_size
                end = start + batch_size 

                #制作输入数据，前4个是标签为1的图，后4个是标签为0的图
                image_list = []
                image_list.append(pos[start:end])
                image_list.append(neg[start:end])
                image_batch = np.reshape(np.array(image_list),[-1,182,182,2])

                _,loss_val,step = sess.run([train_step,loss,global_step], feed_dict={x: image_batch,y_:label_batch})

                if i % 50 == 0:
                    print("the step is %d,loss is %f" % (step, loss_val))
                    if loss_val < min_loss:
                        min_loss = loss_val
                        saver.save(sess, 'ckpt/vgg.ckpt', global_step=2000)

Loss 函数的定义

**loss函数的定义（写在了Vgg16类里）**

class Vgg16:

#a,b,c,d都是vgg模型里的输出，是多输出模型
def side_loss(self,yi,a,b,c,d):
    self.loss1 = self.f_indicator(yi, a)
    self.loss2 = self.f_indicator(yi, b)
    self.loss3 = self.f_indicator(yi, c)
    self.loss_fuse = self.f_indicator(yi, d)
    self.loss_side = self.loss1 + self.loss2 + self.loss3 + self.loss_fuse
    res_loss = tf.reduce_sum(self.loss_side)

    return res_loss

#损失函数的定义，标签为0时为log(1-yj)，标签为1时为log(yj)
def f_indicator(self,yi,yj):
    b = tf.where(yj>=1,yj*50,tf.abs(tf.log(tf.abs(1 - yj))))
    res=tf.where(tf.equal(yi , 0.0), b,tf.abs(tf.log(tf.clip_by_value(yj, 1e-8, float("inf")))))

    return res

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
方舟后裔 2019-10-25 11:32
关注
请问怎么检查：输出中间结果有没有nan或者inf值，小白一个，我的是两分类问题，损失一直在ln(2)=0.6931472处徘徊，有时候直接等于ln(2)跳不出来

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

yolo训练时能不能使用之前训练出来的权重文件继续在新的数据集上训练？可以提高准确率吗 tensorflow 机器学习目标检测
2022-04-21 22:20

回答 2 已采纳一般来说用之前的权重文件当作预训练模型是有助于提高一些准确率的，前提条件是你的新数据对于旧数据集来说是新的数据分布（除非新数据和旧数据差不多，不然增加数据量可以增大数据分布区间的）
如何让卷积神经网络中间的某几层参数固定，还不影响正常的训练过程? cnn 人工智能深度学习
2022-01-13 15:01

回答 1 已采纳可以啊，冻结之后只是不更新参数和计算梯度，优化器在step的时候遇到不计算梯度的话自动就不更新参数了，但是反向传播还是正常进行的。
tensorflow如何在训练一定迭代次数后停止对某个参数的训练，而继续对其他参数进行训练？ tensorflow
2019-03-22 16:55

回答 1 已采纳 https://stackoverflow.com/questions/35298326/freeze-some-variables-scopes-in-tensorflow-stop-gradien
机器学习6：使用 TensorFlow 的训练线性回归模型
2023-06-27 16:30

Jin_Kwok的博客纸上得来终觉浅，绝知此事要躬行。前面 5 篇文章介绍了机器学习相关的部分基础知识，在本章，笔者将讲解基于 TensorFlow 实现一个简单的线性回归模型，以便增强读者对机器学习的体感。
tensorflow手写识别，在进行测试时，循环最后一次batch数发生变化导致报错，如何解决？ python tensorflow 图像处理
2022-05-19 17:31

回答 2 已采纳 batch代表的是每次从训练集取的样本数，你的训练集样本应该最后一次只剩下16个了。
tensorflow 中怎么查看训练好的模型的参数呢？ tensorflow 神经网络
2018-09-18 03:37

回答 2 已采纳 https://blog.csdn.net/zwwhsxq/article/details/80525016 https://blog.csdn.net/AManFromEarth/article/
#在VS code 中导入学习后的权重出错，提示找不到权重文件， python 有问必答深度学习
2022-03-30 20:01

回答 2 已采纳你是用vscode打开了项目目录，相对路径需要相对这个项目目录，不能相对当前py文件你要相对py文件的路径，用vscode打开单独的py文件就行了或者参考在vscod
Tensorflow.js 入门学习指南
2023-12-06 21:02

red润的博客不是专业人士，学不明白这一章，但是不影响后续学习调用模型中所有层的名称和类型每个层的输出形状每个层的权重参数数量每个层接收的输入（如果模型具有一般拓扑，下文将讨论）模型的可训练和不可训练参数总数层...
卷积核更新权重是同时加/减算出来的更新值么？ python 人工智能机器学习
2022-12-08 11:48

回答 1 已采纳望采纳是的，在卷积神经网络中，每一个卷积核都会有一个对应的权重矩阵，当网络进行反向传播时，每一个权重矩阵都会计算出一个梯度值，然后乘上学习率之后，再将结果与原来的权重矩阵进行加减运算，得到新的权重矩阵
mask rcnn更换特征提取网络后还能用之前的模型继续训练么？ python tensorflow 人工智能深度学习神经网络
2020-04-23 14:40

回答 2 已采纳不能用了，权重和网络结构是一一对应的，也就是你定义网络各层的参数，如果网络结构变了，参数就不能用了。 esnet和densenet的网络结构差别很大，你以前的参数肯定是用不了了。你可以去官网
运行FairMOT demo的时候出现预训练网络权重问题，请问具体该如何调整？ python
2020-09-15 21:20

回答 3 已采纳在models下面有一些pth文件就是权重，但是一般来说不直接修改权重而是让它训练权重有一个cfg目录下，有json，这些是超参数，可以修改的
Introduction to TensorFlow 2.0 and Keras
2023-08-07 00:35

禅与计算机程序设计艺术的博客 2019年是深度学习爆炸年，深度学习（deep learning）技术通过训练神经网络模型对数据进行学习，在图像识别、自然语言处理等领域都取得了重大突破。近几年来，基于TensorFlow和Keras的开源深度学习框架逐渐流行起来。...
yolo训练完在别的机器上运行时也需要一整套环境吗人工智能深度学习目标检测
2022-04-18 21:19

回答 1 已采纳有了模型可以移植，但是也要保证能加载成功这个模型，也就是还是需要一定的环境，不必要和训练时的环境一模一样望采纳
【手把手TensorFlow】二、神经网络优化
2019-01-08 21:22

土豆洋芋山药蛋的博客【手把手TensorFlow】一、从开始使用TensorFlow到弄清楚“搭建神经网络套路” Q1：有多少参数需要优化？在该神经网络中，包含 1 个输入层、 1 个隐藏层和 1 个输出层，该神经网络的层数为 2 层。在该神经网络中...
TensorFlow学习笔记（二）
2021-07-31 18:42

钟良堂的博客 ① 激活函数relu: 在Tensorflow中，用tf.nn.relu()表示 ② 激活函数sigmoid：在Tensorflow中，用tf.nn.sigmoid()表示 ③ 激活函数tanh：在Tensorflow中，用tf.nn.tanh()表示神经网络的复杂度：可用神经网络的...
没有解决我的问题, 去提问

悬赏问题

¥20 删除和修改功能无法调用
¥15 kafka topic 所有分副本数修改
¥15 小程序中fit格式等运动数据文件怎样实现可视化？（包含心率信息））
¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops？
¥40 串口调试助手打开串口后,keil5的代码就停止了
¥15 电脑最近经常蓝屏，求大家看看哪的问题
¥60 高价有偿求java辅导。工程量较大，价格你定，联系确定辅导后将采纳你的答案。希望能给出完整详细代码，并能解释回答我关于代码的疑问疑问，代码要求如下，联系我会发文档
¥50 C++五子棋AI程序编写
¥30 求安卓设备利用一个typeC接口，同时实现向pc一边投屏一边上传数据的解决方案。
¥15 SQL Server analysis services 服务安装失败