深度神经网络训练过程中，损失函数的值没有变化

我做了一个很简单的全连接神经网络，一个输入层：输入一个三维的参数，3个隐藏层，一个输出层：输出一个5位分类结果（一个one-hot数据，类似[1,0,0,0,0]属于第一类）。
使用的损失函数的交叉熵函数，使用梯度下降法。但是当我输出loss函数的值的时候，发现训练过程中，loss的值一直没有变化。我无论如何调整隐藏层神经元个数，都没有用。
请问出现问题的原因有哪些呢？

我把代码贴出来，大家看看呢，代码中我试验过很多包括隐藏层数目，这里的是5层，1,2,3,4,5,层都试过，都不对：

 # -*- coding: utf-8 -*-
"""
Created on Mon Jul  3 23:03:28 2017

@author: sony
"""

# -*- coding: utf-8 -*-
"""
Created on Mon Jul  3 22:39:30 2017

@author: sony
"""

# -*- coding: utf-8 -*-
"""
Created on Mon Jul  3 22:03:49 2017

@author: sony
"""

import tensorflow as tf
from numpy.random import RandomState

batch_size = 8
w1 = tf.Variable(tf.random_normal([3,300],stddev = 1,seed = 1))
w2 = tf.Variable(tf.random_normal([300,300],stddev = 1,seed = 1))
w3 = tf.Variable(tf.random_normal([300,300],stddev = 1,seed = 1))
w4 = tf.Variable(tf.random_normal([300,300],stddev = 1,seed = 1))
w5 = tf.Variable(tf.random_normal([300,300],stddev = 1,seed = 1))
w6 = tf.Variable(tf.random_normal([300,5],stddev = 1,seed = 1))
basis1 = tf.Variable(tf.zeros([1, 300]) + 0.1)
basis2 = tf.Variable(tf.zeros([1, 300]) + 0.1)
basis3 = tf.Variable(tf.zeros([1, 300]) + 0.1)
basis4 = tf.Variable(tf.zeros([1, 300]) + 0.1)
basis5 = tf.Variable(tf.zeros([1, 300]) + 0.1)
basis6 = tf.Variable(tf.zeros([1, 5]) + 0.1)
x = tf.placeholder(tf.float32,shape=(None,3))
y_= tf.placeholder(tf.float32,shape=(None,5))

a = tf.matmul(x,w1)+basis1
a = tf.nn.relu(a)
b = tf.matmul(a,w2)+basis2
b = tf.nn.relu(b)
c = tf.matmul(b,w3)+basis3
c = tf.nn.relu(c)
d = tf.matmul(c,w4)+basis4
d = tf.nn.relu(d)
e = tf.matmul(d,w5)+basis5
e = tf.nn.relu(e)
y = tf.matmul(e,w6)+basis6
y = tf.nn.softmax(y)

cross_entropy = -tf.reduce_mean(y_*tf.log(tf.clip_by_value(y,1e-10,1.0)))

train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

#rdm = RandomState(1)
#dataset_size = 128
#X = rdm.rand(dataset_size,2)
#Y = [ [int(x1+x2<1)] for (x1,x2) in X]

f2 = open("C:/Users/sony/Desktop/points(7).txt")
X = []
Y = []
D = f2.read();
rows2 = D.split('\n')
for row2 in range(len(rows2)):
    split_row2 = rows2[row2].split()
    if split_row2:
        temp = []
        templabel = []
        i_label = int(split_row2[0])
        for k in range(5):#每一行数据分拆
            if k == i_label:#输入标签数据，这里的是表示one hot数据
                templabel.append(1)
            else:
                templabel.append(0)
        Y.append(templabel)
        for i in range(3,6):
            #if(int(split_row2[i]) - 0 < 1e-3):
             #   split_row2[i] = 1           
            temp.append(float(split_row2[i]))
        X.append(temp)

with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    #print(w1)
    #print(w2)    
    dataset_size = len(X)
    STEPS = 500000
    for i in range(STEPS):
        start = (i*batch_size)%dataset_size
        end = min(start+batch_size,dataset_size)
        sess.run(train_step,feed_dict={x:X[start:end],y_:Y[start:end]})

        if i %100 == 0:
            total_cross = sess.run(cross_entropy,feed_dict={x:X,y_:Y})    
            print("After %d training ,loss is %g"%(i,total_cross))    
       #print(w1)
        #print(w2)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Fukui_YB_yb 2017-07-06 12:45
关注
问题解决了，是激活函数的问题，relu激活函数的激活率太低，很多神经元死掉了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 5
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

深度学习中神经网络多分类问题中，损失函数的计算 pytorch 有问必答深度学习计算机视觉
2022-03-10 22:39

回答 2 已采纳首先建议你取了解一下交叉熵是什么，为什么要用交叉熵就可以回答第一个问题（batch size可以先改成1比较好理解）第二个问题就是函数的接口问题了，你这个函数应该是定义的就是y_pre要在前面的，你反
网络训练损失函数一直震荡该怎么办？ matlab 深度学习计算机视觉
2022-05-12 16:03

回答 1 已采纳减小学习率和BatchSize
看损失函数的收敛过程可以评价网络的优劣吗？分类深度学习神经网络
2021-07-29 18:06

回答 1 已采纳收敛快慢只能说你的训练速度加快，但是网络的优劣一般不看你的网络收敛速度，收敛速度加快只能说训练时间短了一些，一般来说准确率更为看重一点，在保证准确率的前提下尽可能的精简网络结构，加快收敛，但是你这个准
PyTorch深度学习实战（1）——神经网络与模型训练过程详解
2023-05-28 08:06

盼小辉丶的博客在本节中，我们将了解传统机器学习与人工神经网络间的差异，并了解如何在实现前向传播之前连接网络的各个层，以计算与网络当前权重对应的损失值；实现反向传播以优化权重达到最小化损失值的目标。并将实现网络的所有...
tensorflow自定义的损失函数 focal_loss出现inf，在训练过程中出现inf tensorflow 深度学习神经网络
2019-05-05 14:51

回答 1 已采纳解决方法 ``` def focal_loss_calc(alpha=0.25, gamma=2., epsilon=1e-6): """ focal loss used for tra
BP神经网络的训练函数和学习函数，还有性能函数分别代表什么神经网络网络
2018-11-01 03:56

回答 3 已采纳 “激励函数”，其实不是“激励函数”，而是激活函数。用来增加一个非线性因素。和“激励”没有关系。 mse（mean square error）是平均均方误差。公式就是所有的预测值和真实值的差的平方的平
tensorflow可以在自定义损失函数中使用内置损失函数吗 tensorflow 人工智能机器学习深度学习神经网络
2020-08-01 19:01

回答 1 已采纳完全可以，只要你的损失函数是tensor定义的。
自定义神经网络三之梯度和损失函数激活函数
2024-02-25 18:11

铁柱同学的博客本篇博客分别解释了梯度，损失函数，激活函数等相关概念。前期概念准备部分基本结束，接下来我们就尝试自定义一个神经网络，实现训练，推理和生成模型等，也算是对基础概念部分的一个实践。
模型的损失函数随着Epoch增加而上升了人工智能深度学习神经网络
2020-04-22 11:00

回答 2 已采纳您好，这个问题是什么原因呢？我也遇到了同样的问题
BP神经网络的训练集和测试集可以相同吗？如图中，floor函数为什么要乘以0.8呢？人工智能数据挖掘机器学习神经网络
2020-03-10 11:08

回答 2 已采纳训练集和测试集可以相同这个问题就好比如果你是一个老师，你出考卷的时候，可以和你上课讲的题目一样么。乘以0.8就是80%训练20%测试
bp神经网络各层激活函数的选择 matlab 有问必答神经网络问答团队
2021-05-25 18:45

回答 2 已采纳以下是我想出来的几个思路用于重新考虑你自己的神经网络。 1. 你用了几层神经网络？一层神经网络很可能无法解决异或等线性不可分问题，多层神经网络加上非线性激活函数可以解决这一问题。 2. 你是自己手
神经网络训练过程的可视化loss、acc曲线
2024-04-02 13:48

在神经网络训练中，损失函数用来衡量模型预测值与实际值之间的差异，而准确率则是模型在分类任务中预测正确的比例。通过可视化这两个指标的变化趋势，可以直观地观察到模型训练的效果和状态，对于调参和诊断模型性能...
梯度下降、损失函数、神经网络的训练过程
2022-09-13 18:35

小飞猪Jay的博客梯度下降是什么？损失函数是什么？
损失函数的深度学习: 神经网络中的应用
2023-12-27 18:06

AI天才研究院的博客深度学习是一种人工智能技术，它主要通过神经网络来学习和模拟人类大脑的思维过程。损失函数是深度学习中的一个核心概念，它用于衡量模型预测值与真实值之间的差距，从而优化模型参数。在本文中，我们将详细介绍损失...
在神经网络中，如何选择合适的损失函数和优化器？
2024-04-28 19:22

_Johngo学长的博客在神经网络中，选择合适的损失函数和优化器是非常重要的，因为它们直接影响着机器学习算法的性能和效果。损失函数用于衡量模型预测结果与实际值之间的差异，而优化器则用于调整模型的参数，使得损失函数的值最小化。
没有解决我的问题, 去提问

悬赏问题

¥15 ansys fluent计算闪退
¥15 有关wireshark抓包的问题
¥15 需要写计算过程，不要写代码，求解答，数据都在图上
¥15 向数据表用newid方式插入GUID问题
¥15 multisim电路设计
¥20 用keil，写代码解决两个问题，用库函数
¥50 ID中开关量采样信号通道、以及程序流程的设计
¥15 U-Mamba/nnunetv2固定随机数种子
¥15 vba使用jmail发送邮件正文里面怎么加图片
¥15 vb6.0如何向数据库中添加自动生成的字段数据。

深度神经网络训练过程中，损失函数的值没有变化

1条回答 默认 最新

悬赏问题

1条回答默认最新