自己写了matlab神经网络，公式正确但训练失败

关键就在偏导数计算这两行，两行合并起来就是完整的误差传导公式，梯度检验也是正确的，但训练正确率一直没有提高，当去掉第二行时，训练就成功了，不过不符合公式，不知道到底哪里出了问题。
delte2=theta2_non'*delte3;%第二层误差,行

delte2=delte2.*a2(2:end,:).*(1-a2(2:end,:));%完全版误差公式
图片说明

 clc;clear;
%============初始化================
x=[ 1, 2,-3,-4,-5,-2, 2,2;...
   -1,-2,-3,-4, 5, 2, 3,4;...
    1,-2, 3,-4, 5,-3,-3,1];
y=[1,1,0,0,0,0,0,0;...
   0,0,0,0,0,0,1,1;...
   0,0,1,1,1,1,0,0];
x_e=[-1.5, 3,2,-5,-1;...
        7,-1,1,-1,2;...
        6, 0,0,-2,1];
x_e_label=[0,1,0,0,0;...
           0,0,1,0,0;...
           1,0,0,1,1];
m=length(y(1,:));
alpha=1;
lamda=0.02;%正则化参数
theta1=(rand(3,3)-0.5)/10;%参数初始化,范围在-0.05~0.05之间,三行三列
theta2=(rand(3,4)-0.5)/10;
a20=1;%偏置不变
%theta1,2为第一二层参数，第三层没有，dtheta1,2为第一二层参数的偏导数容器
%a1为特征，数值偏离1，a2,3都是激活过后的数值，在1附近
%delte2,3为各层误差值
%============初始化================

%============总循环================
for q=1:500
    J=0;
    delte2=zeros(3,1);
    delte3=zeros(3,1);
    dtheta1=zeros(3,3);
    dtheta2=zeros(3,4);%每次更新对偏导数置零
    correct_num=0;
    %========= %计算平均偏导数循环===========
    for i=1:m
        a1=x(:,i);%取每列特征数据
        z1=theta1*a1;%列
        raw_a2=1./(1+exp(-z1));%s激活函数
        a2=[a20;raw_a2];%添加偏置a20，列
        z2=theta2*a2;%1列

        a3=1./(1+exp(-z2));
        %y(:,i)-a3第三层误差，列
        delte3=y(:,i)-a3;
        theta2_non=theta2(:,2:4);

        delte2=theta2_non'*delte3;%第二层误差,行    
        delte2=delte2.*a2(2:end,:).*(1-a2(2:end,:));%完全版误差公式
        dtheta1=dtheta1+delte2*a1';%偏导数计算完成，但尚未进行平均,后面的是矩阵
        dtheta2=dtheta2+delte3*a2';
        J=J+y(:,i)'*log(a3)+(1-y(:,i)')*log(1-a3);%小代价函数
    end
    %========计算平均偏导数循环============

    g_check=gradient_check(theta1,theta2,x,y)%梯度检验
    dtheta1
    dtheta2

    %========代价函数和梯度下降============
    J=-J/m;%+lamda/2/m*(sum(sum(theta1.^2))+sum(sum(theta2_non.^2)));%完整代价函数
    theta1=theta1+alpha*dtheta1/m-lamda/m.*theta1;%加入正则化的梯度下降
    temp_theta2=theta2;
    temp_theta2(:,1)=0;%偏置theta不加入正则化计算，故单独拿出来
    theta2=theta2+alpha*dtheta2/m-lamda/m.*temp_theta2;
    fprintf('循环%d，代价函数为：%0.4f,',q,J)
    %========代价函数和梯度下降============

    %========训练集验证====================
    for i=1:length(y(1,:))
        a1=x(:,i);%取每列特征数据
        z1=theta1*a1;%列
        raw_a2=1./(1+exp(-z1));%s激活函数
        a2=[a20;raw_a2];%添加偏置a20，列
        z2=theta2*a2;%1列
        a3=1./(1+exp(-z2));
        train=[y(:,i),a3];
        [~,i1]=max(y(:,i));
        [~,i2]=max(a3);
        if i1==i2
            correct_num=correct_num+1;
        end
    end
    fprintf('训练集正确率：%0.1f\n',correct_num/length(y(1,:))*100);
    %========训练集验证====================
end    
%============总循环===========================

    %============训练完成后进行测试集验证=======
    correct_num=0;
    for i=1:length(x_e(1,:))%测试集验证
        a1=x_e(:,i);%取每列特征数据
        z1=theta1*a1;%列
        raw_a2=1./(1+exp(-z1));%s激活函数
        a2=[a20;raw_a2];%添加偏置a20，列
        z2=theta2*a2;%1列
        a3=1./(1+exp(-z2));
        test_set=[x_e_label(:,i),a3];
        [~,i1]=max(x_e_label(:,i));
        [~,i2]=max(a3);
        if i1==i2
            correct_num=correct_num+1;
        end
    end
    fprintf('测试集正确率：%0.1f\n',correct_num/length(x_e(1,:))*100);
    %============训练完成后进行测试集验证=======

以下是梯度检验

 function    gradient_check=gradient_check(theta1,theta2,x,y)

eps=0.001;
a20=1;
temp_gradient_check=zeros(1,21);

for temp_i=1:21
    temp_theta1=theta1';%先转置，再展开，对单个参数处理，塑形，再转置
    temp_theta2=theta2';
    unrolled_parameter=[temp_theta1(:);temp_theta2(:)]';%参数展开

    unrolled_parameter(temp_i)=unrolled_parameter(temp_i)+eps;%加一点参数
    temp_theta1=reshape(unrolled_parameter(1:9),3,3);
    temp_p_theta1=temp_theta1';
    temp_p_theta2=reshape(unrolled_parameter(10:21),4,3);
    temp_p_theta2=temp_p_theta2';

    unrolled_parameter(temp_i)=unrolled_parameter(temp_i)-2*eps;%减一点参数
    temp_theta1=reshape(unrolled_parameter(1:9),3,3);
    temp_n_theta1=temp_theta1';
    temp_n_theta2=reshape(unrolled_parameter(10:21),4,3);
    temp_n_theta2=temp_n_theta2';

    J=0;
    for i=1:length(y(1,:))
        a1=x(:,i);%取每列特征数据
        z1=temp_p_theta1*a1;%列
        raw_a2=1./(1+exp(-z1));%s激活函数
        a2=[a20;raw_a2];%添加偏置a20，列
        z2=temp_p_theta2*a2;%1列
        a3=1./(1+exp(-z2));
        J=J+y(:,i)'*log(a3)+(1-y(:,i)')*log(1-a3);%小代价函数
    end
    J_p=J;
    J=0;
    for i=1:length(y(1,:))
        a1=x(:,i);%取每列特征数据
        z1=temp_n_theta1*a1;%列
        raw_a2=1./(1+exp(-z1));%s激活函数
        a2=[a20;raw_a2];%添加偏置a20，列
        z2=temp_n_theta2*a2;%1列
        a3=1./(1+exp(-z2));
        J=J+y(:,i)'*log(a3)+(1-y(:,i)')*log(1-a3);%小代价函数
    end
    J_n=J;
    temp_gradient_check(temp_i)=(J_p-J_n)/2/eps;
end
    temp_check=reshape(temp_gradient_check(1:9),3,3);
    gradient_check=[temp_check',reshape(temp_gradient_check(10:21),4,3)'];

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

Multisim仿真数据导入Matlab训练神经网络 matlab 有问必答神经网络
2021-11-12 19:53

回答 1 已采纳看题主的意思是应该会multisim了，然后不断操作multisim工况批量获得了不通故障的数据，然后要根据这些数据预测故障吧？也就是故障分类了建议把数据整理成表格形式比如 Data1 Data2
matlab神经网络中的权重的意义 matlab 有问必答神经网络
2022-02-23 09:46

回答 2 已采纳不同参量对结果的影响程度，是依赖于整个神经网络的，包括权值和激活函数。最有效的办法就是归一化之后进行敏度分析
基于BP神经网络使用matlab进行预测 matlab 神经网络
2022-04-21 21:24

回答 1 已采纳就算不用到newff工具，至少也需要用到一种框架，否则利用最简单的优化方式光求导就会把人逼疯，这里我有一篇文章是关于BP神经网络的https://blog.csdn.net/qq_18560985/a
BP神经网络预测实例（matlab代码，神经网络工具箱）
2022-02-16 14:57

陌上花开 ~的博客 bp神经网络预测matlab代码实现过程辛烷值的预测【改编】辛烷值是汽油最重要的品质指标，传统的实验室检测方法存在样品用量大，测试周期长和费用高等问题，不适用于生产控制，特别是在线测试。近年发展起来的近红外...
matlab bp神经网络预测代码在2022b报错 matlab 神经网络
2023-02-16 00:19

回答 2 已采纳以下答案引用自GPT-3大模型,请合理使用：修改意见！答：报错的意思是matlab从2016a版本到2022b版本的变化，使得训练参数和输入输出格式存在差异。这里的问题是需要将训练参数进行修改，
MATLAB中BP神经网络训练 matlab
2023-02-28 00:49

回答 2 已采纳可以将输入为复数序列的神经网络转换为接受实数特征的神经网络，将复数序列的实部和虚部分别拆分为两个实数特征输入神经网络。在训练期间，网络会学习到如何将这两个实数特征组合成复数，从而可以得到复数序列的输出
MATLAB神经网络 神经网络
2021-08-06 10:54

回答 1 已采纳超参数的影响几乎相对独立，learning rate对实验结果影响最大； LSTM: A Search Space Odyssey https://ieee
神经网络学习笔记1——BP神经网络原理到编程实现（matlab，python）
2022-01-13 23:46

奥利奥好吃呀的博客 神经网络学习笔记1——BP神经网络原理到编程实现（matlab，python）
用matlab写神经网络预测东西 matlab
2022-05-15 17:48

回答 1 已采纳多出来的不就是结果嘛，能用就行呗，没影响
请问一下学习BP神经网络前是不是要先学Matlab? matlab 神经网络
2022-03-22 17:13

回答 3 已采纳不一定。BP神经网络是算法，是一系列数学公式的集合；而Matlab是集成开发环境和语言，是用来编程实现算法的。一个是理论，一个是编程工具。如果你学完理论之后想编程实现，可以考虑Matlab或者pyth
MATLAB的一个神经网络已经做好，想用C#写界面，如何才能调用？ matlab 神经网络
2016-04-01 04:52

回答 2 已采纳能做，Matlab提供了接口的，但是不是那么容易的，会有人品因素的。
神经网络模型matlab例子,神经网络及其matlab实现
2022-08-21 11:20

ai智能网络的博客 1）正向传播：输入样本－>输入层－>各隐层...因为matlab工具箱为了在寻解不同阶段更智能的选择合适的步长，使用的是可变学习率，它会根据上一次解的调整对目标函数带来的效果来对学习率作调整，再根据学习率决定步长。
BP神经网络Matlab实现（工具箱实现、自主编程实现）
2020-02-19 11:54

大强强小强强的博客本文打算由浅入深，先使用神经网络工具箱快速实现，然后再自己编写代码加深理解。本文使用 MATLAB 2018B。一、快速实现 1.1 背景介绍我们将拟合一个非线性的函数，为简单起见而不失一般性，这个函数有两个自变量...
MATLAB神经网络编程（六）——BP神经网络的训练函数
2022-04-20 14:23

m0_54850825的博客本文是《MATLAB神经网络编程》书籍的阅读笔记，其中涉及的源码、公式、原理都来自此书，若有不理解之处请参阅原书 1，BP网络的创建函数。（1）newcf 函数功能：用来创建级联前向BP网络，调用格式： net=newcf(P...
BP神经网络预测回归MATLAB代码（代码完整可直接用，注释详细，可供学习）
2022-11-27 18:00

Matlab神经网络深度学习的博客 BP神经网络预测回归MATLAB代码（代码完整可用，复制后即可运行使用，不懂也可直接使用，操作简单）
没有解决我的问题, 去提问

悬赏问题

¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？
¥15 乘性高斯噪声在深度学习网络中的应用
¥15 运筹学排序问题中的在线排序
¥15 关于docker部署flink集成hadoop的yarn，请教个问题 flink启动yarn-session.sh连不上hadoop，这个整了好几天一直不行，求帮忙看一下怎么解决
¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛

码龄粉丝数原力等级 --

自己写了matlab神经网络，公式正确但训练失败

0条回答

悬赏问题