PB神经网络损失函数问题

我在编写一个PB神经网络，在反向传播时出现了问题，我的损失函数是daf(x)*(T-O)其中daf(x)为激活函数在此点的导数，
T为正确结果，O是实际结果，我的激活函数是tanh，但神经网络好像误解了我的意思，他试图使输出逼近一，此点导数为零
所以损失函数为零。

我想知道是不是我的损失函数出错了，正确的损失函数是什么，还是我的代码出了问题？
我的代码如下

import numpy as np


def tanh(x: np.ndarray) -> float:
    return np.tanh(x)


def derived_tanh(x: np.ndarray) -> float:
    return 1 - (x**2)


def ReLU(x: np.ndarray) -> float:
    return (np.abs(x) + x) / 2


def derived_ReLU(x: np.ndarray) -> float:
    return (x > 0) * 1


class BPNN:

    def __init__(self, input_num: int, output_num: int, storey: int, num: int, activation_function, derived_Activation_Function) -> None:
        self.input_num = input_num
        self.output_num = output_num
        self.storey = storey
        self.num = num
        self.weight_in = np.random.randn(self.num, self.input_num)
        self.weight_mi = np.random.randn(self.storey - 1, self.num, self.num)
        self.weight_ou = np.random.randn(self.output_num, self.num)
        self.bias = np.random.randn(self.storey, self.num)
        self.activation_function = activation_function
        self.derived_Activation_Function = derived_Activation_Function

    def out(self, inputs: np.ndarray, right_output: np.ndarray = None, learnning_rate: float = None) -> np.ndarray:
        out = np.array(self.bias)
        out[0] = self.activation_function(np.sum(self.weight_in * inputs, axis=1))
        for i in range(1, self.storey - 1):
            out[i] = self.activation_function(np.sum(self.weight_mi[i - 1] * out[i - 1], axis=1))
        output = self.activation_function(np.sum(self.weight_ou * out[self.storey - 1], axis=1))
        if right_output is None:
            return output
        else:
            e_ou = (right_output - output) * self.derived_Activation_Function(output)
            e_mi = np.zeros([self.storey, self.num])
            e_mi[self.storey - 1] = np.sum(e_ou * self.weight_ou, axis=0) * self.derived_Activation_Function(out[self.storey - 1])
            for i in range(self.storey - 2, -1, -1):
                e_mi[i] = np.sum(e_mi[i + 1] * self.weight_mi[i], axis=0) * self.derived_Activation_Function(out[i])

            self.weight_ou += (learnning_rate * e_ou).reshape([-1, 1]) * out[self.storey - 1]
            for i in range(self.storey - 2, -1, -1):
                self.weight_mi[i] += (learnning_rate * e_mi[i + 1]).reshape([-1, 1]) * out[i]
                self.bias[i + 1] += learnning_rate * e_mi[i + 1]
            self.bias[0] += learnning_rate * e_mi[0]
            self.weight_in += (learnning_rate * e_mi[0]).reshape([-1, 1]) * inputs
            return output

    def train(self, inputs: np.ndarray, right_output: np.ndarray, learning_rate: float, garter: float) -> None:
        data = np.random.shuffle(np.arange(0, inputs.shape[0]))
        train_in = inputs[data[np.arange(0, int(inputs.shape[0] * 0.7))]]
        train_ou = right_output[data[np.arange(int(inputs.shape[0] * 0.7), inputs.shape[0])]]
        test_in = inputs[data[np.arange(0, int(inputs.shape[0] * 0.7))]]
        test_ou = right_output[data[np.arange(int(inputs.shape[0] * 0.7), inputs.shape[0])]]
        while True:
            e = 0
            for i in range(0, train_in.shape[0]):
                e += (train_ou - self.out(test_in[i], train_ou, learning_rate))**2 / 2
            print("训练集误差" + str(e))
            e = 0
            for i in range(0, train_in.shape[0]):
                e += (test_ou - self.out(test_in[i]))**2 / 2
            print("测试集误差" + str(e))



inputs = np.array([[0, 1], [1, 1], [0, 1], [0, 0]])
outputs = np.array([[1], [0], [1], [0]])
BP = BPNN(2, 1, 4, 10, tanh, derived_tanh)
for i in range(0, 10):
    e = 0
    for j in range(0, 4):
        e += np.abs(outputs[j] - BP.out(inputs[j], outputs[j], 0.9))
    print('误差' + str(e))

e = 0
for i in range(0, 4):
    out = BP.out(inputs[i])
    print('输入' + str(inputs[i]) + '\t期望输出' + str(outputs[i]) + '\t实际输出' + str(out))
    e += np.abs(outputs[i] - out)
print('总误差' + str(e))

输出如下


误差[2.69006214]
误差[2.]
误差[2.]
误差[2.]
误差[2.]
误差[2.]
误差[2.]
误差[2.]
误差[2.]
误差[2.]
输入[0 1]       期望输出[1]     实际输出[0.99992796]
输入[1 1]       期望输出[0]     实际输出[0.99992796]
输入[0 1]       期望输出[1]     实际输出[0.99992796]
输入[0 0]       期望输出[0]     实际输出[0.99992796]

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

报告相同问题？

关注问题

pb8使用posturl函数问题
2015-06-25 07:39

回答 2 已采纳用adosteam http://bbs.csdn.net/topics/390821971 ``` integer li_rtn OLEObject ole_ADOSt
pb-为什么函数里面没有代码还可以运行(winsock)
2018-01-07 12:07

回答 2 已采纳这是pbl文件，相当于dll函数库，所以它是编译好的，可以直接调用的函数。如同运行一个exe文件，也不需要源代码。
tensorflow C++ 调用PB模型文件参数问题 c++ tensorflow
2022-03-08 22:36

回答 1 已采纳问题已解决，首先，传入参数是一张图片，类型确实是一个字符串,只不过类型是tstring，通过std::unique_ptrtensorflow::RandomAccessFile生成字符串。 tens
PB.rar_人工神经网络
2022-09-24 09:20

人工神经网络(ANN)是计算机科学与人工智能领域中的一种重要模型，它受到生物神经系统的启发，模拟了大脑中神经元的连接与交互方式。在"PB.rar_人工神经网络"这个压缩包中，我们可能找到了关于线性网络，特别是单输入...
tensorflow训练完成生成了三个文件，如何转换为pb文件 python tensorflow 机器学习神经网络
2021-01-25 14:13

回答 9 已采纳请参考： https://zhuanlan.zhihu.com/p/24698483
PB 打印问题！求解决
2015-04-21 02:13

回答 1 已采纳你这个实现起来有难度，建议你在数据窗口里增加一个伪列plan_row，然后根据当前人员的值（如果有8行，就把这个值赋值为8），然后把detail区的height改为以下表达式 plan_row *
PB 经典问题无解了！
2015-01-19 12:26

回答 4 已采纳告诉你在连接数据库的地方判断一下是否成功 connect using sqlca; //这句话后要判断sqlca.sqlcode，看是否连接成功，如果未连接成功，提示一下原因 open(w_z
非线性函数拟合--基于pytorch的BP神经网络
2021-11-21 20:54

独憩的博客本次的目的是利用PB神经网络拟合非线性函数：y=x^2+x+1 导入相关库： import torch import torch.nn as nn from torch.optim import SGD import torch.utils.data as Data from sklearn.datasets import load_...
指针函数参数传递问题
2016-12-24 07:19

回答 3 已采纳我明白了，change2局部变量的指针在函数调用结束其内存空间就释放了，所以还是原来的指针。change1，里面的值发生交换，指针未发生交互
（PB9）：datawindow中edit选择dropdownlistbox后保存取值问题
2016-11-23 02:49

回答 3 已采纳 dw_1.setitem(1,'sex','1')
关于pb10.0的database和下拉框的问题数据库
2018-01-18 10:03

回答 1 已采纳不知道你的程序怎么写的，你的问题说得很不清楚。如果你什么都不懂，可以参考下面现成的 http://download.csdn.net/download/samsuper/7496947 htt
神经网络的5个应用场景,人工神经网络实际应用
2022-10-13 13:42

小浣熊的技术的博客什么是神经网络：人工神经网络（Artificial Neural Networks，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（Connection Model），它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型...
PB的数据窗口中怎样选中一列？
2015-08-13 10:37

回答 1 已采纳用sql语句，直接指定列名就可以了。
神经网络入门必备——BP神经网络
2024-02-08 14:52

爱吃柠檬的天天的博客介绍BP神经网络的原理和实际用法
ndraw是一个可自由定义网络图、流程图以及简单的神经网络可视化工具
2024-06-03 08:46

《ndraw：网络图、流程图与神经网络可视化的利器》在当今的IT领域，尤其是在人工智能和机器学习/深度学习的研究中，数据可视化扮演着至关重要的角色。它能够帮助我们更好地理解复杂模型的工作原理，优化算法，并...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 2月3日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 1月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月31日

悬赏问题

¥15 lvgl v8.2定时器提前到来
¥15 qtcp 发送数据时偶尔会遇到发送数据失败？用的MSVC编译器(标签-qt|关键词-tcp)
¥15 cam_lidar_calibration报错
¥15 拓扑学，凸集，紧集。。
¥15 如何扩大AIS数据容量
¥15 单纯型python实现编译报错
¥15 c++2013读写oracle
¥15 c++ gmssl sm2验签demo
¥15 关于模的完全剩余系(关键词-数学方法)
¥15 有没有人懂这个博图程序怎么写，还要跟SFB连接，真的不会，求帮助

PB神经网络损失函数问题

0条回答 默认 最新

问题事件

悬赏问题

0条回答默认最新