hugeman14138 2023-05-08 16:45 采纳率: 0%

在一个已经训练好的神经网络中，如何给定一个输出值来反向推出特征值的数值大小

已经建立好了mlp神经网络，并且训练也达到了理想情况，如何由人为给定一个输出值来反向得到特征值大小呢？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-05-09 08:39
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
这篇文章：全连接网络（FC）、前馈神经网络（BP）、多层感知机（MLP）也许能够解决你的问题，你可以看下
除此之外, 这篇博客: 深度学习初步，全连接神经网络，MLP从原理到实现（一）原理部分，反向传播详细解释和实际计算例子中的 2.多层全连接神经网络中的反向传播 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

损失函数有很多均方误差，交叉熵损失函数等等。

把所有样本的损失值加起来为总的损失，参数即为神经网络中的权重，将总的损失优化到最小即为最终的权重参数，优化使用梯度下降，只不过可能是各种梯度下降的变形。

如何计算用于更新参数的偏微分是一个重要的问题。

补充：链式求导法则

要计算这里L是总的损失，这里求导举例只举例单个样本对参数求导，总的直接所有样本加起来就行，所以以l代表单个样本的损失值。

反向传播：

为了使用梯度下降，需要求出梯度，也就是损失函数L关于权重w的一阶导数。设有N个样本，那么：

因为多个样本和单个样本求梯度没什么差别，所以下面的例子以求单个样本的损失函数（以l表示）对w的导数为例。类似的，专注损失l对某个特定的w的导数而不是所有w，因为其他w的求法都可以类似得到。

对于这样一个简单的nn结构：

关注左上角的局部部分：

损失函数l是在NN的输出端形成的，要求出l对w1的导数，就要利用开始提到的链式求导法则。

Z的值直接影响到了，所以链式求导从这里开始。

因为：

很容易直接得到就是x1，因为这里是输入层后的隐层，所以是x1，如果不是，直观的后面任意层的就是前一层的输入a

没有这么容易计算，因为z还影响了下一层的输入a，而a又进一步影响后面层的w，这种影响一直延续下去直到输出层。

仔细想想这里的Z就类似上图种的s，只不过NN结构中，Z影响到的变量要比图中的s更多。

接着，继续对展开，Z紧接着送到了激活函数σ中，产生了a。所以：

就是激活函数的导数，写成。

继续写出。

根据链式法则：

所以：

如果z'和z''不是输出层，那么这个过程还有继续进行下去。我们把这个过程看作逆向的：

我们将求这个过程反过来看：

比如：

我们要求，那么可以分为2个步骤，

前向传播求出

反向传播求

就是上一层的输出，本层的输入

而需要从输出层开始计算。

有了那么前面的就可以反向回去。

比如：

这样从后往前计算就可以算出所有的，最后将和乘起来就可以得到。（注意这里的思维要想成所有的w）

下面举一个实际的例子：

NN结构如图，规定激活函数使用sigmoid，损失函数使用交叉熵，输出层[y1,y2]使用softmax。输入单个样本x1，x2=1，2，y=[1,0]（one-hot编码表示类别是y1）。

补充：softmax和交叉熵输出层的求导。

参考：https://blog.csdn.net/qian99/article/details/78046329

最后一层softmax做激活函数，那么输出a的表达式为：

z就是上一层的输入和权重的乘积求和再加上b

激活函数σ(z):

损失函数：

这里l是单个样本，求和是因为多个类别，比如总共有3个类别，如果某个样本的真实类别是2，那么标签是一个向量[0 1 0]，遍历就是要遍历这个向量，就是指不同类别的真实值（这里就只有y2=1，其他为0），就是经过softmax后不同类别的概率分布。

要求的是：

、

这里代表单个样本的损失，如果是多个样本只需要求和：

因为直接影响了a的值，而因为softmax的特效，所有a的分母部分都包含了。影响了所有a的值：

根据链式法则：

先来计算，因为，只对求偏导，所以其他均当作常数项。那么:

再计算，需要分情况讨论，因为j=i时，a的分子部分含有。

当i=j：

当i≠j时：

将上面2种情况组合起来:

所以最后：

有了上面的例子开始计算：

输如样本x=[1,2],y=[1,0],权重初始如图，偏置b都为0.1

（1）先进行一次前向传播，计算所有的神经元输出输出a：

（2）反向传播计算梯度

符号说明：

表示第l（不包含输入层）层第i（从上往下数）个单元产生的z值

表示第l层第x个单元与第l-1层第y个单元之间连接的权重。

计算：

第3层：

第2层：

第1层：

有了，计算就很简单了：比如：

（3）向量化/矩阵化运算

但是这样串行的思想不利用计算，需要把上面的计算过程向量化矩阵化。

1）a的计算

其他层的计算类似，输入x变为输入上一层的输出a

2）

其他情况类似推广。

3）

其他情况类似推广。

可以计算梯度后就可以更新参数了。

您还可以看一下赵辛老师的深度学习之神经网络核心算法与项目实战课程中的 MLP实现非线性边界数据分类（1）小节, 巩固相关知识点
以下回答来自chatgpt:
对于已经训练好的MLP神经网络，如果想通过输入一个输出值来反向计算出相应的特征值大小，可以使用反向传播算法和梯度下降算法来完成。

具体步骤如下：

1.根据MLP神经网络的结构，定义反向传播算法函数backpropagate()。

def backpropagate(output, target, layers): error = output - target for i in reversed(range(len(layers))): layer = layers[i] error = layer.backward(error) return error

2.定义MLP神经网络的类和各层，并使用已训练好的权重w和偏置b对建立的神经网络进行初始化。在类中定义前向传播算法函数forward()和反向传播算法函数backward()。在前向传播算法中，根据经过加权输入进行激活后的输出值和权重，计算出模型输出值。在反向传播算法中，根据输出值和目标值求解梯度。

class MLP(): def __init__(self, num_inputs, num_hidden, num_outputs): self.num_inputs = num_inputs self.hidden_layer = DenseLayer(num_hidden, num_inputs) self.output_layer = DenseLayer(num_outputs, num_hidden) self.layers = [self.hidden_layer, self.output_layer] def forward(self, inputs): x = self.hidden_layer.forward(inputs) x = self.output_layer.forward(x) return x def backward(self, output, target): error = backpropagate(output, target, self.layers) return error

3.在测试数据上进行预测，通过输入输出值，得到输出的特定特征值的大小。具体步骤如下：

（1）读取测试数据，进行标准化处理。

（2）将标准化后的数据输入到神经网络中，得到输出结果。

（3）通过调用backward()函数，返回输入值的特定特征值大小。

import numpy as np # 读取测试数据，并进行标准化处理 test_data = np.loadtxt('test_data.csv', delimiter=',') mean = np.mean(test_data, axis=0) std = np.std(test_data, axis=0) test_data = (test_data - mean) / std # 定义MLP神经网络的结构 mlp = MLP(num_inputs=5, num_hidden=4, num_outputs=3) # 加载已训练好的权重和偏置 mlp.hidden_layer.weights = np.loadtxt('hidden_weights.csv', delimiter=',') mlp.hidden_layer.biases = np.loadtxt('hidden_biases.csv', delimiter=',') mlp.output_layer.weights = np.loadtxt('output_weights.csv', delimiter=',') mlp.output_layer.biases = np.loadtxt('output_biases.csv', delimiter=',') # 对每个测试样本进行预测，输出特定特征值大小 for input in test_data: output = mlp.forward(input) feature_value = mlp.backward(output, [1, 0, 0]) # 输出第一个特征值的大小 print('Feature Value:{}'.format(feature_value))

注意事项：

（1）反向传播算法要求激活函数是可微分的，一般采用sigmoid或者ReLU。

（2）在使用梯度下降算法时，需要谨慎选择学习率，以避免梯度爆炸或者梯度消失的问题。

（3）为了避免过拟合，常采用正则化方法，如L1正则化和L2正则化等。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
反向输出一个四位数（牛客网大一大二编程入门训练BC19) c语言
2021-08-22 14:24

回答 4 已采纳 #include <stdio.h> int main(int argc, char const *argv[]) { int a,b,c,d,e,f; scanf("%d",
python 新手 神经网络的反向传播和误差反向传播是同一个东西吗 tensorflow 深度学习神经网络
2019-02-12 18:00

回答 1 已采纳是的。就是根据损失函数计算的误差，用优化算法（比如梯度下降）反过来修正每一层的权重和偏置，所以叫做误差反向传播，简称反向传播。
基于matlab实现的BP神经网络预测这是一个用于交通流量预测的MATLAB原程序.rar
2024-05-05 22:23

在本项目中，它被用来实现一个BP（Backpropagation）神经网络，以进行交通流量的预测。BP神经网络是一种监督学习的算法，尤其适用于非线性回归问题，比如交通流量预测，它通过不断调整权重和阈值来最小化预测值与...
高分悬赏：Java语言编写一个控制台程序，将用户输入的单词，按照反向排序输出：开发语言
2020-05-19 15:33

回答 4 已采纳 Java 的字符串没有 reverse 方法，需要自己实现，但是 StringBufer 类提供了这个方法，可以直接使用： ![图片说明](https://img-ask.csdn.net/uplo
关于神经网络反向传播中的误差计算机器学习神经网络
2022-10-25 19:01

回答 2 已采纳给你推荐一个系列讲座bilibili：王木头学科学比较硬核，全是数学，没有代码，你要寻根究底还得去看数学
用BP算法完成3个输入，3个隐含，2个输出的神经网络模型的所有参数更新过程深度学习神经网络
2021-05-18 22:18

回答 1 已采纳 https://blog.csdn.net/qq_22475211/article/details/88815457?spm=1001.2014.3001.5502 这是我写的一个bp反向推导你可以
15这是一个matlab神经网络的简单应用，主要用于预测光伏出力，输入为温度湿度等因素，输出为光伏出力。
2022-04-28 22:18

在这个案例中，神经网络可能采用反向传播算法进行训练，这是一种常用的优化方法，通过反向传播误差来调整权重和偏置，以最小化预测值与实际光伏出力之间的差距。数据预处理也是关键步骤，包括数据清洗、归一化或标准...
BP神经网络模型，如果要预测数据，是每一个数据都迭代N次吗？神经网络
2018-10-31 08:03

回答 2 已采纳具体要看你的程序，如果你不使用batch，那么通常的做法是把当前的权重在所有数据之上跑一次（正向传播），然后算出梯度，根据梯度修正每个隐层的权重（反向传播），这个整个的过程算一个迭代。你说的每年的
输入一个三位整数，将它反向输出 c语言
2021-11-18 10:23

回答 1 已采纳供参考： #include <stdio.h> int main() { int n, k=0, sign = 1; scanf("%d", &n); if (n
反向输出一个字符串，为什么输出不了呢 c语言
2021-11-13 10:34

回答 1 已采纳输入用scanf("%s",a)
House-Pricing-Neural-Network:一个神经网络，可以根据某些给定的输入量来预测房屋的价格
2021-03-26 21:26

TensorFlow 是 Google 推出的一个开源库，用于数值计算，特别适合于深度学习任务。它提供了高级 API，如 Keras，使得构建和训练神经网络变得更加简单。Keras 是一个用户友好的、高度模块化的神经网络库，支持快速...
Python BP神经网络两分类反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
bp.zip_BP C++_BP c++_BP神经网络_c 神经网络_c++编程bp神经网络
2022-09-23 19:36

总的来说，C++编程BP神经网络涉及到神经网络理论、数值优化方法以及C++编程技巧，需要理解并应用这些知识来构建一个能够学习和预测的模型。通过对`MyBP.cpp`文件的分析和调试，我们可以深入理解BP神经网络的工作原理...
基于BP神经网络的多输出数据回归预测MATLAB代码
2024-03-15 15:17

在多输出数据回归预测中，BP神经网络可以同时处理多个目标变量，每个输出节点对应一个预测值。这在处理具有多个相关响应变量的问题时特别有用，例如预测股票价格、气象预报等。接下来，我们将详细介绍MATLAB实现这...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月8日

悬赏问题

¥15 C++ 菜单窗口独立出来，可以随意移动放大缩小。
¥15 java代码写在记事本上后在cmd上运行时无报错但又没生成文件
¥15 关于#python#的问题：在跑ldsc数据整理的时候一直抱这种错误，要么--out识别不了参数，要么--merge-alleles识别不了参数(操作系统-linux)
¥15 PPOCRLabel
¥15 网友们我该怎么办啊，急
¥15 混合键合键合机对准标识
¥100 现在不懂的是如何将当前的相机中的照片,作为纹理贴图,映射到扫描出的模型上
¥15 目标跟踪，计算机视觉
¥15 魔霸ROG7 pro,win11.息屏后会显示黑屏,如图，如何解决？(关键词-重新启动)
¥15 有没有人知道这是哪里出了问题啊？要怎么改呀？

在一个已经训练好的神经网络中，如何给定一个输出值来反向推出特征值的数值大小

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新