xuetuzzz 2022-03-17 01:20 采纳率: 100%

已结题

Python BP神经网络两分类反向传播代码问题

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

import pandas as pd
import numpy as np
import datetime
import matplotlib.pyplot as plt
from pandas.plotting import radviz
'''
构建一个具有1个隐藏层的神经网络，隐层的大小为10
输入层为4个特征，输出层为3个分类
(1,0,0)为第一类，(0,1,0)为第二类，(0,0,1)为第三类
'''

1.初始化参数

def initialize_parameters(n_x, n_h, n_y):
np.random.seed(2)

# 权重和偏置矩阵
w1 = np.random.randn(n_h, n_x) * 0.01
b1 = np.zeros(shape=(n_h, 1))
w2 = np.random.randn(n_y, n_h) * 0.01
b2 = np.zeros(shape=(n_y, 1))

# 通过字典存储参数
parameters = {'w1': w1, 'b1': b1, 'w2': w2, 'b2': b2}

return parameters

2.前向传播

def forward_propagation(X, parameters):
w1 = parameters['w1']
b1 = parameters['b1']
w2 = parameters['w2']
b2 = parameters['b2']

# 通过前向传播来计算a2
z1 = np.dot(w1, X) + b1     # 这个地方需注意矩阵加法：虽然(w1*X)和b1的维度不同，但可以相加
a1 = np.tanh(z1)            # 使用tanh作为第一层的激活函数
z2 = np.dot(w2, a1) + b2
a2 = 1 / (1 + np.exp(-z2))  # 使用sigmoid作为第二层的激活函数

# 通过字典存储参数
cache = {'z1': z1, 'a1': a1, 'z2': z2, 'a2': a2}

return a2, cache

3.计算代价函数

def compute_cost(a2, Y):
m = Y.shape[1] # Y的列数即为总的样本数

# 采用交叉熵（cross-entropy）作为代价函数
logprobs = np.multiply(np.log(a2), Y) + np.multiply(np.log(1 - a2),(1 - Y))
cost = - np.sum(logprobs) / m

return cost

4.反向传播（计算代价函数的导数）

def backward_propagation(parameters, cache, X, Y):
m = Y.shape[1]

w2 = parameters['w2']

a1 = cache['a1']
a2 = cache['a2']

# 反向传播，计算dw1、db1、dw2、db2
dz2 = a2 - Y
dw2 = (1 / m) * np.dot(dz2, a1.T)
db2 = (1 / m) * np.sum(dz2, axis=1, keepdims=True)
dz1 = np.multiply(np.dot(w2.T, dz2), 1 - np.power(a1, 2))
dw1 = (1 / m) * np.dot(dz1, X.T)
db1 = (1 / m) * np.sum(dz1, axis=1, keepdims=True)

grads = {'dw1': dw1, 'db1': db1, 'dw2': dw2, 'db2': db2}

return grads

5.更新参数

def update_parameters(parameters, grads, learning_rate=0.4):
w1 = parameters['w1']
b1 = parameters['b1']
w2 = parameters['w2']
b2 = parameters['b2']

dw1 = grads['dw1']
db1 = grads['db1']
dw2 = grads['dw2']
db2 = grads['db2']

# 更新参数
w1 = w1 - dw1 * learning_rate
b1 = b1 - db1 * learning_rate
w2 = w2 - dw2 * learning_rate
b2 = b2 - db2 * learning_rate

parameters = {'w1': w1, 'b1': b1, 'w2': w2, 'b2': b2}

return parameters

建立神经网络

def nn_model(X, Y, n_h, n_input, n_output, num_iterations=10000, print_cost=False):
np.random.seed(3)

n_x = n_input           # 输入层节点数
n_y = n_output          # 输出层节点数

# 1.初始化参数
parameters = initialize_parameters(n_x, n_h, n_y)

# 梯度下降循环
for i in range(0, num_iterations):
    # 2.前向传播
    a2, cache = forward_propagation(X, parameters)
    # 3.计算代价函数
    cost = compute_cost(a2, Y)
    # 4.反向传播
    grads = backward_propagation(parameters, cache, X, Y)
    # 5.更新参数
    parameters = update_parameters(parameters, grads)

    # 每1000次迭代，输出一次代价函数
    if print_cost and i % 1000 == 0:
        print('迭代第%i次，代价函数为：%f' % (i, cost))

return parameters

运行结果及报错内容

我的解答思路和尝试过的方法

想问一下各位这个代码的反向传播部分里面的计算公式是对的嘛，尤其是dw1，dw2部分，现在需要学习率很高才能快速收敛

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-深度学习进阶 2022-03-17 08:08
关注
反向传播部分计算公式是对的
吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我们通过花色将这个平面进行划分预备知识我们先来看一下我们需要的包 import numpy as npimport ma https://blog.nowcoder.net/n/c4635a8beeb84e7e91986b8c0da7a313?from=nowcoder_improve

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python BP神经网络两分类 反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳 反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
求python3代码（利用bp神经网络计算评价结果） python 有问必答神经网络
2021-06-11 18:22

回答 4 已采纳这个需要问主提供具体的数据，后面可以使用多层感知机等方法对数据进行拟合。划分等级的话可以用聚类相关算法完成
python 新手神经网络的反向传播 和误差反向传播 是同一个东西吗 tensorflow 深度学习神经网络
2019-02-12 18:00

回答 1 已采纳是的。就是根据损失函数计算的误差，用优化算法（比如梯度下降）反过来修正每一层的权重和偏置，所以叫做误差反向传播，简称反向传播。
bp神经网络（python）-代码-人脸识别小项目
2022-05-17 11:07

在BP神经网络中，网络首先正向传播输入数据，然后根据预测输出与真实输出之间的误差，通过反向传播算法更新权重，以最小化损失函数。 **人脸识别技术** 人脸识别通常包括预处理（如灰度化、归一化）、特征提取（如...
BP神经网络对新数据进行预测 python 有问必答神经网络
2021-07-01 21:07

回答 1 已采纳训练数据集默认代表所有数据集的分布（采样原则），所以训练集如何归一化，那么预测就如何操作。如果训练集分布不能代表所有数据集分布，需要进行定向数据增强或者增加训练集样本。1）常规的分类，直接减均值除以方
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
BP神经网络预测股票,bp神经网络预测股票价格python代码,matlab
2021-09-10 16:52

BP神经网络，全称为Backpropagation Neural Network，是一种在机器学习领域广泛应用的多层前馈神经网络。在股票预测中，BP神经网络被用来分析历史数据，试图预测未来的股票价格走势。这种网络通过学习和调整权重来...
bp神经网络怎么实际应用啊？Python python 神经网络
2018-10-20 10:00

回答 2 已采纳解决了。。。。。。。
请问一下BP神经网络为什么每次训练的结果都不一样？而且差距还挺大吗？神经网络
2022-04-17 20:00

回答 1 已采纳因为每次拟合出来的模型都不一样，还有跟你设置的超参数有关
用BP神经网络进行预测，loss比较小，但预测值跟实际值相差较大，怎么办 keras python 有问必答神经网络
2021-07-19 21:04

回答 1 已采纳首先怀疑过拟合, 减少迭代次数, 像这种非常简单的数据拟合, 完全不需要200这么大的周期, 一般30-50个足够
基于人工蜂群的BP神经网络 人工蜂群算法的反向传播神经网络.zip
2019-05-20 18:02

综上所述，"基于人工蜂群的BP神经网络 人工蜂群算法的反向传播神经网络"的研究是将自然界的智能行为模拟引入到机器学习领域，通过人工蜂群算法优化BP神经网络的训练过程，提升其性能和泛化能力。这一方法的实现和...
基于bp神经网络求变量的重要性 matlab
2022-08-13 22:22

回答 1 已采纳神经网络不能像树模型这些通过shape来预测重要性，那计算量太大，不适用，只能通过permutation预测，也就是每次随机打乱目标特征，然后进训练好的模型预测，预测效果越差即准确率越差，就说明特征重
BP神经网络实例及代码分析(python+tensorflow),bp神经网络例子,Python
2021-09-10 16:37

**BP神经网络实例及代码分析(python+tensorflow)** BP（Backpropagation）神经网络是一种广泛应用的人工神经网络模型，主要用于监督学习任务，尤其是在模式识别和函数拟合等领域。本教程将通过Python编程语言和...
基于python编程的BP神经网络（代码完整，数据齐全）
2024-01-03 20:45

BP神经网络常应用于回归问题和分类问题，如股票预测、图像识别等。在给定的"bpnet"压缩包中，可能包含了完整的代码示例和训练数据，你可以通过运行这些代码，了解BP神经网络的具体实现过程。通过以上步骤，你将...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月17日

悬赏问题

¥15 Stata链式中介效应代码修改
¥15 latex投稿显示click download
¥15 请问读取环境变量文件失败是什么原因？
¥15 在若依框架下实现人脸识别
¥15 网络科学导论，网络控制
¥100 安卓tv程序连接SQLSERVER2008问题
¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比，为什么Snetinel-2计算的结果最小值特别小，而Lansat8就很平均
¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错

Python BP神经网络两分类 反向传播代码问题