xuetuzzz 2022-03-17 01:20 采纳率: 100%

已结题

Python BP神经网络两分类反向传播代码问题

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

import pandas as pd
import numpy as np
import datetime
import matplotlib.pyplot as plt
from pandas.plotting import radviz
'''
构建一个具有1个隐藏层的神经网络，隐层的大小为10
输入层为4个特征，输出层为3个分类
(1,0,0)为第一类，(0,1,0)为第二类，(0,0,1)为第三类
'''

1.初始化参数

def initialize_parameters(n_x, n_h, n_y):
np.random.seed(2)

# 权重和偏置矩阵
w1 = np.random.randn(n_h, n_x) * 0.01
b1 = np.zeros(shape=(n_h, 1))
w2 = np.random.randn(n_y, n_h) * 0.01
b2 = np.zeros(shape=(n_y, 1))

# 通过字典存储参数
parameters = {'w1': w1, 'b1': b1, 'w2': w2, 'b2': b2}

return parameters

2.前向传播

def forward_propagation(X, parameters):
w1 = parameters['w1']
b1 = parameters['b1']
w2 = parameters['w2']
b2 = parameters['b2']

# 通过前向传播来计算a2
z1 = np.dot(w1, X) + b1     # 这个地方需注意矩阵加法：虽然(w1*X)和b1的维度不同，但可以相加
a1 = np.tanh(z1)            # 使用tanh作为第一层的激活函数
z2 = np.dot(w2, a1) + b2
a2 = 1 / (1 + np.exp(-z2))  # 使用sigmoid作为第二层的激活函数

# 通过字典存储参数
cache = {'z1': z1, 'a1': a1, 'z2': z2, 'a2': a2}

return a2, cache

3.计算代价函数

def compute_cost(a2, Y):
m = Y.shape[1] # Y的列数即为总的样本数

# 采用交叉熵（cross-entropy）作为代价函数
logprobs = np.multiply(np.log(a2), Y) + np.multiply(np.log(1 - a2),(1 - Y))
cost = - np.sum(logprobs) / m

return cost

4.反向传播（计算代价函数的导数）

def backward_propagation(parameters, cache, X, Y):
m = Y.shape[1]

w2 = parameters['w2']

a1 = cache['a1']
a2 = cache['a2']

# 反向传播，计算dw1、db1、dw2、db2
dz2 = a2 - Y
dw2 = (1 / m) * np.dot(dz2, a1.T)
db2 = (1 / m) * np.sum(dz2, axis=1, keepdims=True)
dz1 = np.multiply(np.dot(w2.T, dz2), 1 - np.power(a1, 2))
dw1 = (1 / m) * np.dot(dz1, X.T)
db1 = (1 / m) * np.sum(dz1, axis=1, keepdims=True)

grads = {'dw1': dw1, 'db1': db1, 'dw2': dw2, 'db2': db2}

return grads

5.更新参数

def update_parameters(parameters, grads, learning_rate=0.4):
w1 = parameters['w1']
b1 = parameters['b1']
w2 = parameters['w2']
b2 = parameters['b2']

dw1 = grads['dw1']
db1 = grads['db1']
dw2 = grads['dw2']
db2 = grads['db2']

# 更新参数
w1 = w1 - dw1 * learning_rate
b1 = b1 - db1 * learning_rate
w2 = w2 - dw2 * learning_rate
b2 = b2 - db2 * learning_rate

parameters = {'w1': w1, 'b1': b1, 'w2': w2, 'b2': b2}

return parameters

建立神经网络

def nn_model(X, Y, n_h, n_input, n_output, num_iterations=10000, print_cost=False):
np.random.seed(3)

n_x = n_input           # 输入层节点数
n_y = n_output          # 输出层节点数

# 1.初始化参数
parameters = initialize_parameters(n_x, n_h, n_y)

# 梯度下降循环
for i in range(0, num_iterations):
    # 2.前向传播
    a2, cache = forward_propagation(X, parameters)
    # 3.计算代价函数
    cost = compute_cost(a2, Y)
    # 4.反向传播
    grads = backward_propagation(parameters, cache, X, Y)
    # 5.更新参数
    parameters = update_parameters(parameters, grads)

    # 每1000次迭代，输出一次代价函数
    if print_cost and i % 1000 == 0:
        print('迭代第%i次，代价函数为：%f' % (i, cost))

return parameters

运行结果及报错内容

我的解答思路和尝试过的方法

想问一下各位这个代码的反向传播部分里面的计算公式是对的嘛，尤其是dw1，dw2部分，现在需要学习率很高才能快速收敛

我想要达到的结果

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-深度学习进阶 2022-03-17 08:08
关注
反向传播部分计算公式是对的
吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我们通过花色将这个平面进行划分预备知识我们先来看一下我们需要的包 import numpy as npimport ma https://blog.nowcoder.net/n/c4635a8beeb84e7e91986b8c0da7a313?from=nowcoder_improve

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

Python BP神经网络两分类 反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳 反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
求python3代码（利用bp神经网络计算评价结果） python 有问必答神经网络
2021-06-11 18:22

回答 4 已采纳这个需要问主提供具体的数据，后面可以使用多层感知机等方法对数据进行拟合。划分等级的话可以用聚类相关算法完成
python 新手神经网络的反向传播 和误差反向传播 是同一个东西吗 tensorflow 深度学习神经网络
2019-02-12 18:00

回答 1 已采纳是的。就是根据损失函数计算的误差，用优化算法（比如梯度下降）反过来修正每一层的权重和偏置，所以叫做误差反向传播，简称反向传播。
基于人工蜂群的BP神经网络 人工蜂群算法的反向传播神经网络.zip
2019-05-20 18:02

基于人工蜂群的BP神经网络 人工蜂群算法的反向传播神经网络。基于人工蜂群算法的反向传播神经网络，通过大量尝试提出对神经网络误差调整参数进行优化的方法 BP神经网络 基于人工蜂群的BP神经网络
BP神经网络对新数据进行预测 python 有问必答神经网络
2021-07-01 21:07

回答 1 已采纳训练数据集默认代表所有数据集的分布（采样原则），所以训练集如何归一化，那么预测就如何操作。如果训练集分布不能代表所有数据集分布，需要进行定向数据增强或者增加训练集样本。1）常规的分类，直接减均值除以方
基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
如何将训练好的BP神经网络模型保存并可以在其他py文件中直接调用？ python 有问必答机器学习神经网络
2021-06-09 10:53

回答 2 已采纳这个需要建立字典封装起来
基于python实现的BP神经网络手写数字识别模型实验源码+详细注释+数据集+项目说明+实验结果及总结.7z
2022-12-14 15:00

基于python实现的BP神经网络手写数字识别模型实验源码+详细注释+数据集+项目说明+实验结果及总结.7z 人工智能 课程作业手写数字数据集 BP网络模型识别手写数字 反向传播（英语：Backpropagation，缩写为BP）是...
bp神经网络怎么实际应用啊？Python python 神经网络
2018-10-20 10:00

回答 2 已采纳解决了。。。。。。。
请问一下BP神经网络为什么每次训练的结果都不一样？而且差距还挺大吗？神经网络
2022-04-17 20:00

回答 1 已采纳因为每次拟合出来的模型都不一样，还有跟你设置的超参数有关
用BP神经网络进行预测，loss比较小，但预测值跟实际值相差较大，怎么办 keras python 有问必答神经网络
2021-07-19 21:04

回答 1 已采纳首先怀疑过拟合, 减少迭代次数, 像这种非常简单的数据拟合, 完全不需要200这么大的周期, 一般30-50个足够
BP神经网络（Python代码实现）基于pytorch
2022-03-07 21:36

LiuWH888的博客 BP神经网络（Python代码实现）基于pytorch
基于bp神经网络求变量的重要性 matlab
2022-08-13 22:22

回答 1 已采纳神经网络不能像树模型这些通过shape来预测重要性，那计算量太大，不适用，只能通过permutation预测，也就是每次随机打乱目标特征，然后进训练好的模型预测，预测效果越差即准确率越差，就说明特征重
BP 神经网络（反向传播的神经网络）的解读，python 代码
2019-08-13 17:24

心态与习惯的博客文章目录一、神经网络算法的内涵二、神经元之间信息的传递三、采用梯度下降法使误差减小四、BP 神经网络的局限性1. 不能保证得到全局最优解2. 输入的数据不要求标准化，但若标准化，可以提高神经网络的表现。人工...
BP神经网络_Python实习_包含鸢尾花分类例程
2018-06-11 19:56

本例中包含两层BP神经网络模板程序（可以直接调用，可定制中间层神经元个数，设置学习率，绘制衰减曲线，可用于简单的模式识别和预测）、一个调用的例程（包括简单的数据预处理如归一化的使用，测试结果准确率为98.3...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月17日

悬赏问题

¥15 r语言神经网络自变量重要性分析
¥15 基于双目测规则物体尺寸
¥15 wegame打不开英雄联盟
¥15 公司的电脑，win10系统自带远程协助，访问家里个人电脑，提示出现内部错误，各种常规的设置都已经尝试，感觉公司对此功能进行了限制（我们是集团公司）
¥15 救！ENVI5.6深度学习初始化模型报错怎么办？
¥30 eclipse开启服务后，网页无法打开
¥30 雷达辐射源信号参考模型
¥15 html+css+js如何实现这样子的效果？
¥15 STM32单片机自主设计
¥15 如何在node.js中或者java中给wav格式的音频编码成sil格式呢

Python BP神经网络两分类 反向传播代码问题