神经网络初步学习代码困惑


def affine_backward(dout, cache):
    x, w, b = cache                              # 读取缓存
    dx, dw, db = None, None, None                # 返回值初始化
    dx = np.dot(dout, w.T)                       # (N,D),dout(N,M),w.T(M,D),矩阵相乘
    dx = np.reshape(dx, x.shape)                 # (N,d1,...,d_k)
    x_row = x.reshape(x.shape[0], -1)            # (N,D)
    dw = np.dot(x_row.T, dout)                   # (D,M)
    db = np.sum(dout, axis=0, keepdims=True)     # (1,M)
    return dx, dw, db

反向传播函数，激活函数是relu
有两行代码依然不能理解，第一行是因为求导，第二行的dx又进行了变形，变形为什么是变成这样，x.shape的值又是多少呢？似懂非懂，被绕进去了。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Kwan的解忧杂货铺@新空间代码工作室 2024-03-13 08:23
关注
橘子树枝上午好☀️☀️☀️️
本答案参考ChatGPT-3.5

根据你提供的代码，我们来逐行解释一下：

dx = np.dot(dout, w.T)

这一行代码实现的是导数的传播。根据链式法则，对于一个全连接层，输出的误差传播会根据权重的转置来更新输入的误差。这一行代码将输出的误差（dout）与权重的转置（w.T）相乘，得到输入的误差（dx）。

dx = np.reshape(dx, x.shape)

这一行代码将输入的误差（dx）进行了变形。变形的目的是为了保持与输入（x）相同的维度。在神经网络中，通常输入数据是一个多维数组（例如图像）。由于在计算中，我们将其展平为向量，所以在反向传播时，需要将误差变形为与输入相同的维度，以便进行更新。

关于变形的具体细节，x.shape表示输入数据（x）的维度。这个维度取决于输入数据的形状。例如，如果输入数据是一个4x4的图像，那么x.shape将是(4, 4)。而在这里，由于dx是通过将向量还原为多维数组获得的，所以我们需要将其重新变形为与原始输入相同的形状。

为了更好地理解这一行代码，我将给出相关的修改后的代码，以便你更好地理解：

dx = np.reshape(dx, x.shape) # 将dx重新变形为与x相同的形状

总结起来，对于你的困惑，我为你提供以下解决方案：

阅读有关反向传播和链式法则的相关理论知识，这将帮助你更好地理解反向传播的实现过程。
分步调试代码，打印变量的维度和数值，帮助你更好地理解代码的执行过程。
尝试使用不同的输入数据进行测试，观察结果的变化，以加深理解。

希望以上解答对你有所帮助。如果还有其他问题，请随时提问。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

基于python做神经网络、深度学习需不需要自己写代码，需要写到什么程度呢？ python 有问必答深度学习神经网络
2022-05-16 13:12

回答 6 已采纳的确是很多第三方库给你去用，直接import就可以，但是问题是，如果目前出了问题，第三方库无法满足你的需求，你需要进一步修改代码你怎么办？而且这个问题在实际应用中是经常碰见的，这时候你会不会神经网络基
深度学习卷积神经网络 深度学习神经网络
2021-05-29 01:48

回答 2 已采纳 {{2,3,4},{3,4,5},{4,5,6}}
深度学习为什么需要图神经网络？深度学习神经网络
2022-10-21 11:36

回答 1 已采纳随着机器学习、深度学习的发展，语音、图像、自然语言处理逐渐取得了很大的突破，然而语音、图像、文本都是很简单的序列或者网格数据，是很结构化的数据，深度学习很善于处理该种类型的数据。然而现实世界中并不是所
量化神经网络：QNN论文阅读笔记
2019-12-22 20:45

酉意铭的博客论文：《Quantized Neural Networks: Training Neural Networks with Low Precision Weights and Activations》 ... 我们介绍一种训练量化神经网络（QNN）的方法，在运行时具有极低精度（例如1bit）权重和激...
神经网络预测时间序列的学习路线  机器学习神经网络
2022-04-19 17:19

回答 1 已采纳不了解你已经做的情况，只能笼统的给你一些建议：1、神经网络，机器学习，易学难精。对于你的情况，不需要数学知识。2、按照你的描述，坦率的说，不需要做神经网络的技术研究，只要使用形成的方法，例程，根据你的
现在神经网络与深度学习的发展怎么样深度学习神经网络
2022-10-18 17:01

回答 1 已采纳很火热
神经网络学习代码，运行时报错 input X contains infinity or value too large for float64 python 机器学习神经网络
2023-04-03 17:14

回答 2 已采纳你好，看起来type没有问题，有没有可能是小数位数过长？或者有0值或者数值接近于0的数字存在会有影响吗？
华为：大语言模型在推荐系统的实践应用
2024-07-23 10:16

大模型玩家的博客本文从应用视角出发，尝试把大语言模型中的一些长处放在推荐系统中。
神经网络的输出为啥不变呀？(语言-python) python 机器学习神经网络
2023-02-18 23:26

回答 5 已采纳你模型的训练代码呢？你不会每次训练之后没有反向传播更新下权重和梯度信息吧。看你打印的输出，基本上都是初始化之后的权重，不然按照你100个epoch存一下模型来看，不可能都是一样的权重
基于卷积神经网络的人脸检测学习路线？深度学习神经网络
2020-03-20 15:55

回答 2 已采纳眼看疫情耽误2个月，你马上就毕业了，还路线个毛。建议你的学习路线：学会如何使用google 学会如何使用github 学习如何搭建tensorflow（或者pytorch、keras、op
matlab bp神经网络预测代码在2022b报错 matlab 神经网络
2023-02-16 00:19

回答 2 已采纳以下答案引用自GPT-3大模型,请合理使用：修改意见！答：报错的意思是matlab从2016a版本到2022b版本的变化，使得训练参数和输入输出格式存在差异。这里的问题是需要将训练参数进行修改，
大型语言模型综述（二）
2023-05-30 07:10

AI智韵的博客 LLMS自适应调优5.1指令调优5.1.1、格式化实例构造5.1.2指令调优策略5.1.3、指令调优的效果5.2、对齐调整5.2.1、比对的背景和标准5.2.2、收集用户反馈5.2.3、基于人工反馈的强化学习5.3、高效调优5.3.1、参数高效的...
Python BP神经网络两分类反向传播代码问题 python 分类有问必答神经网络
2022-03-17 01:20

回答 2 已采纳反向传播部分计算公式是对的吴恩达深度学习第二次作业_牛客博客带有一个隐藏层的平面数据分类解释一下，就是一个二维平面有两种不同的花色，我
大语言模型原理与工程实践：手把手教你训练 7B 大语言模型自动化训练框架
2024-07-10 00:52

禅与计算机程序设计艺术的博客近年来，大语言模型（Large Language Models，LLMs）在自然语言处理领域取得了突破性进展。从GPT-3到ChatGPT，再到最新的GPT-4，这些模型展现出了惊人的语言理解和生成能力，引发了学术界和产业界的广泛关注。然而，...
基于强化学习的智能机器人路径规划算法研究（附代码）
2022-12-17 21:58

_坐看云起时_的博客本文采用强化学习中的 Q-learning 算法规划机器人的运动路径，做了算法概念学习、算法代码设计、算法参数调优、算法训练测试等具体工作，查阅相关开发资料后，决定应用 QT Creator 5.0.2 作为开发环境，采用栅格...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月13日

悬赏问题

¥15 为什么AVL fire DVI 界面里面的response Editor project 中的Summary result 点不了
¥20 中标麒麟系统V4.0，linux3.10.0的内核，3A4000处理器，如何安装英伟达或AMD的显卡驱动，
¥20 求文心中文心理分析系统（TextMind)
¥15 chipyard环境搭建问题
¥15 python，pyopenGL的OBV渲染无法设置透明
¥20 matlab可以把多个二维图合成为三维瀑布图吗
¥15 EEPROM,软件i2c
¥500 求解读该段JS代码，需要知道是用干什么的
¥20 qt4代码实现二进制文件读取显示，以及显示的内容进行搜索
¥15 Labview获取LK-G3001数据

神经网络初步学习代码困惑

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新