神经网络的输入参数x为什么是这样(语言-python)

# 前向传播函数
# - x：包含输入数据的numpy数组，形状为（N，d_1，...，d_k）
# - w：形状为（D，M）的一系列权重
# - b：偏置，形状为（M，）
def affine_forward(x, w, b):   
    out = None                       # 初始化返回值为None
    N = x.shape[0]                   # 重置输入参数X的形状
    x_row = x.reshape(N, -1)         # (N,D)
    out = np.dot(x_row, w) + b       # (N,M)
    cache = (x, w, b)                # 缓存值，反向传播时使用
    return out,cache

在某些应用场景中，x的维度可能更高。比如对于一个2020像素的4张灰度图，x的形状将是(4,20,20)，对应的参数就是N=4，d_1=20，d_2=20。（这里边第一个参数用N表示，它代表的是同时用于计算前向传播的数据有几组，后边的参数d_1~d_k代表的是数据本身的形状。）
对于这种维度大于2的x来说，需要对其进行重新塑形，也就是将(4,20,20)的高维数组变化为(4,2020)这样的二位数组。为什么要这么做呢？是为了方便计算。这样变换之后高维的向量被“拍扁”成一维向量（长度为20*20的一维向量），对应的W和b也都是一维的，既统一了参数形式，又不会影响数据的正常使用。

我的理解是N就是数据的数量，不同的数据有不同的规格，每个数据的具体样式则是d_1，d_2，d_k决定的。如果有四个数据，数据本身就是20行20列的，那么x的形状应该写作（4，20，20）。照这样说，如果有四个数据，每个数据是一行两列的，x的形状为什么不是（4，1，2）而是（4，2）呢？1可以省略不写吗？

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-03-12 09:26
关注
引自免费微信小程序：皆我百晓生

在神经网络中，输入参数x的形状会根据实际应用的数据结构来设计。你对N和d_1、d_2、d_k的理解是正确的。N确实代表了批量数据的数量，而d_1、d_2等维度则对应了单个数据样本的空间维度。

对于你的问题，当有四个数据，每个数据是一行两列（即二维向量）时，x的正确形状应该是(4, 2)。这里之所以不需要写成(4, 1, 2)，是因为在神经网络处理这类数据时，通常将每个独立的数据样本看作一个一维数组，即使它原本在逻辑上是二维的。在这种情况下，我们直接将每行两列的数据视为一个长度为2的一维向量，因此第二维度就直接写成了2，省略了不包含信息的1维。

例如，如果有四个这样的数据样本，可以表示为：

[ [a1, a2], [b1, b2], [c1, c2], [d1, d2] ]

这个列表会被转换为形状为(4, 2)的numpy数组，其中每一行对应一个样本，每一列代表样本的一个特征值。

在上述代码affine_forward函数中，reshape操作就是为了将可能的高维数据展平为一维，以便进行矩阵乘法运算。这是因为权重w是一个二维数组，需要与展平后的输入向量进行点积运算。所以，无论原始输入数据有多少维，最终都需要将其变形成能够与权重矩阵相乘的形式。
解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

神经网络的输出为啥不变呀？(语言-python) python 机器学习神经网络
2023-02-18 23:26

回答 5 已采纳你模型的训练代码呢？你不会每次训练之后没有反向传播更新下权重和梯度信息吧。看你打印的输出，基本上都是初始化之后的权重，不然按照你100个epoch存一下模型来看，不可能都是一样的权重
用python语言编程"输入不确定的整数，直到－1为止" python
2021-11-07 16:04

回答 2 已采纳 cnt=1 while True: n=int(input('请输入：')) if n==-1: print('结束,满足条件的有{}个'.format(cnt))
如何解决cannot identify image file(语言-python) python 有问必答
2022-01-12 18:11

回答 2 已采纳第一段代码中这for i in dic有问题，这只是遍历键名，使用dic.values()才行。写成这样： import pyautogui as p import time dic = {"首都
Python神经网络编程_神经网络_python神经网络编程_
2021-10-01 14:24

在Python中进行神经网络编程是一项基础且至关重要的技能，尤其对于数据科学家和机器学习工程师而言。Python因其丰富的库和简洁的语法，成为了构建神经网络的首选语言。本篇将深入探讨Python神经网络编程的关键概念、...
python PTA jmu-python-找子串 python
2022-05-15 20:40

回答 1 已采纳 str1=input() s1=int(input())-1 s2=int(input()) if s2-s1>len(str1): print("没子串！") else: p
关于could not convert string to float 的问题(语言-python) python
2021-12-19 15:14

回答 5 已采纳 def main(): x,y=loadIris() liner=linear_model.LinearRegression() liner.fit(x,y) sh
opencv-python>=4.1.2 not found 报错处理 opencv python 图像处理
2022-11-06 21:48

回答 7 已采纳你确定你运行的环境是这个（图里的红框）吗？
python神经网络学习分享-时梨.pdf
2024-04-09 19:26

本文档主要介绍了一种使用Python编程语言构建神经网络的方法，该方法旨在识别MNIST数据集中的手写数字。作者通过详细解析神经网络的结构、数学原理及其在Python中的具体实现方式，为读者提供了一个全面的学习指南。 ...
求python3代码（利用bp神经网络计算评价结果） python 有问必答神经网络
2021-06-11 18:22

回答 4 已采纳这个需要问主提供具体的数据，后面可以使用多层感知机等方法对数据进行拟合。划分等级的话可以用聚类相关算法完成
Python编程语言 list python 有问必答
2021-12-29 11:00

回答 2 已采纳 import random n=int(input()) list=[] for i in range(n): list.append(random.randint(1,200)) print
yolov5增加数据集需要整个重新训练吗？(语言-python) python pytorch 深度学习
2022-02-17 14:25

回答 1 已采纳不需要，之前模型训练好了打包出来，有个参数文件，下次直接把这个参数model.load_weights（）把之前的参数load进去，然后只训练新的数据就行
Python实现神经网络语言模型（代码详解）
2024-02-28 21:30

瑞雪兆我心的博客【代码】Python实现神经网络语言模型（Neural Network Language Model, NNLM）
神经网络训练集添加高斯噪声 python 开发语言神经网络
2021-02-01 11:00

回答 1 已采纳 1，如果网路中使用了normalization层，则不需要重新归一化； 2，如果不放心，可以使用“截断”，让小于0的变成0，大于1的变成1即可。
用 Python 从头实现一个神经网络（附代码）
2022-08-10 21:57

这里我们以一个简单的两层神经网络为例，包括一个输入层、一个隐藏层和一个输出层。在 Python 中，我们首先需要导入必要的库，如 numpy 用于矩阵运算，以及 matplotlib 用于可视化。下面是一段导入库的代码： ```...
BP神经网络实例及代码分析(python+tensorflow),bp神经网络例子,Python
2021-09-10 16:37

本教程将通过Python编程语言和TensorFlow库来深入探讨BP神经网络的实现。 **一、BP神经网络的基本原理** BP神经网络的核心思想是通过反向传播误差来调整网络权重，以最小化预测输出与实际目标之间的差距。它包含三...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月12日

悬赏问题

¥15 内网办公电脑进行向日葵
¥15 如何输入双曲线的参数a然后画出双曲线？我输入处理函数加上后就没有用了，不知道怎么回事去掉后双曲线可以画出来
¥50 WPF Lidgren.Network.Core2连接问题
¥15 soildworks装配体的尺寸问题
¥100 有偿寻云闪付SDK转URL技术
¥30 基于信创PC发布的QT应用如何跨用户启动后输入中文
¥20 非root手机，如何精准控制手机流量消耗的大小，如20M
¥15 远程安装一下vasp
¥15 自己做的代码上传图片时，报错
¥15 Lingo线性规划模型怎么搭建

神经网络的输入参数x为什么是这样(语言-python)

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新