深度学习和参数相乘，矩阵维度不一致

目前在看深度学习入门（基于Python）这本书，运行的是里面的示例代码。在训练完成模型后，对手写数字测试集取单一图片进行预测。在预测的时候，用到了y = Wx + b。wx是矩阵相乘，但是现在有3个W，3个b,上一次的输出的维度不能和下一个W的维度对应，是我哪方面有问题吗，欢迎各位指教

img = x_train[0].reshape(1,1,28,28)
x = im2col(img, 5, 5)  # (48400, 25)

def predict(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network["W3"]  # (30, 1, 5, 5)(363000, 100)(100, 2)
    b1, b2, b3 = network['b1'], network['b2'], network['b3']  # (30,)(100, )(2, )
    col_W1 = W1.reshape(30, -1).T  # (25, 30)
    # print(x.shape, col_W1.shape)
    a1 = np.dot(x, col_W1) + b1
    z1 = sigmoid(a1)  # (48400,30)
    # 运行这里时候  (48400,30) * (363000, 100) 我应该怎么办？变形或者什么？
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = softmax(a3)
    return y

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
爱晚乏客游 2021-07-01 16:41
关注
将图片按照你的模型流程走啊，走到了参数这里不就是可以相乘了。不然不知道你这些参数维度含义，直接扩展维度相乘，但是结果没意义

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python人工智能课程 AI算法课程 Python机器学习与深度学习 1.矩阵和线性代数_Python 共90页.pdf
2024-07-18 15:29

矩阵和线性代数是理解机器学习与深度学习算法的基础。通过掌握这些基本概念和运算，可以更好地理解和实现复杂的机器学习模型。此外，SVD、特征值与特征向量等高级概念在很多场景下都有非常广泛的应用，如图像处理、...
深度学习的12 个矩阵运算
2025-01-10 19:57

axecute的博客 深度学习的12 个矩阵运算【附一个GPU矩阵乘法运算工具软件Windows版本】
矩阵运算-AI及深度学习
2019-04-27 11:23

在AI和深度学习领域，矩阵运算是至关重要的基础，它为复杂的算法提供了数学支撑。本文将深入探讨矩阵运算的相关知识点，结合提供的文件名，我们将依次介绍矩阵的基本概念、矩阵乘法、逆矩阵、正交对称性、LU分解、...
深度学习blog-深刻理解线性变换和矩阵
2025-01-04 16:22

最好Tony的博客 深度学习中避免不了矩阵运算，或者张量（其实是矩阵数组）运算。卷积是矩阵加、乘法，注意力也是一样。本质都一样，所谓注意力，卷积、滤波，是对不必了解数学的人说的，底层都是矩阵运算，线性变换。任何一个向量都...
写给新人的深度学习扫盲贴：向量与矩阵
2025-04-03 20:00

程序员Linc的博客张量是更高维度的推广：标量（0阶）、向量（1阶）、矩阵（2阶）、三维张量（3阶）等。例如，RGB图像可表示为三维张量（高度×宽度×通道数）。：矩阵用于表示线性变换、数据集（如图像像素矩阵）或多变量关系。例如...
深度学习与矩阵分析的结合：驱动人工智能的发展
2023-12-27 17:57

光子AI的博客 深度学习(Deep Learning)是人工智能(Artificial Intelligence, AI)的一个重要分支，它主要通过模拟人类大脑的思维过程来实现智能化的计算机系统。深度学习的核心技术是神经网络(Neural Networks)，神经网络由多个...
动手学深度学习——矩阵
2024-04-25 10:50

沉下心来学鲁班的博客 a和b分别是两个向量，a·b表示它们的点积，||a||和||b||分别表示它们的范数（即向量的长度）。用途1：神经网络的前向传播中，将输入特征向量与权重矩阵进行点积操作，可以得到每个神经元的加权输入，然后通过激活...
深度学习知识点全面总结
2022-01-05 16:29

GoAI的博客本文详细介绍深度学习概念及原理，参考网上相关资料汇总，内容包含众多章节，包括神经网络基础及常见深度学习网络结构介绍，用于个人学习总结，适合深度学习初学者学习。同时介绍机器学习常见的分类算法：SVM、神经...
【深度学习与大模型基础】第4章-矩阵的运算
2025-03-11 22:35

lynn-66的博客矩阵的转置就是把矩阵的行和列互换。换句话说，原来的第 i 行第 j 列的元素，转置后就变成了第 j 行第 i 列的元素。举个例子，假设我们有一个矩阵 A：这个矩阵有 2 行 3 列。它的转置矩阵就是把行和列互换，变成一个...
人工智能——深度学习——认识Tensor
2025-08-06 17:20

a150463的博客想象你在做蛋糕：简单说，Tensor 是一个可以有任意维度的数组，是向量和矩阵的高维扩展（本质就是一个数组），只是数组是编程语言中的概念，而张量是数学概念深度学习阶段为什么首先介绍Tensor（张量），因为在深度...
深度学习核对矩阵的维数对w权重矩阵的维数的计算
2023-05-30 19:34

kkoneone11的博客分析第一个例子，由行列矩阵相乘理解因为z是(3,1)的，而x是(2,1)的，要变成z(3,1)，w只能是(3,2)。(n,m)：n为神经节点数，m为样本数。x可以看做是a^[0]
深度学习篇---模型权重变化与维度分析
2025-04-29 18:38

Atticus-Orion的博客通过增加网络深度和引入高级技术，模型可以解决更复杂的问题（如图像分类、自然语言处理）。理解权重的动态变化和维度...维度匹配：权重维度确保矩阵乘法可行（如 (n,m) 与 (m,batch) 相乘）。问题解决方案代码示例。
深度学习CNN原理介绍 深度学习原理.pdf
2022-04-13 11:02

深度学习CNN原理介绍是深度学习领域中的一个重要组成部分，它是指使用人工神经网络来模拟人类的视觉系统，以识别图像中的对象和模式。CNN的架构简单来说就是：图像经过两次的卷积、池化、Fully Connected，就是CNN的...
人工智能、机器学习、深度学习
2022-07-13 14:32

weixin_45846711的博客本文主要介绍了人工智能、机器学习、深度学习三个方面的一些基础理论，是在学习过程中的一些总结。
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵
2025-03-22 00:30

Atticus-Orion的博客本文简单介绍了对角矩阵\逆对角矩阵、矩阵的秩、奇异矩阵等线性代数中的矩阵知识，同时关乎到人工智能。对角矩阵是主对角线以外的元素全为零的方阵，形式为：若所有对角元素非零，则称为可逆对角矩阵。矩阵的秩是其...
深度学习大模型： AI 阅卷替代人工阅卷
2025-04-28 12:10

毒果的博客 V 矩阵相乘，得到自注意力机制的输出，从而有效捕捉文本的语义信息和上下文关系。将考生的作答文本和标准答案作为输入，通过 BERT 模型的自注意力机制获取文本的语义表示，然后添加特定的任务层，如全连接层和回归层...
基于PyTorch的深度学习2——逐元素操作，归并，比较，矩阵
2025-03-03 22:55

Wis4e的博客 torch.dot：用于计算两个一维张量的点积。torch.mm：用于计算两个二维张量的标准矩阵乘法。torch.bmm：用于计算两个三维张量中对应的二维子张量之间的批量矩阵乘法。
【深度学习基础|知识概述】基础数学和理论知识中的线性知识：矩阵与向量运算、特征值与特征向量、张量，附代码。
2024-12-25 13:00

985在读小水博一枚呀~的博客【深度学习基础|知识概述】基础数学和理论知识中的线性知识：矩阵与向量运算、特征值与特征向量、张量，附代码。
【北上广深杭大厂AI算法面试题】人工智能大模型篇...矩阵乘法GEMM！以及为什么说GEMM是深度学习的核心？
2025-03-02 21:00

985在读小水博一枚呀~的博客【北上广深杭大厂AI算法面试题】人工智能大模型篇...矩阵乘法GEMM！以及为什么说GEMM是深度学习的核心？
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已结题（查看结题原因） 7月18日

深度学习和参数相乘，矩阵维度不一致

1条回答 默认 最新

问题事件

1条回答默认最新