矩阵乘积的秩为何满足 rank(AB) ≤ min{rank(A), rank(B)}？

为什么矩阵乘积的秩满足 $\operatorname{rank}(AB) \le \min\{\operatorname{rank}(A), \operatorname{rank}(B)\}$？这一不等式看似简洁，却常引发初学者困惑：例如，当 $A \in \mathbb{R}^{m\times n}$、$B \in \mathbb{R}^{n\times p}$ 时，为何 $AB$ 的列空间维数（即 $\operatorname{rank}(AB)$）既不能超过 $A$ 的列秩，也不能超过 $B$ 的行秩？直观上，$AB$ 的每一列都是 $A$ 的列向量的线性组合（组合系数来自 $B$ 的对应列），故 $\operatorname{col}(AB) \subseteq \operatorname{col}(A)$，从而 $\operatorname{rank}(AB) \le \operatorname{rank}(A)$；同理，$AB$ 的每一行是 $B$ 的行向量的线性组合，故 $\operatorname{row}(AB) \subseteq \operatorname{row}(B)$，得 $\operatorname{rank}(AB) \le \operatorname{rank}(B)$。但如何严格从子空间包含、线性映射像空间维度或SVD视角统一解释该不等式的本质？是否存在等号成立的充要条件？这些正是理解矩阵秩行为的关键所在。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

舜祎魂 2026-02-03 11:20

关注

```html

一、直观几何视角：列空间与行空间的嵌套关系

设 $A \in \mathbb{R}^{m\times n}$，$B \in \mathbb{R}^{n\times p}$。矩阵乘积 $AB$ 的第 $j$ 列为 $A\mathbf{b}_j$（其中 $\mathbf{b}_j$ 是 $B$ 的第 $j$ 列），故 $\operatorname{col}(AB) = \operatorname{span}\{A\mathbf{b}_1, \dots, A\mathbf{b}_p\} \subseteq \operatorname{col}(A)$。同理，$(AB)^\top = B^\top A^\top$，其列空间即 $AB$ 的行空间，满足 $\operatorname{row}(AB) \subseteq \operatorname{row}(B)$。由子空间维数不等式 $\dim(U) \le \dim(V)$ 当 $U \subseteq V$，立即得：

$\operatorname{rank}(AB) = \dim \operatorname{col}(AB) \le \dim \operatorname{col}(A) = \operatorname{rank}(A)$
$\operatorname{rank}(AB) = \dim \operatorname{row}(AB) \le \dim \operatorname{row}(B) = \operatorname{rank}(B)$

二、线性映射视角：复合变换的像空间压缩

将矩阵视为线性映射：$B: \mathbb{R}^p \to \mathbb{R}^n$，$A: \mathbb{R}^n \to \mathbb{R}^m$，则 $AB: \mathbb{R}^p \to \mathbb{R}^m$ 是复合映射。由像空间性质：

$\operatorname{Im}(AB) = A(\operatorname{Im}(B)) \subseteq A(\mathbb{R}^n) = \operatorname{Im}(A)$

因此 $\dim \operatorname{Im}(AB) \le \min\left\{ \dim \operatorname{Im}(A),\; \dim \operatorname{Im}(B) \right\}$。该视角揭示本质：秩下降源于“中间域” $\mathbb{R}^n$ 的维度瓶颈与映射非满射性。

三、SVD统一解释：奇异值的零化机制

设 $B = U_B \Sigma_B V_B^\top$，$A = U_A \Sigma_A V_A^\top$，则 $AB = U_A \Sigma_A (V_A^\top U_B) \Sigma_B V_B^\top$。关键观察：$AB$ 的非零奇异值个数 ≤ 非零 $\Sigma_A$ 个数（即 $\operatorname{rank}(A)$）且 ≤ 非零 $\Sigma_B$ 个数（即 $\operatorname{rank}(B)$），因为左/右乘可逆矩阵不改变秩，而中间矩阵 $V_A^\top U_B$ 可能引入额外零化——即 $\Sigma_A (V_A^\top U_B) \Sigma_B$ 中奇异值被“截断”或“抵消”。

四、等号成立的充要条件

以下三组条件等价（经典结论，见Horn & Johnson）：

条件类型	数学表述
列满秩+行满秩	$\operatorname{rank}(AB) = \operatorname{rank}(B) \iff \operatorname{null}(A) \cap \operatorname{col}(B) = \{0\}$
行满秩+列满秩	$\operatorname{rank}(AB) = \operatorname{rank}(A) \iff \operatorname{row}(A) \cap \operatorname{null}(B) = \{0\}$
同时取等	$\operatorname{rank}(AB) = \min\{\operatorname{rank}(A), \operatorname{rank}(B)\} \iff$ 上述两交集均为零子空间

五、工程实践启示与反例验证

在深度学习中，权重矩阵连乘（如ResNet残差分支）若任一中间层秩亏（如因过正则化或低秩初始化），则整体表达能力受限；在推荐系统中，$U \in \mathbb{R}^{m\times k}, V \in \mathbb{R}^{k\times n}$ 的乘积 $UV^\top$ 天然满足 $\operatorname{rank}(UV^\top) \le k$ —— 这正是矩阵分解降维的理论根基。

反例：令 $A = \begin{bmatrix}1 & 0 \\ 0 & 0\end{bmatrix},\; B = \begin{bmatrix}0 & 0 \\ 1 & 0\end{bmatrix}$，则 $\operatorname{rank}(A)=\operatorname{rank}(B)=1$，但 $AB = \mathbf{0}$，故 $\operatorname{rank}(AB)=0 < \min\{1,1\}$。

六、算法级验证：数值秩计算流程图

flowchart TD A[输入 A∈ℝ^{m×n}, B∈ℝ^{n×p}] --> B[计算 AB] B --> C[对 AB 进行 SVD: AB = UΣVᵀ] C --> D[统计 Σ 中 > ε 的奇异值个数] D --> E[输出 rank_AB] A --> F[分别对 A, B 做 SVD] F --> G[提取 rank_A, rank_B] G --> H[验证 rank_AB ≤ min(rank_A, rank_B)]

七、高阶推广：多矩阵乘积与张量秩类比

对 $A_1 A_2 \cdots A_k$，有 $\operatorname{rank}(A_1\cdots A_k) \le \min_i \operatorname{rank}(A_i)$。该性质在张量网络（如MPS/TN）中推广为“边秩约束”：任意收缩操作不增加超边的秩上界。这为大模型参数压缩（如LLM中的QKV低秩近似）提供理论安全边界。

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

秩(AB)≤min{秩(A), 秩(B)}
2023-11-09 10:08

数学分溪的博客
什么是矩阵的秩，矩阵的秩如何计算？
2024-11-01 10:08

爱代码的小黄人的博客矩阵的（Rank）是指矩阵中线性无关的行向量（或列向量）的最大数量，简单来说，矩阵的秩表示的是矩阵中可以生成整个矩阵的最小行或列的数目。
矩阵的秩（Rank）
2020-11-24 16:58

努力的老周的博客定义一个矩阵 A 的列秩是 A 的线性无关的纵列的极大数目。类似地，行秩是 A 的线性无关的横行的极大数目。...m × n 矩阵的秩不大于m且不大于n的一个非负整数，表示为 rk(A) ≤ min(m, n)。有尽可能大的秩的.
3.2 矩阵乘积的秩
2020-03-24 17:42

jhshanvip的博客矩阵乘积 ABABAB 的秩和矩阵 A,BA,BA,B 的秩有什么关系呢？首先直观上说明。线性映射 Ax=yA\mathbf{x}=\mathbf{y}Ax=y ，当矩阵 AAA 是列满秩矩阵时，即无关组时，映射是单射，所以定义域内一个向量 x\mathbf{x}x ...
为什么两个矩阵相乘,秩没有变大,相加秩会变大
2025-03-03 07:26

AI Agent首席体验官的博客由于乘法是通过一个矩阵的列与另一个矩阵的行的线性组合，这个过程不会创造出新的线性无关向量，而只能保持或减少线性无关向量的数量。形象地说，乘法是一种"过滤"或"压缩"操作。：加法则是将两个向量空间合并，这...
矩阵的秩 rank(A)
2020-05-09 14:06

一抹烟霞的博客矩阵的秩一、定义二、定理一、定义在线性代数中，一个矩阵A的列秩是A的线性独立的纵列的极大数目。类似地，行秩是A的线性无关的横行的极大数目。...定理：矩阵的乘积的秩rank(ab)<=min{rank(a),rank(b)}; ...
两个矩阵相乘的结果（乘积矩阵）可以分解成若干个秩 1 矩阵的和
2025-10-17 09:43

二分掌柜的的博客为什么两个矩阵相乘的结果（乘积矩阵）可以分解成若干个秩 1 矩阵的和设矩阵 A A A 是 m × n m \times n m×n 矩阵，矩阵 B B B 是 n × p n \times p n×p 矩阵，则它们的乘积 A B AB AB 可表示为 n n n 个秩1...
为什么神经网络的权重矩阵具有低秩特性？如何理解和解释？
2025-08-12 10:59

文弱_书生的博客关于神经网络矩阵权重的低秩特性的理解分析和讲解，以及由此入手进行后续工作的启发
数学基础 -- 线性代数之矩阵的秩
2024-08-30 00:42

sz66cm的博客在一个矩阵中，行秩和列秩总是相等的，因此我们通常将矩阵的秩称为矩阵的秩，即行秩和列秩的共同值。一组向量v1v2vnv1v2vn是线性无关的，如果只有当所有系数c1c2cnc1c2cn都为零时，线性组合c1v1c2v2⋯...
数学：数学里面rank(A)是什么运算
2025-06-27 11:30

千码君2016的博客矩阵的秩（rank(A)）是线性代数的重要概念，表示矩阵行或列向量的最大线性无关组所含向量的个数。定义上，列秩和行秩相等，统称为秩。对于m×n矩阵A，秩不超过min(m,n)。计算秩可通过初等变换化为简化矩阵后统计非零...
[数学基础] 矩阵的秩及其应用
2025-07-08 22:15

极客不孤独的博客矩阵的秩是线性代数中的核心概念，定义为矩阵中线性无关行或列向量的最大数目。本文从数学定义、计算方法、物理意义和典型应用四个维度全面解析矩阵的秩。矩阵的秩不仅决定了线性方程组解的存在性和唯一性，还揭示了...
r语言rank降序_R&Python Data Science 系列：数据处理（3）
2021-01-06 08:29

会飞的黄油的博客 % summarise_all(list(min, max))</code></pre><img src="https://i-blog.csdnimg.cn/blog_migrate/fe34f90af22f7e1b883a9b4af7560f69.png" alt="e82eb97bf9dfd1306dce31456e639ab2.png" />...
低秩分解（Low-Rank Decomposition）
2025-04-15 10:56

frostmelody的博客低秩分解技术旨在将高维矩阵或张量近似分解为低秩因子的乘积，从而达到降维、压缩和提取数据主要信息的目的。该方法在深度学习模型压缩、推荐系统、自然语言处理和图像处理等领域具有广泛应用。
r语言rank降序_R&Python Data Science 系列：数据处理(3)
2021-01-06 08:29

weixin_39667652的博客承接上面内容，本部分将剩余函数介绍完整。R&Python Data Science 系列：数据处理(1)R&...1.1 arrange函数排序函数，按照某(几)个指定的列按照升(降)序排列重新排列数据集，参数ascending = False，降序排列，a...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月3日

矩阵乘积的秩为何满足 rank(AB) ≤ min{rank(A), rank(B)}？

1条回答 默认 最新