逆矩阵、克拉默法则与线性向量空间
课程视频
背景介绍
你已经知道如何通过代入法或消元法解二元一次方程组。但如果有五个方程五个未知数——甚至一百个呢?矩阵为我们提供了系统化的处理方法,而逆矩阵就是那把一步到位解出答案的钥匙:\(\mathbf{x} = M^{-1}\mathbf{f}\)。
本课我们将之前几节课的多条线索汇总在一起。首先,我们完成克拉默法则的证明,展示分子为何恰好是替换了一列后的行列式。然后我们证明一个微妙但重要的事实:如果 \(M^{-1}M = I\),那么 \(M M^{-1} = I\) 也成立——逆矩阵从两边都有效。最后,我们进入新的领域:线性向量空间。我们给出严格定义,探索二维和三维中的例子,并认识矩阵的核——一个将方程的解与空间几何联系起来的概念。
- 克拉默法则(分子):解的第 \(i\) 个分量为 \(x_i = \frac{\det(M_i)}{\det(M)}\),其中 \(M_i\) 是将 \(M\) 的第 \(i\) 列替换为常数向量 \(\mathbf{f}\) 后得到的矩阵。
- 逆的交换性:如果 \(M^{-1}M = I\),那么 \(MM^{-1} = I\) 也成立——利用 \(M\) 的非零行列式来证明。
- 线性向量空间:集合 \(V\) 是线性向量空间,如果它对线性组合封闭:对于任意 \(\mathbf{v}_1, \mathbf{v}_2 \in V\) 和标量 \(\alpha, \beta\),都有 \(\alpha \mathbf{v}_1 + \beta \mathbf{v}_2 \in V\)。
- 核:\(\ker(M) = \{\mathbf{x} : M\mathbf{x} = \mathbf{0}\}\) 总是一个线性向量空间。
- 值域:\(\text{range}(M) = \{\mathbf{w} : \mathbf{w} = M\mathbf{u} \text{ 对某个 } \mathbf{u}\}\) 也是一个线性向量空间(作为课后习题证明)。
完成克拉默法则:分子从何而来
回顾设置。我们有方程组 \(M\mathbf{x} = \mathbf{f}\),其中:
\[M = \begin{pmatrix} m_{11} & m_{12} & \cdots & m_{1n} \\ m_{21} & m_{22} & \cdots & m_{2n} \\ \vdots & & \ddots & \vdots \\ m_{n1} & m_{n2} & \cdots & m_{nn} \end{pmatrix}, \quad \mathbf{f} = \begin{pmatrix} f_1 \\ f_2 \\ \vdots \\ f_n \end{pmatrix}\]
解为 \(\mathbf{x} = M^{-1}\mathbf{f}\),其中逆矩阵由余子式构建:
\[(M^{-1})_{ij} = \frac{(-1)^{i+j} \, \mathcal{M}_{ji}}{\det(M)}\]
这里 \(\mathcal{M}_{ji}\) 是余子式(删除第 \(j\) 行第 \(i\) 列后得到的子矩阵的行列式)。
展开计算 \(x_1\)
要求 \(x_1\),将 \(M^{-1}\) 的第一行乘以 \(\mathbf{f}\):
\[x_1 = \frac{1}{\det(M)}\bigl(\mathcal{M}_{11}\,f_1 - \mathcal{M}_{21}\,f_2 + \mathcal{M}_{31}\,f_3 - \cdots + (-1)^{n+1}\mathcal{M}_{n1}\,f_n\bigr)\]
看括号中的表达式。每个 \(\mathcal{M}_{k1}\) 是原矩阵第 \(k\) 行第 \(1\) 列对应元素的余子式。但我们不是用 \(m_{k1}\)(原来第一列的元素)乘以每个余子式,而是用 \(f_k\) 来乘。
这恰好是沿第一列展开一个修改后的矩阵——即将 \(M\) 的第一列替换为 \(\mathbf{f}\) 的矩阵——的余子式展开:
\[M_1 = \begin{pmatrix} f_1 & m_{12} & \cdots & m_{1n} \\ f_2 & m_{22} & \cdots & m_{2n} \\ \vdots & & \ddots & \vdots \\ f_n & m_{n2} & \cdots & m_{nn} \end{pmatrix}\]
余子式 \(\mathcal{M}_{k1}\) 保持不变,因为它们来自删除第 \(k\) 行和第 \(1\) 列——而我们只改变了第 \(1\) 列。所以分子就是 \(\det(M_1)\),由此我们得到:
\[\boxed{x_i = \frac{\det(M_i)}{\det(M)}}\]
其中 \(M_i\) 是将 \(M\) 的第 \(i\) 列替换为 \(\mathbf{f}\) 后的矩阵。这就是克拉默法则。
解 \(\begin{cases} 3x + 2y = 7 \\ x - y = 1 \end{cases}\)
这里 \(M = \begin{pmatrix} 3 & 2 \\ 1 & -1 \end{pmatrix}\),\(\mathbf{f} = \begin{pmatrix} 7 \\ 1 \end{pmatrix}\)。
\[\det(M) = 3(-1) - 2(1) = -5\]
\[x = \frac{\det\begin{pmatrix} 7 & 2 \\ 1 & -1 \end{pmatrix}}{\det(M)} = \frac{7(-1) - 2(1)}{-5} = \frac{-9}{-5} = \frac{9}{5}\]
\[y = \frac{\det\begin{pmatrix} 3 & 7 \\ 1 & 1 \end{pmatrix}}{\det(M)} = \frac{3(1) - 7(1)}{-5} = \frac{-4}{-5} = \frac{4}{5}\]
验证:\(3(9/5) + 2(4/5) = 27/5 + 8/5 = 35/5 = 7\),\(9/5 - 4/5 = 5/5 = 1\)。
证明 \(M^{-1}M = I \implies MM^{-1} = I\)
矩阵乘法一般不满足交换律:\(AB \neq BA\)。因此,如果 \(M^{-1}M = I\)(左逆),\(MM^{-1} = I\)(右逆)并不显然成立。以下是课堂上推导出的优雅证明。
设置
已知 \(M^{-1}M = I\)。定义未知矩阵:
\[X = MM^{-1}\]
我们要证明 \(X = I\)。
第一步:发现 \(X\) 的性质
将 \(X\) 右乘 \(M\):
\[XM = (MM^{-1})M = M(M^{-1}M) = MI = M\]
这里用了矩阵乘法的结合律。因此我们知道:
\[XM = M\]
改写为:
\[(X - I)M = 0\]
第二步:为什么 \((X - I)\) 必须是零矩阵
方程 \((X - I)M = 0\) 表示矩阵 \((X - I)\) 将 \(M\) 的每一列都映射为零向量。令 \(\mathbf{c}_1, \mathbf{c}_2, \ldots, \mathbf{c}_n\) 为 \(M\) 的列:
\[(X - I)\mathbf{c}_j = \mathbf{0} \quad \text{对 } j = 1, 2, \ldots, n\]
由于 \(\det(M) \neq 0\),\(M\) 的列是线性无关的——它们张成整个 \(n\) 维空间。任何向量 \(\mathbf{v}\) 都可以写成线性组合 \(\mathbf{v} = \alpha_1 \mathbf{c}_1 + \cdots + \alpha_n \mathbf{c}_n\)。
由线性性:
\[(X - I)\mathbf{v} = \alpha_1 (X - I)\mathbf{c}_1 + \cdots + \alpha_n (X - I)\mathbf{c}_n = \alpha_1 \mathbf{0} + \cdots + \alpha_n \mathbf{0} = \mathbf{0}\]
既然 \((X - I)\mathbf{v} = \mathbf{0}\) 对所有向量 \(\mathbf{v}\) 成立,矩阵 \(X - I\) 必须是零矩阵。
Lucas 的方法(用 \(I\) 测试): 选取 \(\mathbf{v}\) 为各个标准基向量 \(\mathbf{e}_1 = (1,0,\ldots,0)^T\),\(\mathbf{e}_2 = (0,1,\ldots,0)^T\) 等。则 \((X - I)\mathbf{e}_j\) 提取出 \(X - I\) 的第 \(j\) 列,该列必须为零。所有 \(n\) 列都为零,因此 \(X - I = 0\)。
Toby 的方法(反证法): 假设某个元素 \((X - I)_{ij} \neq 0\)。选取 \(\mathbf{v} = \mathbf{e}_j\)(在第 \(j\) 个位置为 \(1\)、其余为零的向量)。则 \((X - I)\mathbf{e}_j\) 在第 \(i\) 行有非零元素——与 \((X - I)\mathbf{v} = \mathbf{0}\) 矛盾。
两种方法都关键地使用了 \(\det(M) \neq 0\) 这一事实,它保证 \(M\) 的列张成 \(\mathbb{R}^n\)。
\[\boxed{X - I = 0 \implies MM^{-1} = I}\]
线性向量空间
线性向量空间 \(V_n\) 是一个对线性组合封闭的向量集合:
\[\text{对所有 } \mathbf{v}_1, \mathbf{v}_2 \in V_n \text{ 和所有标量 } \alpha, \beta \in \mathbb{R}: \quad \alpha\mathbf{v}_1 + \beta\mathbf{v}_2 \in V_n\]
这一个条件自动保证了:
- 缩放:令 \(\beta = 0\),得 \(\alpha\mathbf{v}_1 \in V_n\)
- 零向量:令 \(\alpha = \beta = 0\),得 \(\mathbf{0} \in V_n\)
- 加法:令 \(\alpha = \beta = 1\),得 \(\mathbf{v}_1 + \mathbf{v}_2 \in V_n\)
例子与反例
不是。 取该直线上的两个向量:\(\mathbf{v}_1 = (2, 0)\) 和 \(\mathbf{v}_2 = (2, 5)\)。将 \(\mathbf{v}_1\) 乘以 \(3\):得到 \((6, 0)\),其中 \(x = 6 \neq 2\)——它离开了这条直线。
此外,零向量 \((0, 0)\) 的 \(x = 0 \neq 2\),因此它不在该集合中。一条直线必须过原点才能成为向量空间。
是的。 平面上的任意两个向量都可以相加(平行四边形法则)和缩放,结果仍然在平面内。该平面是一个二维线性向量空间,尽管它位于三维空间中。
不过原点的平面则不行:它不包含 \(\mathbf{0}\)。
线性向量空间的层级
| 维度 | 描述 | 元素个数 |
|---|---|---|
| \(0\) | 仅包含零向量 \(\{\mathbf{0}\}\) | \(1\) |
| \(1\) | 过原点的直线 | \(\infty\) |
| \(2\) | 过原点的平面 | \(\infty\) |
| \(n\) | 完整的 \(n\) 维空间 \(\mathbb{R}^n\) | \(\infty\) |
最小的线性向量空间只有一个元素:\(\{\mathbf{0}\}\)。其他所有线性向量空间都有无穷多个元素。
仿射坐标与非正交基
如果两个向量 \(\mathbf{c}_1\) 和 \(\mathbf{c}_2\) 线性无关(不平行),它们张成整个二维平面。平面上的任何向量 \(\mathbf{v}\) 都可以分解为:
\[\mathbf{v} = \alpha \mathbf{c}_1 + \beta \mathbf{c}_2\]
系数 \((\alpha, \beta)\) 就是 \(\mathbf{v}\) 相对于基 \(\{\mathbf{c}_1, \mathbf{c}_2\}\) 的仿射坐标。网格线形成平行四边形网格而非矩形网格,但每个点仍然被唯一确定。
矩阵的核
定义。 矩阵 \(M\) 的核(或零空间)是所有被 \(M\) 映射为零的向量的集合:
\[\ker(M) = \{\mathbf{x} \in \mathbb{R}^n : M\mathbf{x} = \mathbf{0}\}\]
设 \(\mathbf{x}_1, \mathbf{x}_2 \in \ker(M)\),即 \(M\mathbf{x}_1 = \mathbf{0}\) 且 \(M\mathbf{x}_2 = \mathbf{0}\)。
对于任意标量 \(\alpha, \beta\):
\[M(\alpha\mathbf{x}_1 + \beta\mathbf{x}_2) = \alpha M\mathbf{x}_1 + \beta M\mathbf{x}_2 = \alpha\mathbf{0} + \beta\mathbf{0} = \mathbf{0}\]
因此 \(\alpha\mathbf{x}_1 + \beta\mathbf{x}_2 \in \ker(M)\)。
关键步骤使用了矩阵乘法的线性性:\(M(\alpha\mathbf{u} + \beta\mathbf{v}) = \alpha M\mathbf{u} + \beta M\mathbf{v}\)。
核的两种情况
| 条件 | 核 |
|---|---|
| \(\det(M) \neq 0\)(可逆) | \(\ker(M) = \{\mathbf{0}\}\)——仅有平凡解,零维空间 |
| \(\det(M) = 0\)(奇异) | \(\ker(M)\) 包含非平凡解——维度 \(\geq 1\) |
当 \(\det(M) = 0\) 时,\(M\) 的列线性相关,存在一整个子空间的向量被 \(M\) 压缩为零。
矩阵的值域(课后习题)
定义。 \(M\) 的值域(或列空间)是所有可以表示为 \(M\mathbf{u}\)(对某个 \(\mathbf{u}\))的向量的集合:
\[\text{range}(M) = \{\mathbf{w} : \mathbf{w} = M\mathbf{u} \text{ 对某个 } \mathbf{u} \in \mathbb{R}^n\}\]
证明 \(\text{range}(M)\) 是一个线性向量空间。提示:采用与核的证明相同的方法。取值域中的两个向量 \(\mathbf{w}_1 = M\mathbf{u}_1\) 和 \(\mathbf{w}_2 = M\mathbf{u}_2\),证明 \(\alpha\mathbf{w}_1 + \beta\mathbf{w}_2\) 也在值域中。
课程关键帧

速查表
| 概念 | 公式 / 规则 |
|---|---|
| 克拉默法则 | \(x_i = \dfrac{\det(M_i)}{\det(M)}\),其中 \(M_i\) 的第 \(i\) 列被替换为 \(\mathbf{f}\) |
| 逆矩阵 | \((M^{-1})_{ij} = \dfrac{(-1)^{i+j}\,\mathcal{M}_{ji}}{\det(M)}\)(余子式,转置) |
| 逆的交换性 | \(M^{-1}M = I \iff MM^{-1} = I\)(要求 \(\det(M) \neq 0\)) |
| 线性向量空间 | 对 \(\alpha\mathbf{v}_1 + \beta\mathbf{v}_2\) 封闭,对所有标量 \(\alpha, \beta\) |
| 必须包含 \(\mathbf{0}\) | 在封闭条件中令 \(\alpha = \beta = 0\) |
| 核 | \(\ker(M) = \{\mathbf{x} : M\mathbf{x} = \mathbf{0}\}\)——总是一个线性向量空间 |
| 值域 | \(\text{range}(M) = \{M\mathbf{u} : \mathbf{u} \in \mathbb{R}^n\}\)——总是一个线性向量空间 |
| 线性无关 | \(\det(M) \neq 0 \iff\) \(M\) 的列张成整个 \(\mathbb{R}^n\) |
| 仿射坐标 | 当 \(\mathbf{c}_1, \mathbf{c}_2\) 线性无关时,任意 \(\mathbf{v} = \alpha\mathbf{c}_1 + \beta\mathbf{c}_2\) |
| 最小向量空间 | \(\{\mathbf{0}\}\)(零维,一个元素) |
快速参考:可逆矩阵的关键性质
| 性质 | 推论 |
|---|---|
| \(\det(M) \neq 0\) | \(M\) 可逆 |
| \(M^{-1}\) 存在 | \(M\mathbf{x} = \mathbf{f}\) 有唯一解 \(\mathbf{x} = M^{-1}\mathbf{f}\) |
| 列线性无关 | 它们张成 \(\mathbb{R}^n\) 并构成一组基 |
| \(\ker(M) = \{\mathbf{0}\}\) | \(M\mathbf{x} = \mathbf{0}\) 只有平凡解 |
| \(\det(AB) = \det(A)\det(B)\) | 乘积的行列式等于行列式的乘积 |