逆矩阵、克拉默法则与线性向量空间

Published

March 7, 2026

课程视频

背景介绍

你已经知道如何通过代入法或消元法解二元一次方程组。但如果有个方程五个未知数——甚至一百个呢?矩阵为我们提供了系统化的处理方法,而逆矩阵就是那把一步到位解出答案的钥匙:\(\mathbf{x} = M^{-1}\mathbf{f}\)

本课我们将之前几节课的多条线索汇总在一起。首先,我们完成克拉默法则的证明,展示分子为何恰好是替换了一列后的行列式。然后我们证明一个微妙但重要的事实:如果 \(M^{-1}M = I\),那么 \(M M^{-1} = I\) 也成立——逆矩阵从两边都有效。最后,我们进入新的领域:线性向量空间。我们给出严格定义,探索二维和三维中的例子,并认识矩阵的——一个将方程的解与空间几何联系起来的概念。

Important核心要点
  1. 克拉默法则(分子):解的第 \(i\) 个分量为 \(x_i = \frac{\det(M_i)}{\det(M)}\),其中 \(M_i\) 是将 \(M\) 的第 \(i\) 列替换为常数向量 \(\mathbf{f}\) 后得到的矩阵。
  2. 逆的交换性:如果 \(M^{-1}M = I\),那么 \(MM^{-1} = I\) 也成立——利用 \(M\) 的非零行列式来证明。
  3. 线性向量空间:集合 \(V\) 是线性向量空间,如果它对线性组合封闭:对于任意 \(\mathbf{v}_1, \mathbf{v}_2 \in V\) 和标量 \(\alpha, \beta\),都有 \(\alpha \mathbf{v}_1 + \beta \mathbf{v}_2 \in V\)
  4. \(\ker(M) = \{\mathbf{x} : M\mathbf{x} = \mathbf{0}\}\) 总是一个线性向量空间。
  5. 值域\(\text{range}(M) = \{\mathbf{w} : \mathbf{w} = M\mathbf{u} \text{ 对某个 } \mathbf{u}\}\) 也是一个线性向量空间(作为课后习题证明)。

完成克拉默法则:分子从何而来

回顾设置。我们有方程组 \(M\mathbf{x} = \mathbf{f}\),其中:

\[M = \begin{pmatrix} m_{11} & m_{12} & \cdots & m_{1n} \\ m_{21} & m_{22} & \cdots & m_{2n} \\ \vdots & & \ddots & \vdots \\ m_{n1} & m_{n2} & \cdots & m_{nn} \end{pmatrix}, \quad \mathbf{f} = \begin{pmatrix} f_1 \\ f_2 \\ \vdots \\ f_n \end{pmatrix}\]

解为 \(\mathbf{x} = M^{-1}\mathbf{f}\),其中逆矩阵由余子式构建:

\[(M^{-1})_{ij} = \frac{(-1)^{i+j} \, \mathcal{M}_{ji}}{\det(M)}\]

这里 \(\mathcal{M}_{ji}\) 是余子式(删除第 \(j\) 行第 \(i\) 列后得到的子矩阵的行列式)。

展开计算 \(x_1\)

要求 \(x_1\),将 \(M^{-1}\) 的第一行乘以 \(\mathbf{f}\)

\[x_1 = \frac{1}{\det(M)}\bigl(\mathcal{M}_{11}\,f_1 - \mathcal{M}_{21}\,f_2 + \mathcal{M}_{31}\,f_3 - \cdots + (-1)^{n+1}\mathcal{M}_{n1}\,f_n\bigr)\]

看括号中的表达式。每个 \(\mathcal{M}_{k1}\) 是原矩阵第 \(k\) 行第 \(1\) 列对应元素的余子式。但我们不是用 \(m_{k1}\)(原来第一列的元素)乘以每个余子式,而是用 \(f_k\) 来乘。

这恰好是沿第一列展开一个修改后的矩阵——即将 \(M\) 的第一列替换为 \(\mathbf{f}\) 的矩阵——的余子式展开

\[M_1 = \begin{pmatrix} f_1 & m_{12} & \cdots & m_{1n} \\ f_2 & m_{22} & \cdots & m_{2n} \\ \vdots & & \ddots & \vdots \\ f_n & m_{n2} & \cdots & m_{nn} \end{pmatrix}\]

余子式 \(\mathcal{M}_{k1}\) 保持不变,因为它们来自删除第 \(k\) 行和第 \(1\) 列——而我们只改变了第 \(1\) 列。所以分子就是 \(\det(M_1)\),由此我们得到:

\[\boxed{x_i = \frac{\det(M_i)}{\det(M)}}\]

其中 \(M_i\) 是将 \(M\) 的第 \(i\) 列替换为 \(\mathbf{f}\) 后的矩阵。这就是克拉默法则

\(\begin{cases} 3x + 2y = 7 \\ x - y = 1 \end{cases}\)

这里 \(M = \begin{pmatrix} 3 & 2 \\ 1 & -1 \end{pmatrix}\)\(\mathbf{f} = \begin{pmatrix} 7 \\ 1 \end{pmatrix}\)

\[\det(M) = 3(-1) - 2(1) = -5\]

\[x = \frac{\det\begin{pmatrix} 7 & 2 \\ 1 & -1 \end{pmatrix}}{\det(M)} = \frac{7(-1) - 2(1)}{-5} = \frac{-9}{-5} = \frac{9}{5}\]

\[y = \frac{\det\begin{pmatrix} 3 & 7 \\ 1 & 1 \end{pmatrix}}{\det(M)} = \frac{3(1) - 7(1)}{-5} = \frac{-4}{-5} = \frac{4}{5}\]

验证:\(3(9/5) + 2(4/5) = 27/5 + 8/5 = 35/5 = 7\)\(9/5 - 4/5 = 5/5 = 1\)

证明 \(M^{-1}M = I \implies MM^{-1} = I\)

矩阵乘法一般满足交换律:\(AB \neq BA\)。因此,如果 \(M^{-1}M = I\)(左逆),\(MM^{-1} = I\)(右逆)并不显然成立。以下是课堂上推导出的优雅证明。

设置

已知 \(M^{-1}M = I\)。定义未知矩阵:

\[X = MM^{-1}\]

我们要证明 \(X = I\)

第一步:发现 \(X\) 的性质

\(X\) 右乘 \(M\)

\[XM = (MM^{-1})M = M(M^{-1}M) = MI = M\]

这里用了矩阵乘法的结合律。因此我们知道:

\[XM = M\]

改写为:

\[(X - I)M = 0\]

第二步:为什么 \((X - I)\) 必须是零矩阵

方程 \((X - I)M = 0\) 表示矩阵 \((X - I)\)\(M\) 的每一列都映射为零向量。令 \(\mathbf{c}_1, \mathbf{c}_2, \ldots, \mathbf{c}_n\)\(M\) 的列:

\[(X - I)\mathbf{c}_j = \mathbf{0} \quad \text{对 } j = 1, 2, \ldots, n\]

由于 \(\det(M) \neq 0\)\(M\) 的列是线性无关的——它们张成整个 \(n\) 维空间。任何向量 \(\mathbf{v}\) 都可以写成线性组合 \(\mathbf{v} = \alpha_1 \mathbf{c}_1 + \cdots + \alpha_n \mathbf{c}_n\)

由线性性:

\[(X - I)\mathbf{v} = \alpha_1 (X - I)\mathbf{c}_1 + \cdots + \alpha_n (X - I)\mathbf{c}_n = \alpha_1 \mathbf{0} + \cdots + \alpha_n \mathbf{0} = \mathbf{0}\]

既然 \((X - I)\mathbf{v} = \mathbf{0}\)所有向量 \(\mathbf{v}\) 成立,矩阵 \(X - I\) 必须是零矩阵。

Lucas 的方法(用 \(I\) 测试): 选取 \(\mathbf{v}\) 为各个标准基向量 \(\mathbf{e}_1 = (1,0,\ldots,0)^T\)\(\mathbf{e}_2 = (0,1,\ldots,0)^T\) 等。则 \((X - I)\mathbf{e}_j\) 提取出 \(X - I\) 的第 \(j\) 列,该列必须为零。所有 \(n\) 列都为零,因此 \(X - I = 0\)

Toby 的方法(反证法): 假设某个元素 \((X - I)_{ij} \neq 0\)。选取 \(\mathbf{v} = \mathbf{e}_j\)(在第 \(j\) 个位置为 \(1\)、其余为零的向量)。则 \((X - I)\mathbf{e}_j\) 在第 \(i\) 行有非零元素——与 \((X - I)\mathbf{v} = \mathbf{0}\) 矛盾。

两种方法都关键地使用了 \(\det(M) \neq 0\) 这一事实,它保证 \(M\) 的列张成 \(\mathbb{R}^n\)

\[\boxed{X - I = 0 \implies MM^{-1} = I}\]

线性向量空间

线性向量空间 \(V_n\) 是一个对线性组合封闭的向量集合:

\[\text{对所有 } \mathbf{v}_1, \mathbf{v}_2 \in V_n \text{ 和所有标量 } \alpha, \beta \in \mathbb{R}: \quad \alpha\mathbf{v}_1 + \beta\mathbf{v}_2 \in V_n\]

这一个条件自动保证了:

  • 缩放:令 \(\beta = 0\),得 \(\alpha\mathbf{v}_1 \in V_n\)
  • 零向量:令 \(\alpha = \beta = 0\),得 \(\mathbf{0} \in V_n\)
  • 加法:令 \(\alpha = \beta = 1\),得 \(\mathbf{v}_1 + \mathbf{v}_2 \in V_n\)

例子与反例

不是。 取该直线上的两个向量:\(\mathbf{v}_1 = (2, 0)\)\(\mathbf{v}_2 = (2, 5)\)。将 \(\mathbf{v}_1\) 乘以 \(3\):得到 \((6, 0)\),其中 \(x = 6 \neq 2\)——它离开了这条直线。

此外,零向量 \((0, 0)\)\(x = 0 \neq 2\),因此它不在该集合中。一条直线必须过原点才能成为向量空间。

是的。 平面上的任意两个向量都可以相加(平行四边形法则)和缩放,结果仍然在平面内。该平面是一个二维线性向量空间,尽管它位于三维空间中。

不过原点的平面则不行:它不包含 \(\mathbf{0}\)

线性向量空间的层级

维度 描述 元素个数
\(0\) 仅包含零向量 \(\{\mathbf{0}\}\) \(1\)
\(1\) 过原点的直线 \(\infty\)
\(2\) 过原点的平面 \(\infty\)
\(n\) 完整的 \(n\) 维空间 \(\mathbb{R}^n\) \(\infty\)

最小的线性向量空间只有一个元素:\(\{\mathbf{0}\}\)。其他所有线性向量空间都有无穷多个元素。

仿射坐标与非正交基

如果两个向量 \(\mathbf{c}_1\)\(\mathbf{c}_2\) 线性无关(不平行),它们张成整个二维平面。平面上的任何向量 \(\mathbf{v}\) 都可以分解为:

\[\mathbf{v} = \alpha \mathbf{c}_1 + \beta \mathbf{c}_2\]

系数 \((\alpha, \beta)\) 就是 \(\mathbf{v}\) 相对于基 \(\{\mathbf{c}_1, \mathbf{c}_2\}\)仿射坐标。网格线形成平行四边形网格而非矩形网格,但每个点仍然被唯一确定。

矩阵的核

定义。 矩阵 \(M\)(或零空间)是所有被 \(M\) 映射为零的向量的集合:

\[\ker(M) = \{\mathbf{x} \in \mathbb{R}^n : M\mathbf{x} = \mathbf{0}\}\]

\(\mathbf{x}_1, \mathbf{x}_2 \in \ker(M)\),即 \(M\mathbf{x}_1 = \mathbf{0}\)\(M\mathbf{x}_2 = \mathbf{0}\)

对于任意标量 \(\alpha, \beta\)

\[M(\alpha\mathbf{x}_1 + \beta\mathbf{x}_2) = \alpha M\mathbf{x}_1 + \beta M\mathbf{x}_2 = \alpha\mathbf{0} + \beta\mathbf{0} = \mathbf{0}\]

因此 \(\alpha\mathbf{x}_1 + \beta\mathbf{x}_2 \in \ker(M)\)

关键步骤使用了矩阵乘法的线性性\(M(\alpha\mathbf{u} + \beta\mathbf{v}) = \alpha M\mathbf{u} + \beta M\mathbf{v}\)

核的两种情况

条件
\(\det(M) \neq 0\)(可逆) \(\ker(M) = \{\mathbf{0}\}\)——仅有平凡解,零维空间
\(\det(M) = 0\)(奇异) \(\ker(M)\) 包含非平凡解——维度 \(\geq 1\)

\(\det(M) = 0\) 时,\(M\) 的列线性相关,存在一整个子空间的向量被 \(M\) 压缩为零。

矩阵的值域(课后习题)

定义。 \(M\)值域(或列空间)是所有可以表示为 \(M\mathbf{u}\)(对某个 \(\mathbf{u}\))的向量的集合:

\[\text{range}(M) = \{\mathbf{w} : \mathbf{w} = M\mathbf{u} \text{ 对某个 } \mathbf{u} \in \mathbb{R}^n\}\]

Warning课后习题

证明 \(\text{range}(M)\) 是一个线性向量空间。提示:采用与核的证明相同的方法。取值域中的两个向量 \(\mathbf{w}_1 = M\mathbf{u}_1\)\(\mathbf{w}_2 = M\mathbf{u}_2\),证明 \(\alpha\mathbf{w}_1 + \beta\mathbf{w}_2\) 也在值域中。

课程关键帧

速查表

概念 公式 / 规则
克拉默法则 \(x_i = \dfrac{\det(M_i)}{\det(M)}\),其中 \(M_i\) 的第 \(i\) 列被替换为 \(\mathbf{f}\)
逆矩阵 \((M^{-1})_{ij} = \dfrac{(-1)^{i+j}\,\mathcal{M}_{ji}}{\det(M)}\)(余子式,转置)
逆的交换性 \(M^{-1}M = I \iff MM^{-1} = I\)(要求 \(\det(M) \neq 0\)
线性向量空间 \(\alpha\mathbf{v}_1 + \beta\mathbf{v}_2\) 封闭,对所有标量 \(\alpha, \beta\)
必须包含 \(\mathbf{0}\) 在封闭条件中令 \(\alpha = \beta = 0\)
\(\ker(M) = \{\mathbf{x} : M\mathbf{x} = \mathbf{0}\}\)——总是一个线性向量空间
值域 \(\text{range}(M) = \{M\mathbf{u} : \mathbf{u} \in \mathbb{R}^n\}\)——总是一个线性向量空间
线性无关 \(\det(M) \neq 0 \iff\) \(M\) 的列张成整个 \(\mathbb{R}^n\)
仿射坐标 \(\mathbf{c}_1, \mathbf{c}_2\) 线性无关时,任意 \(\mathbf{v} = \alpha\mathbf{c}_1 + \beta\mathbf{c}_2\)
最小向量空间 \(\{\mathbf{0}\}\)(零维,一个元素)

快速参考:可逆矩阵的关键性质

性质 推论
\(\det(M) \neq 0\) \(M\) 可逆
\(M^{-1}\) 存在 \(M\mathbf{x} = \mathbf{f}\) 有唯一解 \(\mathbf{x} = M^{-1}\mathbf{f}\)
列线性无关 它们张成 \(\mathbb{R}^n\) 并构成一组基
\(\ker(M) = \{\mathbf{0}\}\) \(M\mathbf{x} = \mathbf{0}\) 只有平凡解
\(\det(AB) = \det(A)\det(B)\) 乘积的行列式等于行列式的乘积