第1章 线性方程组的解法
线性方程组的初等变换
多元线性方程组
- 例题:求$1^k+2^k+ \cdots +n^k$
- $n$元一次/线性方程组
- 解,解集
线性方程组的同解变形
- 三角形方程组:方便求解
- 方程组$U$的线性组合:$W$
- 方程组的初等变换:3种
- $U\to W$是同解变形
矩阵消元法
矩阵的初等行变换
- 矩阵、元素/分量,行矩阵/行向量,列矩阵/列向量,方阵,零矩阵,零向量
- 用矩阵$\mathbf{M}$表示线性方程组
- $\mathbf{A}$:系数矩阵
- $\mathbf{M}$:增广矩阵
- 方程的初等变换$\to$矩阵的初等行变换
- $n$阶方阵$\mathbf{A}$:主对角线、对角元,上三角形矩阵、下三角形矩阵、对角矩阵$diag(a_{11},\dots,a_{nn})$、单位矩阵$\mathbf{I}$
用矩阵的初等行变换解线性方程组
- 通解、特解
- 齐次线性方程组
- 常数项全为0,可直接用$\mathbf{A}$代替方程组
- 方程至少有零解/平凡解
线性方程组的系数范围,数域
- 数域
- 定义:复数集合的子集$F$,至少包含0和1,其中任意两个数的和差积商仍属于$F$
- 有理数集合、实数集合、复数集合都是数域
- 任何数域至少包含全体有理数
- 数域$F$上全体$m\times n$矩阵的集合:$F^{m\times n}$
- 数环
- 定义:复数集合的子集$D$对加减乘运算封闭,称$D$为数环
线性方程组解集合的初步讨论
线性方程组求解过程总结
- 阶梯形矩阵$\mathbf{T}$,最简阶梯形矩阵
- 化为阶梯形矩阵后:
- $r$:阶梯数;$n$:矩阵列数/未知数个数;$m$:方程数
- 一定有:$r\le m$
- $m<n\Rightarrow$无穷多解
- $m=n=r$(满秩)$\Rightarrow$无论常数项如何取值,方程组有唯一解
第2章 向量空间
第3章 行列式
第4章 矩阵的代数运算
第5章 矩阵的相合与相似
欧氏空间
最小二乘法
- 想要近似解方程组$\mathbf{AX=c}$
- 想象成几何问题:平面外一点到平面距离最小值
- 化为求解方程组$\mathbf{A^T AX=A^T c}$,3的唯一解是1的近似解
内积的推广
- $\mathbf{R}^n$上内积的定义
- 欧氏空间:定义了内积的实向量空间
- $(\mathbf{a},\mathbf{b})=\mathbf{a}^T\mathbf{b}$
- 内积的性质:双线性、对称性、正定性
- 垂直/正交
- 模,单位向量
- 最小二乘法的理论依据
- 方程3的解使得方程1在误差平方的意义下最优
- 齐次线性方程组$\mathbf{AX=0}$与$\mathbf{A}^T\mathbf{AX=0}$同解,$\mathbf{A}^T\mathbf{A}$与$\mathbf{A}$秩相等
- 方程3总是有解,且当$rank\mathbf{A}=n$时有唯一解
角度的计算公式
- $cos(\theta)=\frac{(\mathbf{a},\mathbf{b})}{|\mathbf{a}||\mathbf{b}|}$
- 柯西-施瓦茨不等式:$(\mathbf{a},\mathbf{b})^2\le|\mathbf{a}|^2|\mathbf{b}|^2$
- 余弦定理
- 三角形不等式
正交化
标准正交基
- 正交向量组、正交基,标准正交向量组(单位向量组成)、标准正交基
- 度量方阵/格拉姆方阵$\mathbf{G}$:以向量组$T$中两两向量的内积$(\mathbf{\alpha}_i,\mathbf{\alpha}_j)$为第$(i,j)$元组成的方阵
- 将向量组以列排成$\mathbf{A}$,则$\mathbf{G}=\mathbf{A}^T\mathbf{A}$
- 对称性
- 用$\mathbf{G}$计算内积
- $\mathbf{X^T GX}\ge 0$
- 正定、半正定、负定、半负定
- 设$\mathbf{S}$是$n$阶实对称方阵,若对任意$\mathbf{0}\neq\mathbf{X}\in\mathbf{R}^{n\times1}$有$\mathbf{X^T SX>0}$,则称$\mathbf{S}$是正定的
- 正交方阵:$\mathbf{A^T A=I}$
Gram-Schmidt正交化方法
一组基$\to$正交基$\to$标准正交基
对线性无关的$\mathbf{a_1,\cdots,a_k,a_{k+1}}$,将$\mathbf{a_{k+1}}$减去$\mathbf{a_1,\cdots,a_k}$适当的线性组合,可以得到与$\mathbf{a_1,\cdots,a_k}$都正交的向量$\mathbf{b_{k+1}}$
算法:逐次递进
矩阵的相合
- 定义:$\mathbf{A,B}$是$n$阶方阵,若存在可逆方阵$\mathbf{P}$使$\mathbf{B=P^T AP}$,则称$\mathbf{B}$与$\mathbf{A}$相合
- 应用(求向量组的标准正交基):利用相合,将原向量组$S$的格拉姆方阵$\mathbf{G=A^T A}$相合到$\mathbf{P^T GP=I}$,则$\mathbf{B=AP}$是标准正交向量组
- 相合的性质
- 自反性:$\mathbf{A}$与自身相合
- 对称性
- 传递性
二次型
二次型的配方
- 二次型:$n$元二次函数$Q(x_1,\dots,x_n)=\sum_{1\le i\le j\le n}a_{ij}x_ix_j$
- 标准型:设存在可逆方阵$\mathbf{P}$使$Q(\mathbf{X})=Q_1(\mathbf{Y})=d_1y_1^2+\cdots+d_ny_n^2$对$\mathbf{Y=PX}$成立,则称$Q_1(\mathbf{Y})$是$Q(\mathbf{X})$的标准型
- $Q(\mathbf{X})$的正定、半正定,负定、半负定
- 任意数域$F$上的二次型都能通过可逆线性变换变为标准型
用矩阵相合化简二次型
$Q(\mathbf{X})=\mathbf{XS^T X}$,求可逆方阵$\mathbf{K}$将$\mathbf{S}$相合到对角矩阵$\mathbf{D=K^T SK}$,则$Q(\mathbf{X})=Q_1(\mathbf{Y})=\mathbf{Y^T DY}$为标准形,其中$\mathbf{X=KY}$
实对称方阵相合标准形
实对称方阵相合标准形
- 西尔韦斯特惯性定律:任何一个实对称方阵$\mathbf{S}$都能相合到唯一的标准形:对角方阵,p个1,q个-1,n-p-q个0
- 正惯性系数p、负惯性系数q;$p+q=rank\mathbf{S}$,$p-q$称为符号差
- 实二次型$Q(\mathbf{X})=\mathbf{X^T SX}$可以通过可逆线性代换化为规范形:$Q_1(\mathbf{Y})=y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_{p+q}^2$
正定方阵的判定
- 实对称方阵$\mathbf{S>0}\Leftrightarrow \mathbf{S}$与$\mathbf{I}$相合
- 实对称方阵$\mathbf{S>0}\Rightarrow |\mathbf{S}|>0$
- 实对称方阵$\mathbf{S>0}\Rightarrow |\mathbf{S}_k|>0$,$|\mathbf{S}_k|$称为顺序主子式
- 实对称方阵$\mathbf{S>0}\Leftrightarrow \mathbf{S}$的全体顺序主子式$|\mathbf{S}_k|>0$
特征向量与相似矩阵
特征向量
变换$\sigma:\mathbf{X}\mapsto \mathbf{PX}$将某个方向上的非零向量拉伸/压缩到原来的实数倍
- 特征值、特征向量:$\mathbf{AX}=\lambda\mathbf{X}$
- 求法
- 求特征多项式$\varphi_{\mathbf{A}}(\lambda)=|\lambda\mathbf{I-A}|$,解方程$\varphi_{\mathbf{A}}(\lambda)=0$求出所有根,即为$\mathbf{A}$所有特征值
- 对每个特征值$\lambda_i$,解齐次线性方程组$(\mathbf{A}-\lambda_i\mathbf{I})\mathbf{X=0}$求出解空间$V_{\lambda_i}$的一组基,这组基的所有非零线性组合就是$\mathbf{A}$属于$\lambda_i$的全部特征向量
- 一些定义
- 特征方程:$\lambda\mathbf{I-A}$
- 特征多项式:$\varphi_{\mathbf{A}}(\lambda)=|\lambda\mathbf{I-A}|$
- 特征根:特征多项式的根
- 特征子空间:对每个特征值$\lambda_i$,齐次线性方程组$(\mathbf{A}-\lambda_I\mathbf{I})\mathbf{X=0}$的解空间$V_{\lambda_i}$
- 特征根的重数、特征值的重数
- 三角形矩阵的全体特征值就是它的全体对角元,每个特征值$\lambda_i$的重数就是它在对角元中出现的次数
- $|\lambda\mathbf{I-A}|=(\lambda-\lambda_1)\cdots(\lambda-\lambda_n)$,令$\lambda=0$得:
- 行列式$|\mathbf{A}|$等于特征值的乘积
- 特征多项式常数项=$(-1)^n|\mathbf{A}|$
相似矩阵
- 相似:设$\mathbf{A,B}$是$n$阶方阵,若存在$n$阶可逆方阵$\mathbf{P}$使$\mathbf{B=P^{-1}AP}$,则称$\mathbf{A}$与$\mathbf{B}$相似
- 相似不变量:特征多项式、特征值、行列式、迹、秩
- $\mathbf{AP=PD}$,其中$\mathbf{P}$各列为$\mathbf{A}$的特征向量;$\mathbf{D}$为对角矩阵,对角元为$\mathbf{A}$的特征值
- 应用:$\mathbf{A=PDP^{-1}}$,$\mathbf{A^n=PD^{n}P^{-1}}$
相似于对角矩阵的条件
- $n$阶复方阵$\mathbf{A}$相似于对角矩阵$\Leftrightarrow$$\mathbf{A}$有$n$个线性无关的特征向量
- $n$阶复方阵$\mathbf{A}$相似于对角矩阵$\Leftrightarrow$$\mathbf{A}$的每个特征值$\lambda_i$的重数等于特征子空间$V_{\lambda_i}$的维数
正交相似
二次曲线与二次曲面方程的化简
原坐标$\mathbf{X}$变换到新坐标$\mathbf{Y}$:$\mathbf{X=UY}$,其中$\mathbf{U}$是由解空间中的标准正交基为各列排成的正交方阵,且$det\mathbf{U}=1$
实对称方阵的正交相似
(前提:实对称方阵!)
- 正交相似:$\mathbf{B=U^{-1}AU}$,其中$\mathbf{U}$为正交矩阵,则称$\mathbf{A}$与$\mathbf{B}$正交相似
- 算法
- 求所有特征根$\lambda_i$,一定都是实数
- 对每个$\lambda_i$求齐次线性方程组实数域上的解空间$V_{\lambda_i}$的一组基$S_i$
- 将$S_i$正交化、单位化为$T_i$,将$T_i$为列排为正交方阵$\mathbf{U}$
- $\mathbf{D=U^{-1}AU}$为对角矩阵,对角元是$\mathbf{A}$全部特征根
- 定理(复杂版化简二次型的理论依据):任意$n$阶实对称方阵$\mathbf{S}$可通过正交方阵相似到对角矩阵$\mathbf{D=U^{-1}SU}$,且对角元为$\mathbf{S}$的特征值
- 实对称方阵不同特征值的特征向量相互垂直
- 坐标变换下,线性变换的关系
- 线性变换前,旧坐标系下坐标$\mathbf{X}$与新坐标系下坐标$\mathbf{Y}$:$\mathbf{X=UY}$
- 旧坐标系下描述线性变换:$\mathbf{X\mapsto AX}$
- 新坐标系下描述线性变换:$\mathbf{Y\mapsto(U^{-1}AU)Y}$
三维几何空间中的旋转与对称
此时不再是实对陈方阵,不能正交相似/相合至对角阵
正交变换
- 正交变换:$\sigma:\mathbf{A\mapsto AX}$保持向量内积不变/保持图形的形状和大小不变
- $\sigma:\mathbf{A\mapsto AX}$是正交变换 $\Leftrightarrow \mathbf{A}$是正交方阵
- 同阶正交方阵的乘积是正交方阵;正交方阵的逆是正交方阵
- 酉方阵:满足$\mathbf{A^*A=I}$的复方阵
- 酉方阵的特征值的模为1
- 正交方阵(完全为实数的酉方阵)的特征值的模为1
附录
相合与相似
相合的应用:
- 求向量组$\mathbf{A}$的标准正交基(通过把格拉姆方阵 $\mathbf{G=A}^T \mathbf{A}$ 相合到单位阵 $\mathbf{I}=\mathbf{P}^T\mathbf{GP}$,标准正交基为$\mathbf{B}=\mathbf{AP}$)
- 化简二次型(通过相合到对角阵 $\mathbf{D}=\mathbf{K}^T\mathbf{SK}$,新变量 $\mathbf{Y}=\mathbf{K}^{-1}\mathbf{X}$)
相似的应用(似乎总跟特征值/向量有关):
- 求矩阵(不要求对称)的$n$次幂(求特征向量,相似到对角阵)
- 化简二次型(求特征向量并正交标准化得正交方阵$\mathbf{U}$,正交相似到对角阵$\mathbf{D}$)
- $\mathbf{X}^T\mathbf{AX}$ 变为 $\mathbf{Y}^T\mathbf{DY}$
- 其中,$\mathbf{X=UY}$,$\mathbf{D}=\mathbf{U}^T\mathbf{AU}=\mathbf{U}^{-1}\mathbf{AU}$(对角元为特征值)
- 研究非二次型的变换,如旋转(此时正交相似/相合到非对角阵)