699 字
3 分钟
[人工智能数学基础] 一些矩阵基本概念

秩(Rank)#

矩阵的维数

线性无关的行或列的最大数量

计算方法:

  • 高斯消元法:通过行变换将矩阵化为行阶梯形,非零行的数量即为秩
  • 奇异值分解(SVD):矩阵的秩等于其非零奇异值的数量
  • 行列式:对于方阵,如果行列式不为零,则秩等于矩阵的大小;如果行列式为零,则秩小于矩阵的大小

迹(Trace)#

矩阵的能量

矩阵对角线元素的和:

tr(A)=i=1naii\text{tr}(A) = \sum_{i=1}^n a_{ii}

迹的性质:

  • 轮换不变性:tr(AB)=tr(BA)\text{tr}(AB) = \text{tr}(BA)
  • 线性:tr(A+B)=tr(A)+tr(B)\text{tr}(A + B) = \text{tr}(A) + \text{tr}(B)tr(αA)=αtr(A)\text{tr}(\alpha A) = \alpha \text{tr}(A)
  • tr(A)=tr(A)\text{tr}(A^*) = \overline{\text{tr}(A)},其中AA^*AA的共轭转置

Spark#

线性相关的列的最小数量

越大说明矩阵越稀疏

当要找一个kk-稀疏的解(即解中最多有kk个非零元素,x0k\Vert \mathbf{x} \Vert_0 \leq k)时,若满足:

x0<spark(A)2\Vert \mathbf{x} \Vert_0 < \frac{\text{spark}(A)}{2}

则该解是唯一的

共轭矩阵#

共轭矩阵是指矩阵元素取共轭复数后的矩阵,记为AA^*A\overline{A}

A=[aij]\overline{A} = [\overline{a_{ij}}]

如果AA是实数矩阵,则A=A\overline{A} = A

共轭转置矩阵(也称为伴随或埃尔米特共轭)#

此「伴随」和线性代数课里的「伴随矩阵」不是一个概念

共轭转置矩阵是指先取共轭矩阵再转置(其实先后都一样)的矩阵,记为AHA^HAA^*

A=ATA^* = \overline{A}^T

如果AA是实数矩阵,则A=ATA^* = A^T

A=AA^* = A,则称AA为埃尔米特矩阵(也称自伴矩阵),其特征值为实数

A=AA^* = -A,则称AA为斜(反)埃尔米特矩阵,其特征值为纯虚数或0

酉(Unitary)矩阵#

UU是酉矩阵当且仅当UU=UU=IU^* U = U U^* = I

性质:

  • U1=UU^{-1} = U^*

实正交(Real Orthogonal)矩阵(酉矩阵的特殊情况)#

AA是正交矩阵当且仅当ATA=IA^T A = I

性质:

  • A1=ATA^{-1} = A^T

正规(Normal)矩阵#

AA是正规矩阵当且仅当AA=AAA^* A = A A^*

正定矩阵#

AA是正定矩阵当且仅当对于所有非零向量xx,有xAx>0x^* A x > 0

半正定矩阵#

AA是半正定矩阵当且仅当对于所有向量xx,有xAx0x^* A x \geq 0

对合(Involution)矩阵#

AA是对合矩阵当且仅当A2=IA^2 = I

幂等(Idempotent)矩阵#

AA是幂等矩阵当且仅当A2=AA^2 = A

摩尔-彭若斯(Moore-Penrose)伪逆矩阵#

方程AX=BAX = B无解时,AA的伪逆AA^\dagger可以提供一个最小二乘解:

A=(AA)1A(当A列满秩时)X=ABA^\dagger = (A^* A)^{-1} A^* \quad \text{(当$A$列满秩时)} \\ X = A^\dagger B

条件:

  • AAA=AAA^\dagger A = A
  • AAA=AA^\dagger A A^\dagger = A^\dagger
  • (AA)T=AA(AA^\dagger)^T = AA^\dagger
  • (AA)T=AA(A^\dagger A)^T = A^\dagger A

Gram矩阵#

每个元素是两个向量的内积

G=AAG = A^* A

性质:

  • 是埃尔米特矩阵
  • 是半正定矩阵
  • GG可逆 \Leftrightarrow AA列满秩(线性无关)
[人工智能数学基础] 一些矩阵基本概念
https://a1kari8.github.io/posts/ai_math/matrix/
作者
A1kari8
发布于
2026-04-18
许可协议
CC BY-NC-SA 4.0