600 字
3 分钟
[人工智能数学基础] 范数

所有范数的性质#

  • 非负:x0\|x\| \geq 0,且当且仅当x=0x=0x=0\|x\|=0
  • 齐次:对于任意标量α\alpha和向量xx,有αx=αx\|\alpha x\| = |\alpha| \|x\|
  • 三角不等式:对于任意向量xxyy,有x+yx+y\|x+y\| \leq \|x\| + \|y\|

向量的范数#

L1范数#

也就是曼哈顿距离,定义为向量元素绝对值之和:

x1=i=1nxi\Vert x\Vert_1 = \sum_{i=1}^n |x_i|

单位球是一个菱形(二维时),超正轴体,稀疏性较强,适合特征选择和稀疏表示

L2范数#

欧几里得距离,定义为向量元素平方和的平方根:

x2=i=1nxi2\Vert x\Vert_2 = \sqrt{\sum_{i=1}^n x_i^2}

也就是向量的长度,单位球是(超)球体,不具备稀疏性

Lp范数#

Lp范数是L1和L2范数的推广,定义为:

xp=(i=1nxip)1/p\Vert x\Vert_p = \left( \sum_{i=1}^n |x_i|^p \right)^{1/p}

pp \rightarrow \infty时,Lp范数趋近于L∞范数。单位球趋近于一个(超)立方体,稀疏性极弱,抑制大值

加权p范数#

加权p范数引入权重向量ww,定义为:

xp,w=(i=1nwixip)1/p\Vert x\Vert_{p,w} = \left( \sum_{i=1}^n w_i |x_i|^p \right)^{1/p}

L0范数(伪)#

L0范数不是一个真正的范数(不满足齐次性),定义为向量中非零元素的数量:

x0=number of non-zero elements in x\Vert x\Vert_0 = \text{number of non-zero elements in } x

矩阵的范数#

矩阵的范数通用性质在向量范数的基础上增加了次乘性:对于任意矩阵AABB,有ABAB\Vert AB\Vert \leq \Vert A\Vert \Vert B\Vert

Frobenius范数(希尔伯特-施密特范数)#

类似于L2范数,定义为矩阵元素平方和的平方根:

AF=i=1mj=1naij2\Vert A\Vert_F = \sqrt{\sum_{i=1}^m \sum_{j=1}^n a_{ij}^2}

特别性质:

  • 与矩阵的迹相关:AF=trace(ATA)=trace(AAT)\Vert A\Vert_F = \sqrt{\text{trace}(A^TA)} = \sqrt{\text{trace}(AA^T)}
  • 与矩阵的奇异值相关:AF=i=1rσi2\Vert A\Vert_F = \sqrt{\sum_{i=1}^r \sigma_i^2},其中rr是矩阵的秩,σi\sigma_i是矩阵的奇异值。(奇异值的L2范数)
  • 与矩阵的特征值相关(必须是正规矩阵):AF=i=1nλi2\Vert A\Vert_F = \sqrt{\sum_{i=1}^n |\lambda_i|^2},其中λi\lambda_i是矩阵的特征值。(特征值的L2范数)

核范数#

核范数是矩阵的奇异值的L1范数,定义为:

A=i=1rσi\Vert A\Vert_* = \sum_{i=1}^r \sigma_i

rr是矩阵的秩

列和范数(L1诱导范数)#

定义为矩阵列向量的L1范数的最大值:

A1=max1jni=1maij\Vert A\Vert_1 = \max_{1 \leq j \leq n} \sum_{i=1}^m |a_{ij}|

谱范数(L2诱导范数)#

定义为矩阵的最大奇异值:

A2=σmax\Vert A\Vert_2 = \sigma_{\max}

行和范数(L∞诱导范数)#

定义为矩阵行向量的L1范数的最大值:

A=max1imj=1naij\Vert A\Vert_\infty = \max_{1 \leq i \leq m} \sum_{j=1}^n |a_{ij}|

[人工智能数学基础] 范数
https://a1kari8.github.io/posts/ai_math/norm/
作者
A1kari8
发布于
2026-04-18
许可协议
CC BY-NC-SA 4.0