雅可比矩阵#
设f:Rn→Rm是一个向量值函数
f(x1,x2,…,xn)=f1(x1,x2,…,xn)f2(x1,x2,…,xn)⋮fm(x1,x2,…,xn)则雅可比矩阵为:
Jf=∂x1∂f1∂x1∂f2⋮∂x1∂fm∂x2∂f1∂x2∂f2⋮∂x2∂fm⋯⋯⋱⋯∂xn∂f1∂xn∂f2⋮∂xn∂fmm×n
海森矩阵#
设f:Rn→R是一个标量值函数
其雅可比矩阵为:
Jf=[∂x1∂f∂x2∂f⋯∂xn∂f]1×n则海森矩阵为对雅可比矩阵某行(f是标量函数时就一行)的每个元素求所有二阶偏导数:
或者可以说海森矩阵是「雅可比矩阵的转置的雅可比矩阵」
Hf=J(∇f)=J(JfT)
Hf=∂x12∂2f∂x2∂x1∂2f⋮∂xn∂x1∂2f∂x1∂x2∂2f∂x22∂2f⋮∂xn∂x2∂2f⋯⋯⋱⋯∂x1∂xn∂2f∂x2∂xn∂2f⋮∂xn2∂2fn×nTIP如果f是一个向量值函数(f:Rn→Rm),则海森矩阵是一个m×n×n的张量
海森矩阵性质#
- 海森矩阵是对称矩阵:HfT=Hf(通常情况下,除非f的二阶偏导数不连续)
- 海森矩阵的特征值可以用来判断函数的极值性质:
- 如果Hf的所有特征值都大于0(正定),则f在该点是局部极小值
- 如果Hf的所有特征值都小于0(负定),则f在该点是局部极大值
- 如果Hf的特征值有正又有负(不定),则f在该点是一个鞍点
- 如果Hf的特征值中有0且非零值同号或全为0(奇异),则需要进一步分析才能确定极值性质