把矩阵看作一个算子——从几何角度解释对称矩阵的三个最重要性质( 三 )


这个 \"将标准基与特征向量对齐 \"听起来非常抽象 。 我们需要思考这个问题:矩阵变换对单位基做了什么?
由基α = {v_1 , … , v_n组成的矩阵将一个向量x从标准基变换到由基α构成的坐标系 , 我们用Aα表示这个矩阵 。 因此 , 在对角化的过程中(P-1AP=D) , P将一个向量从标准基送入特征向量 , A对其进行缩放 , 然后P?1将该向量送回标准基 。 从向量的角度来看 , 坐标系与标准基对齐 。
这种对齐方式如图1.16所示 , 本例中使用的矩阵为:

  • 式1.17
其中V是一个列向量长度为1的矩阵 , 每一个都对应于对角线矩阵中的特征值 。 至于计算 , 我们可以让Matlab中的eig来完成 。
这个性质直接遵循谱定理( spectral theorem):

如果A是厄米特矩阵 , 存在一个由A的特征向量组成的V的正态基 , 每个特征向量都是实数 。
该定理直接指出了将一个对称矩阵对角化的方法 。 为了直接证明这个性质 , 我们可以使用矩阵大小(维度)的归纳法 。。
正定性这些性质什么时候有用?甚至在正式研究矩阵之前 , 它们已经被用于解决线性方程组很长时间了 。 把矩阵看成是运算子 , 线性方程的信息就储存在这些运算子中 , 矩阵可以用来研究函数的行为 。
除了对称性之外 , 矩阵还可以有一个更好的性质就是正定性 。 如果一个对称矩阵是正定的 , 它的所有特征值都是正的 。 如果它的所有特征值都是非负的 , 那么它就是一个半正定矩阵 。 对于一个正定矩阵 , 很明显要求它是对称的 , 因为性质1 , 因为只有当一个数字是实数时 , 问它是正数还是负数或有多大才有意义 。
特征值、特征向量和函数行为
这方面的一个很好的应用是海赛矩阵(Hessian matrix) , 我们将以此为例来证明使用矩阵来分析函数行为 。 当我们试图找到一个局部极值时 , 发现海赛矩阵是正定的将非常有用 。 海赛矩阵是一个由实数函数的二阶偏微分组成的矩阵 。 形式上 , 海赛矩阵被定义为:
我们称H(x)为f的海赛矩阵 , 它是一个n乘n的矩阵 。 它与以下内容相同:
这对函数的行为有什么影响?我们来看看一个超级简单的例子 。 考虑一下函数:
海赛矩阵的计算方法如下:
  • 式2.3
由于它是一个对角矩阵 , 并且迹(对角线上的元素之和)等于特征向量之和 , 我们可以立即看到其中一个特征值是2 , 另一个是-2 。它们对应于特征向量v? = [1 0
?和v? = [0 1
? 。 这个矩阵是对称的 , 但不是正定的 。 因此 , 在整个?2上没有局部极值 , 我们只能在x=0 , y=0点上找到一个鞍点 。 这意味着在特征值为正的v_1方向上 , 函数增加 , 而在特征值为负的v_2方向上 , 函数减少 。 该函数的图像如下所示:
现在我们改变符号 , 将函数改为:
特征向量保持不变 , 但所有的特征向量都变成了正数 。 这意味着 , 在v_1的方向和v_2的方向上 , 函数都在增长 。 因此 , 可以找到局部最小值在x=0 , y=0处 , f(xy)=0 , 这也是全局最小值 。 该图为:
总结矩阵在许多领域都有广泛的应用 。 在处理矩阵时 , 经常会遇到正定义性、特征向量、特征值、对称矩阵等概念 。 在这篇文章中 , 介绍了对称(厄米特)矩阵的三个最重要的性质 , 它们与矩阵的特征向量和特征值有关 。 这些性质是以几何学方式解释的 , 但也包括一些代数证明 。 最后 , 介绍了一个使用矩阵来分析函数行为的例子 。

推荐阅读