[UCAS矩阵论]5.1特征值的估计

特征值的界

特征值的上界

定理:设 \(A\in \mathbb R^{n\times n}\),令: \[ M=\max_{1\leq r,s\leq n}\frac{1}{2}|a_{rs}-a_{sr}| \]\(\lambda\) 表示 \(A\) 的任一特征值,则 \(\lambda\) 的虚部 \(\text{Im}(\lambda)\) 满足不等式: \[ \begin{align} &|\text{Im}(\lambda)|\leq M\sqrt{\frac{n(n-1)}{2}}\\ &|\text{Im}(\lambda)|\leq\frac{\Vert A-A^T\Vert_2}{2}\\ &|\text{Im}(\lambda)|\leq\frac{\Vert A-A^T\Vert_1\cdot\sqrt{n}}{2} \end{align} \]

基本思想:任何一个实方阵都可以拆分为实对称阵和实反对称阵的和: \[A=\frac{1}{2}(A+A^T)+\frac{1}{2}(A-A^T)\] 我们知道实对称阵的特征值一定是实数,而实反对称阵的特征值一定是 0 或虚数。因此,可以认为上面的两部分分别决定了特征值的实部和虚部,这就是为什么我们关注 \(M=\max\limits_{1\leq r,s\leq n}\frac{1}{2}|a_{rs}-a_{sr}|\).

证明:暂略。

行列式的界

行对角占优:设 \(A\in\mathbb C^{n\times n}\),令: \[ R_r(A)=\sum_{s=1,s\neq r}^n|a_{rs}|,\quad r=1,\ldots,n \]\(|a_{rr}|>R_{r}(A),\ \forall\ r=1,\ldots,n\),则称矩阵 \(A\) 按行对角占优。

定理:行对角占优阵一定可逆。

证明:假设 \(A\) 不可逆,则其列线性相关,即存在不全为零的 \(k_1,\ldots,k_n\) 使得 \(k_1a_1+\cdots+k_na_n=0\). 设 \(k_r\) 是其中模长最大的,考虑第 \(r\) 个分量: \[k_1a_{r1}+\cdots+k_na_{rn}=0\implies a_{rr}=-\sum_{s=1,s\neq r}^n\frac{k_s}{k_r}a_{rs}\] 于是: \[|a_{rr}|\leq \sum_{s=1,s\neq r}^n\frac{|k_s|}{|k_r|}|a_{rs}|\leq \sum_{s=1,s\neq r}^n|a_{rs}|\]\(A\) 行对角占优矛盾,故假设不成立。证毕。

定理(行对角占优阵的行列式的上下界):设 \(A\in\mathbb C^{n\times n}\) 且按行对角占优,令: \[ M_r=|a_{rr}|+\sum_{s=r+1}^n|a_{rs}|,\quad m_r=|a_{rr}|-\sum_{s=r+1}^n|a_{rs}|,\quad r=1,\ldots,n \] 则: \[ 0<\prod_{r=1}^n m_r\leq |\det A|=\prod_{r=1}^n|\lambda_r(A)|\leq\prod_{r=1}^n M_r \]\(a_{rs}=0\ (s>r)\) 时等号成立。

证明:对 \(A\) 分块: \[A=\left[\begin{array}{c:ccc}a_{11}&a_{12}&\cdots&a_{1n}\\\hdashline a_{21}&&&\\\vdots&&A_1&\\a_{n1}&&&\\\end{array}\right]\]\(x=(\xi_2,\ldots,\xi_n)^T\) 且满足: \[\begin{bmatrix}a_{21}\\\vdots\\a_{n1}\end{bmatrix}+A_1\begin{bmatrix}\xi_2\\\vdots\\\xi_n\end{bmatrix}=0\] 则有 \(|\xi_k|=\max\{|\xi_2|,\ldots,|\xi_n|\}<1\),证明方式与上面证明行对角占优矩阵一定可逆的方式类似。

于是,利用行列式的性质,有: \[\det(A)=\det\left(A\begin{bmatrix}1&0\\x&I_{n-1}\end{bmatrix}\right)=\det\left(\left[\begin{array}{c:ccc}b_{11}&a_{12}&\cdots&a_{1n}\\\hdashline&&&\\0&&A_1&\\&&&\end{array}\right]\right)=|b_{11}|\cdot\det(A_1)\] 其中 \[b_{11}=a_{11}+\sum_{s=2}^na_{1s}\xi_s,\quad|\xi_s|<1\] 因此 \(m_1\leq|b_{11}|\leq M_1\). 然后递归地对 \(A_1\) 做类似推导即可。

定理(Hadamard 不等式):设 \(A\in\mathbb C^{n\times n}\),则有: \[ |\det(A)|=\prod_{r=1}^n|\lambda_r(A)|\leq\left[\prod_{s=1}^n\left(\sum_{r=1}^n|a_{rs}|^2\right)\right]^{1/2} \]

直观解释:平行多面体的体积小于等于将其拉成正立方体的体积。

证明:若 \(a_1,\ldots,a_n\) 线性无关,则显然成立;否则,进行 Gram-Schmidt 正交化过程,写作矩阵形式: \[(a_1,a_2,\ldots,a_n)=(b_1,b_2,\ldots,b_n)\begin{bmatrix}1&k_{21}&\cdots&k_{n1}\\&1&\cdots&k_{n2}\\&&\ddots&\vdots\\&&&1\end{bmatrix}\] 易知 \(\Vert a_i\Vert^2\geq\Vert b_i\Vert^2\),于是: \[|\det(A)|^2=|\det(B)|^2=\det(B^HB)=\Vert b_1\Vert^2\cdots\Vert b_n\Vert^2\leq\Vert a_1\Vert^2\cdots\Vert a_n\Vert^2\] 证毕。

特征值模长之和的界

定理(Schur 不等式):设 \(A\in\mathbb C^{n\times n}\) 的特征值为 \(\lambda_1,\ldots,\lambda_n\),则: \[ \sum_{r=1}^n|\lambda_r|^2\leq\sum_{r=1}^n\sum_{s=1}^n|a_{rs}|^2=\Vert A\Vert_F^2 \]

证明:根据 Schur 定理,存在酉矩阵 \(U\) 使得 \(A=UTU^H\),其中 \(T\) 为上三角矩阵,对角元素为 \(A\) 的特征值,且: \[\sum_{r=1}^n|\lambda_r|^2=\sum_{k=1}^n|t_{kk}|^2\leq\sum_{r=1}^n\sum_{s=1}^n|t_{rs}|^2=\text{tr}(T^HT)=\text{tr}(A^HA)\] 证毕。

特征值的包含区域(圆盘定理)

行盖尔圆:设 \(A\in\mathbb C^{m\times n}\),记第 \(i\) 个行盖尔圆为: \[ S_i=\{z\mid |z-a_{ii}|\leq R_i,\,z\in\mathbb C\} \] 其中 \(R_i=R_i(A)=\sum_{j\neq i}|a_{ij}|\).

圆盘定理 1\(A\) 的所有特征值在其 \(n\) 个盖尔圆的并集之内,即: \[ \lambda\in S=\bigcup_{i=1}^nS_i=\bigcup_{i=1}^n\{z\mid |z-a_{ii}|\leq R_i,\,z\in\mathbb C\} \]

证明:设 \(Ax=\lambda x\),写作分量形式: \[\sum_{j=1}^na_{ij}x_j=\lambda x_i\implies (\lambda-a_{ii})x_i=\sum_{j\neq i}a_{ij}x_j\]\(x_t\)\(x\) 各分量中模最大的那个,则 \(x_t\neq 0\),上式取 \(i=t\) 后两边同时除以 \(x_t\) 并取模得: \[|\lambda-a_{tt}|=\sum_{j\neq t}|a_{tj}|\left|\frac{x_j}{x_t}\right|\leq\sum_{j\neq t}|a_{tj}|=R_t(A)\] 因此 \(\lambda\in S_t\). 于是任意特征值 \(\lambda\in\bigcup_{i=1}^n S_i\). 证毕。

圆盘定理 1 说明,特征值 \(\lambda\) 属于特征向量最大分量的下标对应的盖尔圆。

圆盘定理 2:设矩阵 \(A\)\(n\) 个盖尔圆有 \(k\) 个互相连通并且与其余 \(n-k\) 个不相交,则这个连通区域中恰有 \(k\) 个特征值。

说明:设 \(A=D+B\),其中 \(D\) 为对角矩阵。设 \(A(t)=D+tB\),则当 \(t=0\) 时,所有盖尔圆都是点,也就是特征值;当 \(t\)\(0\)\(1\) 连续变化时,盖尔圆越来越大,而特征值也是连续变化的,所以 \(t=1\) 时特征值只能在其连通区域内,不可能跳跃到不连通的另一个区域中。从这个角度也可以知道,当两个盖尔圆相切时,其特征值最多到达切点处。

推论:若 \(n\) 阶矩阵 \(A\)\(n\) 个盖尔圆两两互不相交(都是孤立的),则 \(A\) 相似于对角矩阵。

推论:设 \(n\) 阶实矩阵 \(A\)\(n\) 个盖尔圆两两互不相交,则 \(A\) 的特征值全为实数。

证明:由于 \(A\) 为实矩阵,故所有盖尔圆的圆心都在实轴上。若 \(A\) 有复特征值,则必有与之关于实轴对称的共轭复对称值,与其在同一个盖尔圆中。由于盖尔圆两两互不相交,且一个孤立盖尔圆内只能有一个特征值,所以 \(A\) 的特征值只能都是实数。证毕。

列盖尔圆:设 \(A\in\mathbb C^{m\times n}\),记第 \(j\) 个列盖尔圆为: \[ G_j=\{z\mid |z-a_{jj}|\leq R'_j,\,z\in\mathbb C\} \] 其中 \(R'_j=R'_j(A)=\sum_{i\neq j}|a_{ij}|\).

列盖尔圆有与行盖尔圆类似的圆盘定理。结合二者可知,\(A\) 的所有特征值都在以下平面区域之中: \[ T=\left(\bigcup_{i=1}^nS_i\right)\cap\left(\bigcup_{j=1}^nG_j\right) \] 定理:相似矩阵的盖尔圆的圆心相同、半径不同。

证明:由于 \(B=P^{-1}AP\) 的第 \(i\) 行第 \(j\) 列元素为 \(a_{ij}p_i/p_j\),所以对于 \(B\)\[R_i=\sum_{j\neq i}\left\vert a_{ij}\cdot\frac{p_i}{p_j}\right\vert\] 而圆心依旧是 \(a_{ii}\cdot p_i/p_i=a_{ii}\).

这个定理可以用于隔离特征值:取 \(P=\text{diag}(p_1,\ldots,p_n),\,p_i>0\),若想要缩小半径,则将对应元素设置得大一些,这样原本相交的盖尔圆就能被隔离开了。

矩阵谱半径的估计

定理:设 \(A\)\(n\) 阶正规矩阵,则: \[ \rho(A)=\Vert A\Vert_2=\sqrt{\lambda_{A^HA}} \] 其中 \(\lambda_{A^HA}\)\(A^HA\) 的最大特征值。

证明:设 \(A\) 的特征值为 \(\lambda_1,\ldots,\lambda_n\),存在酉矩阵 \(U\) 使得: \[U^HAU=\text{diag}(\lambda_1,\ldots,\lambda_n)\] 于是: \[U^HA^HU=\text{diag}(\bar\lambda_1,\ldots,\bar\lambda_n)\] 因此: \[U^HA^HAU=\text{diag}(|\lambda_1|^2,\ldots,|\lambda_n|^2)\]\(A^HA\) 的特征值为 \(|\lambda_1|^2,\ldots,|\lambda_n|^2\),记 \(\lambda_{A^HA}=\max_{1\leq i\leq n}|\lambda_i|^2\),则: \[\Vert A\Vert_2=\sqrt{\lambda_{A^HA}}=\max_{1\leq i\leq n}|\lambda_i|=\rho(A)\] 证毕。

由于实对称矩阵、实反对称矩阵、正交矩阵、酉矩阵、Hermite 矩阵、反 Hermite 矩阵、对角矩阵都是正规矩阵,所以它们都有性质 \(\rho(A)=\Vert A\Vert_2\).

事实上,从上述证明过程可以看出,正规矩阵的奇异值等于特征值的模(可以一一对应上)。


[UCAS矩阵论]5.1特征值的估计
https://xyfjason.github.io/blog-main/2023/12/05/UCAS矩阵论-5-1特征值的估计/
作者
xyfJASON
发布于
2023年12月5日
许可协议