[UCAS矩阵论]3.1矩阵序列与矩阵级数

\[ \newcommand\norm[1]{\Vert#1\Vert} \]

矩阵序列

收敛

定义:设有矩阵序列 \(\{A^{(k)}=(a_{ij}^{(k)})\}\),若各分量分别收敛,则称 \(\{A^{(k)}\}\) 收敛;否则,若存在一组 \(i,j\) 使得 \(a_{ij}^{(k)}\) 发散,则称 \(\{A^{(k)}\}\) 发散。

定理(各分量收敛等价于范数收敛):设 \(A^{(k)}\in\mathbb C^{m\times n}\)\(\norm{\cdot}\) 为任一广义矩阵范数,则: \[ \begin{align} &A^{(k)}\to 0\iff \norm{A^{(k)}}\to 0\\ &A^{(k)}\to A\iff \norm{A^{(k)}-A}\to 0 \end{align} \]

证明:根据广义矩阵范数的等价性定理,仅需对 \(m_\infty\) 范数证明。由于: \[a^{(k)}\to 0\wedge b^{(k)}\to 0\iff\max(a^{(k)},b^{(k)})\to0\] 所以: \[A^{(k)}\to 0\iff |a_{ij}^{(k)}|\to 0\iff\norm{A}_{m_\infty}=\max_{i,j}|a_{ij}^{(k)}|\to 0\] 证毕。

按各元素收敛需要验证 \(m\times n\) 个数列是否收敛,比较麻烦;按范数收敛只需要验证 1 个数列是否收敛,更加方便。

尽管上述定理对任意广义矩阵范数都成立,但在证明时我们通常会选取一个矩阵范数,这样可以用上相容性条件,使得很多证明与高等数学中证明数列收敛没有什么区别。

Cauchy 收敛:矩阵序列 \(\{A^{(k)}\}\) 收敛的充要条件是:对任意 \(\epsilon>0\),存在 \(N(\epsilon)\),当 \(k,l\geq N(\epsilon)\) 时,有: \[ \norm{A^{(k)}-A^{(l)}}<\epsilon \] 其中 \(\norm\cdot\) 为任一广义矩阵范数。

性质

性质 0. 若 \(A^{(k)}\to A\),则 \(\norm{A^{(k)}}\to\norm{A}\).

证明: \[\norm{A^{(k)}}-\norm{A}\leq\norm{A^{(k)}-A}\to0\implies\norm{A^{(k)}}\to\norm{A}\] 证毕。

性质 1. 设 \(A^{(k)}\to A,\,B^{(k)}\to B\),则: \[ \begin{align} &\lim_{k\to\infty}\alpha A^{(k)}+\beta B^{(k)}=\alpha A+\beta B\\ &\lim_{k\to\infty}A^{(k)}B^{(k)}=AB \end{align} \]

证明:只考虑相容的矩阵范数。 \[\begin{align}\norm{A^{(k)}B^{(k)}-AB}&=\norm{A^{(k)}B^{(k)}-AB^{(k)}+AB^{(k)}-AB}\\&\leq\norm{A^{(k)}B^{(k)}-AB^{(k)}}+\norm{AB^{(k)}-AB}\\&\leq\norm{A^{(k)}-A}\norm{B^{(k)}}+\norm{A}\norm{B^{(k)}-B}\end{align}\] 由于 \(\norm{A^{(k)}-A}\to0,\,\norm{B^{(k)}}\to\norm B,\,\norm{B^{(k)}-B}\to0\),所以 \(\norm{A^{(k)}B^{(k)}-AB}\to0\),故 \(A^{(k)}B^{(k)}\to AB\).

定理\(A^{(k)}\to A\) 的充要条件是对任意 \(x\)\(A^{(k)}x\to Ax\),或者对任意 \(x,y\)\(y^HA^{(k)}x\to y^HAx\).

定理:若 \(A^{(k)}\)\(A\) 都为 Hermite 矩阵,那么 \(A^{(k)}\to A\) 的充要条件是 \(x^HA^{(k)}x=x^HAx,\forall x\).

推论【类比单调有界定理】:若 \(A^{(k)}\) 为半正定 Hermite 矩阵且单调减少(即 \(A^{(k)}-A^{(k+1)}\) 为半正定 Hermite 矩阵),那么 \(A^{(k)}\) 有极限。

性质 2. 设 \(A^{(k)}\to A\),且 \(A^{(k)}\)\(A\) 都可逆,则: \[ \lim_{k\to\infty}\left(A^{(k)}\right)^{-1}=A^{-1} \]

有界

定义:如果存在常数 \(M>0\),使得对所有 \(k\) 都有: \[ |a_{ij}^{(k)}|<M \] 或等价地: \[ \norm{A^{(k)}}<M^\ast \] 则称矩阵序列 \(\{A^{(k)}\}\) 为有界的。

定理:有界矩阵序列 \(\{A^{(k)}\}\) 一定有收敛的子列。

收敛矩阵

定义:设 \(A\) 为方阵且 \(A^k\to 0\,(k\to\infty)\),则称 \(A\) 为收敛矩阵。

定理(迭代法基本定理)\(A\) 是收敛矩阵的充要条件是 \(\rho(A)<1\).

证明:

必要性:设 \(\lambda,x\)\(A\) 的特征值和特征向量,\(\lambda x=Ax\),则 \(\lambda^kx=A^kx\). 两边取范数: \[|\lambda|^k\norm{x}=\norm{A^kx}\leq\norm{A^k}\norm{x} \] 由于 \(x\neq 0\),故 \(|\lambda|^k\leq\norm{A^k}\to0\,(k\to\infty)\),于是 \(|\lambda|<1\),故 \(\rho(A)=\max_i|\lambda_i|<1\).

充分性:取 \(\epsilon=(1-\rho(A))/2\),根据上一章的结论,存在某种矩阵范数使得: \[\norm{A}<\rho(A)+\epsilon<1\] 故: \[\norm{A^k}\leq\norm{A}^k<(\rho(A)+\epsilon)^k\to 0\quad(k\to\infty)\] 从而 \(A^k\to0\).

定理\(A\) 是收敛矩阵的充要条件是存在某种矩阵范数满足 \(\norm{A}<1\).

证明:根据迭代法基本定理和谱半径与矩阵范数的关系易证。

实际应用中不会去算 \(\rho(A)\)(解特征值很麻烦),而是计算 \(\norm{A}\).

迭代法解线性方程组中,设迭代格式为 \(x_{n+1}=Ax_n+f\),则: \[\begin{align}x_{n}&=Ax_{n-1}+f\\&=A^2x_{n-2}+Af+f\\&=\cdots\\&=A^n x_0+(A^{n-1}+\cdots+A+I)f\\&=A^n x_0+(I-A^n)(I-A)^{-1}f\\&=A^nx_0+(I-A)^{-1}f-A^n(I-A)^{-1}f\\\end{align}\] 若迭代收敛,则解满足 \(x=Ax+f\implies x=(I-A)^{-1}f\). 记 \(\epsilon_n=x_n-x\) 表示第 \(n\) 次迭代后的误差,\(\epsilon_0=x_0-x\) 表示初始误差,那么: \[\epsilon_n=A^n\epsilon_0\] 因此,当 \(A\) 是收敛矩阵时,\(\epsilon_n\to0\),迭代法收敛。

矩阵级数

收敛与绝对收敛

定义:称矩阵级数 \(\sum_{k=0}^\infty A^{(k)}\) (绝对)收敛到 \(S\),若其部分和序列 \(\left\{S_N=\sum_{k=0}^N A^{(k)}\right\}\) (绝对)收敛,且极限为 \(S\).

性质:矩阵级数 \(\sum_{k=0}^\infty A^{(k)}\) 收敛的充要条件是对任意向量 \(x\),向量级数 \(\sum_{k=0}^\infty A^{(k)}x\) 收敛。

性质:若矩阵级数是绝对收敛的,则它一定是收敛的,并且任意调换其项的顺序所得到的级数仍然是收敛的,且其和不变。

性质:矩阵级数 \(\sum_{k=0}^\infty A^{(k)}\) 绝对收敛的充要条件是 \(\sum_{k=0}^\infty\norm{A^{(k)}}\) 收敛。

性质:若矩阵级数 \(\sum_{k=0}^\infty A^{(k)}\) (绝对)收敛,则 \(\sum_{k=0}^\infty PA^{(k)}Q\) 也(绝对)收敛,且: \[ \sum_{k=0}^\infty PA^{(k)}Q=P\left(\sum_{k=0}^\infty A^{(k)}\right)Q \] 性质:若两个矩阵级数都绝对收敛,且分别收敛到 \(A,B\),则其 Cauchy 乘积 \(\sum_{k=0}^\infty\sum_{i+j=k}A^{(i)}B^{(j)}\) 绝对收敛,且收敛到 \(AB\).

关于幂级数的三个定理

定理:方阵 \(A\) 的幂级数 \(\sum_{k=0}^\infty A^k\) 收敛的充要条件是 \(\rho(A)<1\),且收敛时的和为 \((I-A)^{-1}\).

证明:

必要性。由于级数 \(I+A+A^2+\cdots\) 收敛,所以部分和序列 \(S^{(k)}=I+A+\cdots+A^k\) 收敛。记 \(T^{(k)}=I+A+\cdots+A^{k+1}\),则 \(A^{k+1}=T^k-S^k\to0\),即 \(A\) 是收敛矩阵。根据前文的定理,有 \(\rho(A)<1\).

充分性。已知 \(\rho(A)<1\),故 \(A\) 为收敛矩阵,\(A^k\to 0\). 于是 \(S^{(k)}=I+A+\cdots+A^k=(I-A)^{-1}-(I-A)^{-1}A^{k+1}\to(I-A)^{-1}\).

证毕。

定理:若方阵 \(A\) 的某一范数满足 \(\norm{A}<1\),则部分和 \(I+A+\cdots+A^N\)\((I-A)^{-1}\) 之间的误差为: \[ \left\Vert(I-A)^{-1}-\sum_{k=0}^NA^k\right\Vert\leq\frac{\norm{A}^{N+1}}{1-\norm{A}} \]

证明:设 \(B=(I-A)^{-1}-\sum_{k=0}^NA^k=(I-A)^{-1}A^{N+1}\),则 \((I-A)B=A^{N+1}\),即 \(B=AB+A^{N+1}\),从而: \[\norm{B}=\norm{AB+A^{N+1}}\leq\norm{A}\norm{B}+\norm{A}^{N+1}\implies\norm{B}\leq\frac{\norm{A}^{N+1}}{1-\norm{A}}\] 证毕。

定理:设幂级数 \(\sum_{k=0}^\infty c_kz^k\) 的收敛半径为 \(r\),如果方阵 \(A\) 满足 \(\rho(A)<r\),则矩阵幂级数 \(\sum_{k=0}^\infty c_kA^k\) 绝对收敛;若 \(\rho(A)>r\),则矩阵幂级数发散。

证明:

根据上一章的结论,存在某个矩阵范数 \(\norm{A}\) 使得 \(\rho(A)\leq\norm{A}<r\),于是: \[\sum_{k=0}^{\infty}\norm{c_kA^k}=\sum_{k=0}^{\infty}|c_k|\norm{A^k}\leq\sum_{k=0}^\infty |c_k|\norm{A}^k\] 右侧数项级数收敛,因此左侧收敛,即矩阵幂级数绝对收敛。

\(A\) 的特征值 \(\lambda=\rho(A)\)\(x\) 为对应特征向量,则: \[\sum_{k=0}^\infty c_k(A^kx)=\sum_{k=0}^\infty c_k(\lambda^k x)=\left(\sum_{k=0}^\infty c_k\lambda^k\right)x\]\(\rho(A)>r\) 时,幂级数 \(\sum_{k=0}^\infty c_k\lambda^k\) 发散,因此矩阵幂级数发散;反之同理。证毕。


[UCAS矩阵论]3.1矩阵序列与矩阵级数
https://xyfjason.github.io/blog-main/2023/11/09/UCAS矩阵论-3-1矩阵序列与矩阵级数/
作者
xyfJASON
发布于
2023年11月9日
许可协议