[UCAS矩阵论]5.4矩阵的直积

矩阵直积的定义与性质

定义:设 \(A=(a_{ij})\in\mathbb C^{m\times n}\)\(B=(b_{ij})\in\mathbb C^{p\times q}\),则称 \(A\)\(B\) 的直积(Kronecker 积)为: \[ A\otimes B= \begin{bmatrix} a_{11}B&a_{12}B&\cdots&a_{1n}B\\ a_{21}B&a_{22}B&\cdots&a_{2n}B\\ \vdots&\vdots&\ddots&\vdots\\ a_{m1}B&a_{m2}B&\cdots&a_{mn}B\\ \end{bmatrix}\in\mathbb C^{mp\times nq} \]

简单说来,就是 \(a_{ij}b_{kl}\) 放在 \(A\otimes B\)\(((i-1)m+k,(j-1)n+l)\) 处。

性质 1. \(k(A\otimes B)=(kA)\otimes B=A\otimes(kB)\).

性质 2. 若 \(A,B\) 同阶,则 \((A+B)\otimes C=A\otimes C+B\otimes C\)\(C\otimes(A+B)=C\otimes A+C\otimes B\).

性质 3. \((A\otimes B)\otimes C=A\otimes(B\otimes C)\).

证明思路:证明 \(a_{ij}b_{kl}c_{uv}\) 在同一个位置。

性质 4. \((A\otimes B)(C\otimes D)=AC\otimes BD\).

证明思路:直接展开。

推论 1. \((A_1\otimes\cdots\otimes A_l)(B_1\otimes\cdots\otimes B_l)=A_1B_1\otimes\cdots\otimes A_lB_l\).

推论 2. \((A_1\otimes B_1)\cdots(A_l\otimes B_l)=(A_1\cdots A_l)\otimes(B_1\cdots B_l)\).

性质 5. \((A\otimes B)^{-1}=A^{-1}\otimes B^{-1}\).

证明:\((A\otimes B)(A^{-1}\otimes B^{-1})=(AA^{-1})\otimes(BB^{-1})=I\).

性质 6. 若 \(A,B\) 为三角矩阵,则 \(A\otimes B\) 也是三角矩阵。

性质 7. \((A\otimes B)^H=A^H\otimes B^H\).

性质 8. 设 \(A_{m\times m}\)\(B_{n\times n}\) 都是酉矩阵,则 \(A\otimes B\) 也是酉矩阵。

性质 9. \(\text{rank}(A\otimes B)=\text{rank}(A)\cdot\text{rank}(B)\).

证明:对 \(A,B\) 作奇异值分解 \(A=U_A\Sigma_AV_A^H,\,B=U_B\Sigma_BV_B^H\),则: \[A\otimes B=(U_A\otimes U_B)(\Sigma_A\otimes\Sigma_B)(V_A\otimes V_B)^H\] 按定义易知 \(\Sigma_A\otimes \Sigma_B\)\(\text{rank}(A)\cdot\text{rank}(B)\) 个非零元。证毕。

性质 10. \(\text{tr}(A\otimes B)=\text{tr}(A)\cdot\text{tr}(B)\).

证明思路:直接展开。

性质 11. 对于方阵 \(A\in\mathbb C^{m\times m},\,B\in\mathbb C^{n\times n}\),有 \(A\otimes B\) 相似于 \(B\otimes A\).

拉直算子

定义:设 \(A=(a_1,a_2,\ldots,a_n)\),定义列拉直为: \[ \text{vec}(A)=\begin{bmatrix}a_1\\a_2\\\vdots\\a_n\end{bmatrix}=\sum_{j=1}^ne_j\otimes (Ae_j) \] 类似地,设 \(A=\begin{bmatrix}a_1^T\\a_2^T\\\vdots\\a_m^T\end{bmatrix}\),定义行拉直为: \[ \overline{\text{vec}}(A)=\begin{bmatrix}a_1\\a_2\\\vdots\\a_m\end{bmatrix}=\sum_{i=1}^me_i\otimes(A^Te_i) \] 显然有:\(\overline{\text{vec}}(A)=\text{vec}(A^T)\).

定理:设 \(A\in\mathbb C^{m\times n},X\in\mathbb C^{n\times p},B\in\mathbb C^{p\times q}\),则: \[ \begin{align} &\text{vec}(AXB)=(B^T\otimes A)\text{vec}(X)\\ &\overline{\text{vec}}(AXB)=(A\otimes B^T)\overline{\text{vec}}(X) \end{align} \]

证明(这里采用代数形式,采用展开形式也能证): \[\begin{align}\text{vec}(AXB)&=\sum_{j=1}^qe_j\otimes(AXBe_j)=\sum_{j=1}^qe_j\otimes\left(AX\left(\sum_{k=1}^pe_ke_k^T\right)Be_j\right)\\&=\sum_{j=1}^q\sum_{k=1}^pe_j\otimes (AXe_k{\color{purple}e_k^TBe_j})=\sum_{k=1}^p\sum_{j=1}^q(e_j{\color{purple}e_j^TB^Te_k})\otimes (AXe_k)\\&=\sum_{k=1}^p(B^Te_k)\otimes (AXe_k)=\sum_{k=1}^p(B^T\otimes A)(e_k\otimes Xe_k)=(B^T\otimes A)\text{vec}(X)\end{align}\] 推导过程中注意紫色部分是一个数,可以转置并移动到直积的另一边去。

行展开类似,或者直接取转置即可。证毕。

以矩阵直积定义方幂

定义:设 \(A\in\mathbb C^{m\times n}\),定义 \(A^{[1]}=A,\,A^{[k+1]}=A^{[k]}\otimes A,\,k=1,2,\ldots\).

性质\((AB)^{[k]}=A^{[k]}B^{[k]}\). 利用直积的性质 4 容易证明。

二元函数 \(f(A,B)\) 的特征值

对二元函数 \(f(x,y)=\displaystyle\sum_{i,j=0}^lc_{ij}x^iy^j\) 及矩阵 \(A\in\mathbb C^{m\times m},\,B\in\mathbb C^{n\times n}\),定义: \[ f(A,B)=\sum_{i,j=0}^lc_{ij}A^{i}\otimes B^{j} \] 定理:设 \(A_{m\times m}\) 的特征值为 \(\lambda_1,\lambda_2,\ldots,\lambda_m\)\(B_{n\times n}\) 的特征值为 \(\mu_1,\mu_2,\ldots,\mu_n\),则 \(f(A,B)\) 的全体特征值为 \(f(\lambda_i,\mu_j),\,i=1,2,\ldots,m,j=1,2,\ldots,n\).

证明:将 \(A,B\) 相似上三角化 \(A=P_AR_AP_A^{-1},\,B=P_BR_BP_B^{-1}\),其中 \(R_A,R_B\) 为上三角矩阵。那么 \(A^i=P_AR_A^iP_A^{-1},\,B=P_BR_B^iP_B^{-1}\),于是: \[\begin{align}f(A,B)&=\sum_{i,j=0}^lc_{ij}(P_AR_A^iP_A^{-1})\otimes(P_BR_B^jP_B^{-1})\\&=\sum_{i,j=0}^lc_{ij}(P_A\otimes P_B)(R_A^i\otimes R_B^j)(P_A^{-1}\otimes P_B^{-1})\\&=(P_A\otimes P_B)\left(\sum_{i,j=0}^lc_{ij}R_A^i\otimes R_B^j\right)(P_A\otimes P_B)^{-1}\\\end{align}\] 由于 \(R_A^i\otimes R_B^j\) 是上三角矩阵,其对角元 \(\{\lambda_r^i\mu_s^j\mid r=1,\ldots,m,s=1,\ldots,n\}\) 就是所有特征值,故 \(f(A,B)\) 全体特征值为: \[\text{diag}\left(\sum_{i,j=0}^{l}c_{ij}R_A^i\otimes R_B^j\right)=\left\{\sum_{i,j=0}^lc_{ij}\lambda_r^i\mu_s^j\mid r,s\right\}=\{f(\lambda_r,\mu_s)\mid r,s\}\]

证毕。

推论 1\(A\otimes B\) 的全体特征值为 \(\{\lambda_i\mu_j\mid i=1,\ldots,m,j=1,\ldots,n\}\).

推论 2\(\det(A\otimes B)=(\det A)^n(\det B)^m\).

证明:\(\det(A\otimes B)=\prod_{i=1}^m\prod_{j=1}^n\lambda_i\mu_j=(\prod_{i=1}^m\lambda_i^n)(\prod_{j=1}^n\mu_j^m)=(\det A)^n(\det B)^m\).

推论 3\(\text{tr}(A\otimes B)=(\text{tr}A)(\text{tr}B)\).

矩阵方程及相关定理

遇到形如 \(\displaystyle\sum_{i=1}^lA_iXB_i=F\) 的矩阵方程,其中 \(X\) 为未知量,考虑两边同时行拉直

定理\[ \sum_{i=1}^lA_iXB_i=F\quad\text{有解}\quad\iff\quad \overline{\text{vec}}(F)\in R\left(\sum_{i=1}^lA_i\otimes B_i^T\right) \]

证明:两边同时进行行拉直,得: \[\sum_{i=1}^l(A_i\otimes B_i^T)\overline{\text{vec}}(X)=\overline{\text{vec}}(F)\] 于是结论显然成立。证毕。

定理:设 \(A_{m\times m}\) 的特征值为 \(\lambda_1,\ldots,\lambda_m\)\(B_{n\times n}\) 的特征值为 \(\mu_1,\ldots,\mu_n\),则方程 \(AX+XB=F\) 有唯一解的充要条件是 \[ \lambda_i+\mu_j\neq 0,\,(i=1,\ldots,m,\,j=1,\ldots,n) \]

证明:两边同时进行行拉直,得: \[(A\otimes I+I\otimes B^T)\overline{\text{vec}}(X)=\overline{\text{vec}}(F)\] 要使该方程有唯一解,则系数矩阵特征值非零。根据上文的定理,\(A\otimes I+I\otimes B^T\) 的特征值为 \(\lambda_i+\mu_j\),因此命题成立。证毕。

推论\(AX+XB=O\) 有非零解的充要条件是存在 \(i_0,j_0\) 使得 \(\lambda_{i_0}+\mu_{j_0}=0\).

推论\(AX-XA=O\) 一定有非零解。

定理:设 \(A_{m\times m}\) 的特征值为 \(\lambda_1,\ldots,\lambda_m\)\(B_{n\times n}\) 的特征值为 \(\mu_1,\ldots,\mu_n\),则方程 \(\displaystyle\sum_{k=0}^lA^kXB^k=F\) 有唯一解的充要条件是 \[ 1+(\lambda_i\mu_j)+\cdots+(\lambda_i\mu_j)^l\neq0 \]

证明:两边同时进行行拉直,得: \[\sum_{k=0}^l\left(A^k\otimes (B^k)^T\right)\overline{\text{vec}}(X)=\overline{\text{vec}}(F)\] 要使该方程有唯一解,则系数矩阵特征值非零。取 \(f(x,y)=\displaystyle\sum_{k=0}^lx^ky^k\),则系数矩阵为 \(f(A,B^T)\),因此特征值为 \(f(\lambda_i,\mu_j)=1+(\lambda_i\mu_j)+\cdots+(\lambda_i\mu_j)^l\). 证毕。


[UCAS矩阵论]5.4矩阵的直积
https://xyfjason.github.io/blog-main/2023/12/12/UCAS矩阵论-5-4矩阵的直积/
作者
xyfJASON
发布于
2023年12月12日
许可协议