前言

本文只会记录人工智能中所用到的线性代数知识,并不会记录大学线性代数教材中的所有知识。

现在CSDN不能发超长的文章了,只能分成多篇发布。

人工智能数学基础之线性代数(一)
人工智能数学基础之线性代数(二)
人工智能数学基础之线性代数(三)

行列式的性质


D=∣a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann∣,DT=∣a11a21⋯an1a12a22⋯an2⋮⋮⋮a1na2n⋯ann∣D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots &\vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix}, \quad D^T = \begin{vmatrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots &\vdots & & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{vmatrix} D=a11a21an1a12a22an2a1na2nann,DT=a11a12a1na21a22a2nan1an2ann
行列式DTD^TDT称为行列式DDD的转置行列式。

性质1 行列式与它的转置行列式相等

性质2 互换行列式的两行(列),行列式变号

推论 如果行列式有两行(列)完全相同,则此行列式等于零

性质3 行列式的某一行(列)中所有的元素都乘以同一数kkk,等于用数kkk乘此行列式

推论 行列式中某一行(列)的所有元素的公因子可以提到行列式记号的外面

性质4 行列式中如果有两行(列)元素成比例,则此行列式等于零

性质5 若行列式的某一列(行)的元素都是两数之和,例如第iii列的元素都是两数之和:
D=∣a11a12⋯(a1i+a1i′)⋯a1na21a22⋯(a2i+a2i′)⋯a2n⋮⋮⋮⋮an1an2⋯(ani+ani′)⋯ann∣,D= \begin{vmatrix} a_{11} & a_{12} & \cdots & (a_{1i} + a_{1i}^\prime)& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & (a_{2i} + a_{2i}^\prime)& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & (a_{ni} + a_{ni}^\prime)& \cdots &a_{nn}\\ \end{vmatrix}, D=a11a21an1a12a22an2(a1i+a1i)(a2i+a2i)(ani+ani)a1na2nann,
DDD等于下列两个行列式之和:
D=∣a11a12⋯a1i⋯a1na21a22⋯a2i⋯a2n⋮⋮⋮⋮an1an2⋯ani⋯ann∣+∣a11a12⋯a1i′⋯a1na21a22⋯a2i′⋯a2n⋮⋮⋮⋮an1an2⋯ani′⋯ann∣.D= \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i} & \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}& \cdots &a_{nn}\\ \end{vmatrix} + \\ \qquad \qquad \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}^\prime& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i}^\prime& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}^\prime& \cdots &a_{nn}\\ \end{vmatrix}. D=a11a21an1a12a22an2a1ia2iania1na2nann+a11a21an1a12a22an2a1ia2iania1na2nann.
性质6 把行列式的某一列(行)的各元素乘以同一数然后加到另一列(行)对应的元素上去,行列式不变。

例如以数kkk乘第jjj列加到第iii列上(记作ci+kcjc_i + kc_jci+kcj),有
∣a11⋯a1i⋯a1j⋯a1na21⋯a2i⋯a2j⋯a2n⋮⋮⋮⋮an1⋯ani⋯anj⋯ann∣=ci+kcj∣a11⋯(a1i+ka1j)⋯a1j⋯a1na21⋯(a2i+ka2j)⋯a2j⋯a2n⋮⋮⋮⋮an1⋯(ani+kanj)⋯anj⋯ann∣(i≠j)\begin{vmatrix} a_{11} & \cdots& a_{1i} & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& a_{2i} & \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& a_{ni} & \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} \\ \overset{c_i + kc_j}{=} \begin{vmatrix} a_{11} & \cdots& (a_{1i} + ka_{1j}) & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& (a_{2i} + ka_{2j})& \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& (a_{ni} + ka_{nj})& \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} (i \neq j) a11a21an1a1ia2iania1ja2janja1na2nann=ci+kcja11a21an1(a1i+ka1j)(a2i+ka2j)(ani+kanj)a1ja2janja1na2nann(i=j)
(以数kkk乘第jjj行加到第iii行上,记作ri+krjr_i + kr_jri+krj)

行列式按行(列)展开

一般来说,低阶行列式的计算比高阶行列式的计算要简便,于是,我们自然地考虑用低阶行列式来表示高阶行列式的问题。为此,先引入余子式和代数余子式的概念。

nnn阶行列式中,把(i,j)(i,j)(i,j)aija_{ij}aij所在的第iii行和第jjj列划去后,留下来的n−1n-1n1阶行列式叫作(i,j)(i,j)(i,j)aija_{ij}aij的余子式,记作MijM_{ij}Mij;记
Aij=(−1)i+jMij,A_{ij} = (-1)^{i+j}M_{ij}, Aij=(1)i+jMij,
AijA_{ij}Aij叫做(i,j)(i,j)(i,j)aija_{ij}aij的代数余子式。

例如四阶行列式
D=∣a11a12a13a14a21a22a23a24a31a32a33a34a41a42a43a44∣D = \begin{vmatrix} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34}\\ a_{41} & a_{42} & a_{43} & a_{44}\\ \end{vmatrix} D=a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44
(3,2)(3,2)(3,2)a32a_{32}a32的余子式和代数余子式分别为
M32=∣a11a13a14a21a23a24a41a43a44∣,A32=(−1)3+2M32=−M32.M_{32} = \begin{vmatrix} a_{11} & a_{13} & a_{14}\\ a_{21} & a_{23} & a_{24}\\ a_{41} & a_{43} & a_{44}\\ \end{vmatrix}, \\ A_{32} = (-1)^{3+2} M_{32} = -M_{32}. M32=a11a21a41a13a23a43a14a24a44,A32=(1)3+2M32=M32.
引理 一个nnn阶行列式,如果其中第iii行所有元素除(i,j)(i,j)(i,j)aija_{ij}aij外都为零,那么这行列式等于aija_{ij}aij与它的代数余子式的乘积,即
D=aijAij.D = a_{ij}A_{ij}. D=aijAij.
定理3 行列式等于它的任一行(列)的各元素与其对应的代数余子式乘积之和,即
D=ai1Ai1+ai2Ai2+⋯+ainAin(i=1,2,⋯,n),D=a1jA1j+a2jA2j+⋯+anjAnj(j=1,2,⋯,n)D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n),\\ D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n) D=ai1Ai1+ai2Ai2++ainAin(i=1,2,,n),D=a1jA1j+a2jA2j++anjAnj(j=1,2,,n)

D=∣a11a12⋯a1n⋮⋮⋮ai1+0+⋯+00+ai2+⋯+0⋯0+⋯+0+ain⋮⋮⋮an1an2⋯ann∣=∣a11a12⋯a1n⋮⋮⋮ai10⋯0⋮⋮⋮an1an2⋯ann∣+∣a11a12⋯a1n⋮⋮⋮0ai2⋯0⋮⋮⋮an1an2⋯ann∣+⋯+∣a11a12⋯a1n⋮⋮⋮00⋯ain⋮⋮⋮an1an2⋯ann∣,D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots\\ a_{i1} + 0 + \cdots + 0& 0 + a_{i2} + \cdots + 0 &\cdots & 0 + \cdots +0 + a_{in}\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix} \\ = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ a_{i1} & 0 &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & a_{i2} &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \cdots + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & 0 &\cdots & a_{in} \\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix}, D=a11ai1+0++0an1a120+ai2++0an2a1n0++0+ainann=a11ai1an1a120an2a1n0ann+a110an1a12ai2an2a1n0ann++a110an1a120an2a1nainann,
根据引理,即得
D=ai1Ai1+ai2Ai2+⋯+ainAin(i=1,2,⋯,n)D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n) D=ai1Ai1+ai2Ai2++ainAin(i=1,2,,n)
类似地,若按列证明,可得
D=a1jA1j+a2jA2j+⋯+anjAnj(j=1,2,⋯,n).D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n). D=a1jA1j+a2jA2j++anjAnj(j=1,2,,n).
这个定理叫做行列式按行(列)展开法则。利用这一法则并结合行列式的性质,可以简化行列式的计算。

推论 行列式的某一行(列)的元素与另一行(列)的对应元素的代数余子式乘积之和等于零。即
ai1Aj1+ai2Aj2+⋯+ainAjn=0,i≠j,a1iA1j+a2iA2j+⋯+aniAnj=0,i≠j.a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j,\\ a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j. ai1Aj1+ai2Aj2++ainAjn=0,i=j,a1iA1j+a2iA2j++aniAnj=0,i=j.
把行列式D=det(aij)D=det(a_{ij})D=det(aij)按第jjj行展开,有
aj1Aj1+aj2Aj2+⋯+ajnAjn=∣a11⋯a1n⋮⋮ai1⋯ain⋮⋮aj1⋯ajn⋮⋮an1⋯ann∣,a_{j1}A_{j1} + a_{j2}A_{j2} + \cdots+ a_{jn}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}\\ \vdots & & \vdots \\ a_{j1} & \cdots & a_{jn}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix}, aj1Aj1+aj2Aj2++ajnAjn=a11ai1aj1an1a1nainajnann,
在上式中把ajka_{jk}ajk换成aik(k=1,⋯,n)a_{ik}(k=1,\cdots,n)aik(k=1,,n),可得
ai1Aj1+ai2Aj2+⋯+ainAjn=∣a11⋯a1n⋮⋮ai1⋯ain(i行)⋮⋮ai1⋯ain(j行)⋮⋮an1⋯ann∣a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in} (i\text{行})\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}(j\text{行})\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} ai1Aj1+ai2Aj2++ainAjn=a11ai1ai1an1a1nain(i)ain(j)ann
i≠ji\neq ji=j时,上式右端行列式中有两行对应元素相同,故行列式为零,即得
ai1Aj1+ai2Aj2+⋯+ainAjn=0,i≠j.a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j. ai1Aj1+ai2Aj2++ainAjn=0,i=j.
上述证法如按列进行,可得
a1iA1j+a2iA2j+⋯+aniAnj=0,i≠j.a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j. a1iA1j+a2iA2j++aniAnj=0,i=j.

克拉默法则

又译为克莱姆法则。

含有nnn个未知数x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,,xnnnn个线性方程的方程组
{a11x1+a12x2+⋯+a1nxn=b1,a21x1+a22x2+⋯+a2nxn=b2,⋯an1x1+an2x2+⋯+annxn=bn,(8)\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= b_2, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= b_n, \\ \end{cases} \tag{8} a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2,an1x1+an2x2++annxn=bn,(8)
与二、三元线性方程组类似,它的解可以用nnn阶行列式表示,即有

克拉默法则 如果线性方程组(8)(8)(8)的系数行列式不等于零,即
D=∣a11⋯a1n⋮⋮an1⋯ann∣≠0,D =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} \neq 0, D=a11an1a1nann=0,
那么,方程组(11)(11)(11)有唯一解
x1=D1D,x2=D2D,xn=DnD,(9)x_1 = \frac{D_1}{D}, \quad x_2 = \frac{D_2}{D}, \quad x_n = \frac{D_n}{D}, \tag{9} x1=DD1,x2=DD2,xn=DDn,(9)
其中Dj(j=1,2,⋯,n)D_j(j=1,2,\cdots,n)Dj(j=1,2,,n)是把系数行列式DDD中第jjj列的元素用方程组右端的常数项代替后得到的nnn阶行列式,即
Dj=∣a11⋯a1,j−1b1a1,j+1⋯a1n⋮⋮⋮⋮⋮an1⋯an,j−1bnan,j+1⋯ann∣.D_j =\begin{vmatrix} a_{11} &\cdots &a_{1,j-1}& b_1 & a_{1,j+1}&\cdots & a_{1n}\\ \vdots & &\vdots& \vdots & \vdots& & \vdots\\ a_{n1} &\cdots &a_{n,j-1}& b_n & a_{n,j+1}&\cdots & a_{nn} \end{vmatrix}. Dj=a11an1a1,j1an,j1b1bna1,j+1an,j+1a1nann.
定理4 如果线性方程组(8)(8)(8)的系数行列式D≠0D \neq 0D=0,则(8)(8)(8)一定有解,且解是唯一的。

该定理的逆否定理为
定理4’ 如果线性方程组(8)(8)(8)无解或有两个不同的解,则它的系数行列式比为零。

线性方程组(8)(8)(8)右端的常数项b1,b2,⋯,bnb_1,b_2,\cdots,b_nb1,b2,,bn全为零时,线性方程组(8)(8)(8)叫做 齐次线性方程组。

对于齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0,a21x1+a22x2+⋯+a2nxn=0,⋯an1x1+an2x2+⋯+annxn=0,(10)\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= 0, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= 0, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= 0, \\ \end{cases} \tag{10} a11x1+a12x2++a1nxn=0,a21x1+a22x2++a2nxn=0,an1x1+an2x2++annxn=0,(10)
x1=x2=⋯=xn=0x_1=x_2=\cdots = x_n =0x1=x2==xn=0一定是它的解,这个解叫做齐次线性方程组的零解。

如果一组不全为零的数是(10)(10)(10)的解,则它叫做齐次线性方程组(10)(10)(10)的非零解。

矩阵

矩阵是一个按照长方阵列排列的复数或实数集合。
m×nm × nm×n个数组成的一个mmmnnn列的矩形表格。如图所示:

A=[a11a12⋯a1na21a22⋯a2n⋮⋮⋱⋮am1am2⋯amn]A = \left[ \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{matrix} \right]A=a11a21am1a12a22am2a1na2namn

称为mmmnnn列矩阵,简称m×nm \times nm×n矩阵。

这个m×nm \times nm×n个数称为矩阵AAA的元素,简称为元,数aija_{ij}aij位于矩阵AAA的第iii行第jjj列,称为矩阵AAA(i,j)(i,j)(i,j)元。

以数aija_{ij}aij(i,j)(i,j)(i,j)元的矩阵可简记作(aij)(a_{ij})(aij)(aij)m×n(a_{ij})_{m \times n}(aij)m×nm×nm \times nm×n矩阵AAA也记作Am×nA_{m \times n}Am×n

行数与列数都等于nnn的矩阵称为nnn阶矩阵或nnn阶方阵。

元素都是零的矩阵称为零矩阵,记作OOO

nnn个变量x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,,xnmmm个变量y1,y2,⋯,ymy_1,y_2,\cdots,y_my1,y2,,ym之间的关系式
{y1=a11x1+a12x2+⋯+a1nxn,y2=a21x1+a22x2+⋯+a2nxn,⋯ym=am1x1+am2x2+⋯+amnxn(2)\begin{cases} y_1= a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n, \\ y_2= a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n, \\ \cdots \\ y_m= a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n \\ \end{cases} \tag{2} y1=a11x1+a12x2++a1nxn,y2=a21x1+a22x2++a2nxn,ym=am1x1+am2x2++amnxn(2)
表示从一个变量x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,,xn与到变量y1,y2,⋯,ymy_1,y_2,\cdots,y_my1,y2,,ym的线性变换,其中aija_{ij}aij为常数。线性变换(2)(2)(2)的系数aija_{ij}aij构成矩阵A=(aij)m×nA = (a_{ij})_{m \times n}A=(aij)m×n,称为系数矩阵。

矩阵的基本运算

两个矩阵的行数和列数分别相等,称它们为同型矩阵

加法

矩阵的加法只能在两个同型矩阵之间进行,两个矩阵相加时,对应元素进行相加。

如:

[123457]+[002213]=[1256610]\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 7 \end{matrix} \right] + \left[ \begin{matrix} 0 & 0 & 2\\ 2 & 1 & 3 \end{matrix} \right] = \left[ \begin{matrix} 1 & 2 & 5\\ 6 & 6 & 10 \end{matrix} \right] [142537]+[020123]=[1626510]

数乘

λ\lambdaλ与矩阵AAA的乘积记作λA\lambda AλAAλA\lambdaAλ,规定为

λA=Aλ=[λa11λa12⋯λa1nλa21λa22⋯λa2n⋮⋮⋱⋮λam1λam2⋯λamn]\lambda A = A\lambda = \left[ \begin{matrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1n}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{m1} & \lambda a_{m2} & \cdots & \lambda a_{mn} \end{matrix} \right]λA=Aλ=λa11λa21λam1λa12λa22λam2λa1nλa2nλamn

乘法

必须满足矩阵AAA的列数与矩阵BBB的行数相等,或者矩阵AAA的行数与矩阵BBB的列数相等。

C=ABC=ABC=AB,矩阵CCC的第iii行第jjj列的元素等于矩阵AAA的第iii行的所有元素与矩阵BBB的第jjj列的对应元素的乘积之和,即:
Cij=∑k=1naikbkjC_{ij} = \sum_{k=1}^na_{ik}b_{kj} Cij=k=1naikbkj
如:

[123]1×3[456]3×1=1×4+2×5+3×6=32\left[ \begin{matrix} 1 & 2 & 3 \end{matrix} \right] _{1×3} \left[ \begin{matrix} 4 \\ 5 \\6 \end{matrix} \right]_{3×1} = 1×4 + 2×5 + 3×6 =32[123]1×34563×1=1×4+2×5+3×6=32

[123]3×1[456]1×3=[45681012121518]3×3\left[ \begin{matrix} 1 \\ 2 \\3 \end{matrix} \right]_{3×1} \left[ \begin{matrix} 4 & 5 & 6 \end{matrix} \right] _{1×3} = \left[ \begin{matrix} 4 & 5 & 6\\ 8 & 10 & 12\\12 & 15 & 18 \end{matrix} \right]_{3×3}1233×1[456]1×3=481251015612183×3

矩阵的乘法不满足交换律,但仍然满足结合律和分配律:

  1. (AB)C=A(BC)(AB)C = A(BC)(AB)C=A(BC)

  2. λ(AB)=(λA)B=A(λB)(其中λ为实数)\lambda (AB) = (\lambda A)B = A(\lambda B) \quad (其中\lambda为实数)λ(AB)=(λA)B=A(λB)(其中λ为实数)

  3. A(B+C)=AB+AC,(B+C)A=BA+CAA(B+C) = AB + AC,\quad (B+C)A = BA +CAA(B+C)=AB+AC,(B+C)A=BA+CA

转置

矩阵AAA的转置矩阵,记作ATA^TAT,是将AAA的行列互换后所得矩阵,如果AAA是一个m×nm ×nm×n阶矩阵,ATA^TAT是一个n×mn×mn×m阶矩阵。

A=[142536]AT=[123456]A = \left[ \begin{matrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{matrix} \right] A^T = \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{matrix} \right]A=123456AT=[142536]

矩阵的转置的性质

  1. (AT)T=A(A^T)^T = A(AT)T=A
  2. (A+B)T=AT+BT(A+B)^T = A^T +B^T(A+B)T=AT+BT
  3. (λA)T=λAT(\lambda A)^T=\lambda A^T(λA)T=λAT
  4. (AB)T=BTAT(AB)^T = B^TA^T(AB)T=BTAT

对称矩阵

定义 一个n×nn \times nn×n的矩阵AAA,若满足AT=AA^T =AAT=A,则称AAA对称矩阵(symmetric matrix),简称对称阵。其特点为:它的元素以对角线为对称轴对应相等。

设列矩阵X=(x1,x2,⋯,xn)TX=(x_1,x_2,\cdots,x_n)^TX=(x1,x2,,xn)T满足XTX=1X^TX=1XTX=1EEEnnn阶单位阵,H=E−2XXTH = E – 2XX^TH=E2XXT,证明HHH是对称阵,且HHT=EHH^T=EHHT=E

注意:XTXX^TXXTX = x12+x22+⋯+xn2x_1^2 + x_2^2 + \cdots + x_n^2x12+x22++xn2是一阶方阵,也就是一个数,而XXTXX^TXXTnnn阶方阵。


HT=(E−2XXT)T=ET−2(XXT)T=E−2XXT=H\begin{aligned} H^T &= (E – 2XX^T)^T \\ &=E^T -2(XX^T)^T \\ &= E – 2XX^T = H \end{aligned} HT=(E2XXT)T=ET2(XXT)T=E2XXT=H
所以HHH是对称阵。
HHT=H2=(E−2XXT)2=E−4XXT+4(XXT)(XXT)=E−4XXT+4X(XTX)XT=E−4XXT+4XXT=E\begin{aligned} HH^T &= H^2 = (E -2XX^T)^2 \\ &= E – 4XX^T + 4(XX^T)(XX^T) \\ &= E – 4XX^T + 4X(X^TX)X^T \\ &= E – 4XX^T + 4XX^T = E \end{aligned} HHT=H2=(E2XXT)2=E4XXT+4(XXT)(XXT)=E4XXT+4X(XTX)XT=E4XXT+4XXT=E

实对称矩阵

如果有nnn阶矩阵AAA,其矩阵的元素都为实数,且矩阵AAA的转置等于其本身,则称AAA为实对称矩阵。

主要性质:

  1. 实对称矩阵AAA的不同特征值对应的特征向量是正交的。
  2. 实对称矩阵AAA的特征值都是实数。
  3. nnn阶实对称矩阵AAA必可相似对角化,且相似对角阵上的元素即为矩阵本身特征值。
  4. AAA具有kkk重特征值λ0\lambda_0λ0,必有kkk个线性无关的特征向量,或者说秩r(λ0E−A)r(\lambda_0 E-A)r(λ0EA)必为n−kn-knk,其中EEE为单位矩阵。
  5. 实对称矩阵AAA一定可正交相似对角化。

单位矩阵

如同数1位实数乘法中的单位元一样,也存在一个特殊矩阵EEE是矩阵乘法中的单位元,即
EA=AE=AEA = AE = A EA=AE=A
对任意n×nn \times nn×n的矩阵AAA都成立。

定义 n×nn \times nn×n的单位矩阵为矩阵E=(δij)E = (\delta_{ij})E=(δij),其中
δij={1当i=j0当i≠j\delta_{ij} = \left\{ \begin{array}{lr} 1 & 当 \,\, i =j\\ 0 & 当 \,\, i \neq j \end{array} \right. δij={10i=ji=j

即主对角元素均为111,其他元素均为000n×nn \times nn×n矩阵。

一般地,若BBB为任一m×nm \times nm×n矩阵,且CCC为任一n×rn \times rn×r矩阵,则
BE=B且EC=CBE = B \,\,\,\, \text{且} \,\,\,\, EC = C BE=BEC=C

n×nn \times nn×n单位矩阵EEE的列向量为用于定义nnn维欧几里得坐标空间的标准向量。EEE的第jjj列向量的标准记号为eje_jej。因此,n×nn \times nn×n单位矩阵可写为
E=(e1,e2,⋯,en)E = (e_1,e_2,\cdots,e_n) E=(e1,e2,,en)

矩阵的迹

nnn阶方阵AAA的迹(trace)记作tr(A)tr(A)tr(A),是对角元素之和:
tr(A)=a11+a22+⋯+ann=∑i=1naiitr(A) = a_{11} + a_{22} + \cdots + a_{nn} = \sum_{i=1}^n a_{ii} tr(A)=a11+a22++ann=i=1naii

性质::

  1. 迹是所有特征值的和
  2. tr(AB)=tr(BA)tr(AB)=tr(BA)tr(AB)=tr(BA)
  3. 若矩阵AAA与矩阵BBB相似,则tr(A)=tr(B)tr(A)=tr(B)tr(A)=tr(B)

共轭矩阵

首先回顾下复数的概念,复数是实数的延伸,它使任意多项式方程都有跟。复数当中有个虚数单位iii,它是−1-11的一个平方根,即i2=−1i^2=-1i2=1

任一复数都可以表达为a+bia+bia+bi,其中aaabbb皆为实数,分别称为复数的实部和虚部。

复数z=a+biz = a+biz=a+bi的模为∣z∣=a2+b2|z| = \sqrt{a^2 +b^2}z=a2+b2

z=a+biz = a+biz=a+bi的共轭复数定义为z=a−biz = a-biz=abi,即两个实部相等,虚部互为相反数。记作z‾\overline{z}z。有

  • z+w‾=z‾+w‾\overline{z+w} = \overline{z} + \overline{w}z+w=z+w
  • zw‾=z‾⋅w‾\overline{zw}=\overline{z}\cdot \overline{w}zw=zw
  • (zw)‾=z‾w‾\overline{\left( \frac{z}{w} \right)}=\frac{\overline{z}}{\overline{w}}(wz)=wz
  • z‾‾=z\overline{\overline{z}}=zz=z
  • z‾=z当且仅当z是实数\overline{z} =z \quad 当且仅当z是实数z=z当且仅当z是实数
  • ∣z∣2=zz‾|z|^2 = z \overline{z}z2=zz

当虚部不为零时,共轭复数就是实部相等,虚部相反;

如果虚部为零,其共轭复数就是自身。即实数的共轭复数就是自身。

A=(aij)A=(a_{ij})A=(aij)为复矩阵时,用a‾ij\overline{a}_{ij}aij表示aija_{ij}aij的共轭复数,记
A‾=(a‾ij),\overline{A} = (\overline{a}_{ij}), A=(aij),
A‾\overline{A}A称为AAA的共轭矩阵。

共轭矩阵满足下述运算规律(A,BA,BA,B为复矩阵,λ\lambdaλ为复数):

  1. A+B‾=A‾+B‾\overline{A+B}=\overline{A} + \overline{B}A+B=A+B
  2. λA‾=λ‾A‾\overline{\lambda A} = \overline{\lambda} \overline{A}λA=λA
  3. AB‾=A‾B‾\overline{AB}=\overline{A}\overline{B}AB=AB

埃尔米特矩阵

AAA的共轭矩阵A‾\overline{A}A的转置记为AHA^HAH

定义 若一个矩阵AAA满足A=AHA =A^HA=AH,则称它为埃尔米特矩阵(Hermitian)。