第五节 矩阵的初等变换与初等矩阵
在本章第一节中,我们曾经指出,对方程组施行初等变换相当于对方程组的系数与常数项构成的增广矩阵施行类似的初等变换。对矩阵施行的这些类似的变换,称之为矩阵的初等变换。
矩阵的初等变换不仅用于求解线性方程组,而且还将被用于求逆矩阵、矩阵的秩、以及求向量组的极大无关组等。同时,与初等变换有关的初等矩阵,也是线性代数理论中的一个重要的分析工具。
一、矩阵的初等变换
下面给出矩阵的初等变换的定义。
定义2.8 对矩阵的行(列)施行的下列三种变换,称为矩阵的初等变换(Elementary transformation of matrices):
(1)交换矩阵中两行(列)元素的位置;
(2)用一个非零常数乘以矩阵的某一行(列)中的每个元素;
(3)将矩阵的某一行(列)的元素乘以同一个数,并加到矩阵的另一行(列)上去。
矩阵的以上三种初等行变换通常分别记为ri↔rj,k×ri或ri+l×rj。对初等列变换也可给出相应的记号。
定理2.3 设A是任意m×n矩阵,通过初等行变换和第一种列变换总能把矩阵A化为
的形式。进一步地,再通过初等行变换还可把A1化为
其中,A1的左上角是一个r阶的上三角矩阵,A2的左上角是一个r阶的单位矩阵,r≥0且r≤m,r≤n。A1,A2中的“*”代表元素,不同位置上的元素“*”不必相同。
下面通过实际例子说明具体化法。
【例2.13】 用初等行变换和第一种列变换把矩阵A化为A1,A2的形式
解 首先将第1行与第2行对调,然后用左上角的非零元素a11把第1列的其它元素化为零,即
接着对矩阵B的第2行到第4行,第2列到第5列的元素构成的子矩阵施行同样的初等行变换,并以此方式进行下去,则得
即通过一些列的初等行变换,矩阵化为阶梯形矩阵。接着
在对调前一矩阵的第3列与第4列的元素以后,矩阵A已化为A1的形式。再作两步初等行变换还可以进一步将矩阵A1化为A2的形式
可见,经过一些列的初等行变换与第一种初等列变换以后,任意矩阵都可以化成形如A1的阶梯形或者形如A2的简化阶梯形矩阵的形式。
这个结论以及将任意矩阵,利用初等行变换方法化为阶梯形或者简化阶梯形矩阵,这在线性方程组的求解,计算向量组与矩阵的秩(见第三章第三、四节与第四章)等许多代数问题中都将起到很重要的作用。
此外,如果我们对简化阶梯形矩阵A2继续作初等列变换,又能将其化成什么更简洁的形式呢?
推论2.2 设A为任一m×n阶矩阵,通过初等行、列变换(不只限于第一种列变换!)则可以将A化为
的形式,称A3为矩阵A的规范形(Normal form of a matrix)。
例如,在例2.13中,经过一系列的初等行变换与第一种列变换,已得
接着再做下面的列变换:将第2列的1倍加到第4列,以及将第1列的-7倍,第2列的5倍和第3列的-2倍加到最后一列上去,则可将矩阵A化为规范形。
最后特别强调一下,经过初等变换变化前后的矩阵是不同的矩阵,所以我们用一个“箭头线”表示前后两个矩阵之间的这种变化关系。有些“粗心”的学习者,把变换前后的矩阵关系误认为是相等的关系,这显然是不对的。
虽然经过初等变换变化前后的矩阵是不相等的矩阵,但是无论在线性方程组求解,下一章中将要讨论到的求向量组或者矩阵的秩,甚至在更多的其他代数相关问题中,这样的两个矩阵之间都具有很多的“等价性”。只有理解了这种等价性,才能更明了对矩阵施行初等变换的意义与作用之所在。
二、初等矩阵
矩阵的初等变换也可以用矩阵的运算来等价地描述。为此要介绍初等矩阵的概念。
定义2.9 由单位矩阵经过一次初等变换而得到的矩阵称为初等矩阵(Elementary matrix)。
初等矩阵都是方阵,它有三种类型
和
初等矩阵有下面的两个重要性质。
性质2.7 设A是m×n的任意矩阵,在A的左边乘上一个m阶初等矩阵就相当于对矩阵A作相应的初等行变换;在A的右边乘上一个n阶初等矩阵则就相当于对矩阵A作相应的初等列变换。即
(1)E(i,j))A相当于交换A的i,j两行;
(2)E(i(k))A相当于A的i行乘以非零常数k;
(3)E(i,j(l))A相当于把A的j行的l倍加到i行上去;
同样还有:
(4)AE(i,j)相当于交换A的i,j两列;
(5)AE(i(k))相当于A的i列乘以非零常数k;
(6)AE(i,j(l))相当于把A的i列的l倍加到j列上去。
其中乘在左边的初等矩阵都是m阶的,乘在右边的初等矩阵都是n阶的。我们尤其提请大家注意左乘与右乘的差别[比如性质2.7结论中的(3)与(6)]。
性质2.7 可以直接验证。例如
其它各条性质可同样验证。
性质2.8 每一种初等矩阵都是可逆的,且
E(i,j)-1=E(i,j)
E(i,j(l))-1=E(i,j(-l))
即初等矩阵的逆矩阵仍是初等矩阵,并且每一种初等矩阵的逆矩阵还是同一种初等矩阵。
证 只证明上面的第三个结论。事实上,因为
E(i,j(-l))E(i,j(l))E=E(i,j(-l))E(i,j(l))=E
这是由于上式最左边一项可以理解为对单位矩阵E依次左乘两个初等矩阵E(i,j(l))和E(i,j(-l)),而左乘一个初等矩阵相当于对单位矩阵E做一次初等变换。对单位矩阵E,先后将其第j行的l倍与-l倍分别加到它的第i行上去以后,结果当然仍然是单位矩阵E本身。所以
E(i,j(l))-1=E(i,j(-l))
其余两个性质也不难类似证明。请读者自己完成。
利用初等矩阵的概念,本节的定理2.3及其推论2.2又可进一步表述为:
定理2.4 设A是任一m×n的矩阵,则必定存在一系列的m阶初等矩阵P1,P2,…Pk以及n阶初等矩阵Q1,Q2,…,Ql使得