行列式 是数学 中的一个函数 ,将一个
n
×
n
{\displaystyle n\times n}
的矩阵
A
{\displaystyle A}
映射到一个纯量 ,记作
det
(
A
)
{\displaystyle \det(A)}
或
|
A
|
{\displaystyle |A|}
。行列式可以看做是有向 面积 或体积 的概念在一般的欧几里得空间 中的推广。或者说,在
n
{\displaystyle n}
维 欧几里得空间中,行列式描述的是一个线性变换 对“体积”所造成的影响。无论是在线性代数 、多项式 理论,还是在微积分学 中(比如说换元积分法 中),行列式作为基本的数学工具,都有着重要的应用。
行列式概念最早出现在解线性方程组 的过程中。十七世纪晚期,关孝和 与莱布尼茨 的著作中已经使用行列式来确定线性方程组解的个数以及形式。十八世纪开始,行列式开始作为独立的数学概念被研究。十九世纪以后,行列式理论进一步得到发展和完善。矩阵 概念的引入使得更多有关行列式的性质被发现,行列式在许多领域都逐渐显现出重要的意义和作用,出现了线性自同态 和向量组 的行列式的定义。
行列式的本质可以被概括为一个交替多线性形式 ,这个本质使得行列式在欧几里德空间中可以成为描述“体积”的函数[ 1] :92 。
矩阵A 的行列式记作det(A )或|A |。有些著作中,矩阵范数 也使用|A |的记法,有可能和行列式的记法混淆。不过,在大部分涉及行列式的地方,为了区别,通常会用双垂线表示矩阵的范数,或者在垂线记法中使用下标,标明范数性质,而行列式的垂线记法是不会有下标的。在不至于混淆的上下文中,经常使用垂线记法表记行列式。而当明确写出矩阵元素的时候,一般使用垂线记法。
例如若有矩阵
A
=
[
a
b
c
d
e
f
g
h
i
]
{\displaystyle A={\begin{bmatrix}a&b&c\\d&e&f\\g&h&i\end{bmatrix}}}
,则其行列式
det
(
A
)
{\displaystyle \det(A)}
不仅可以写作
|
A
|
{\displaystyle |A|}
,也可以明确写作
|
a
b
c
d
e
f
g
h
i
|
.
{\displaystyle {\begin{vmatrix}a&b&c\\d&e&f\\g&h&i\end{vmatrix}}.}
即把矩阵的方括号以细长的垂线取代,表示该矩阵的行列式[ 2] :2-5 [ 3] :38 。
对于简单的2阶和3阶的矩阵,行列式的表达式相对简单,而且恰好是每条主对角线 (左上至右下)元素乘积之和减去每条副对角线(右上至左下)元素乘积之和(见图中红线和蓝线)。
2阶矩阵的行列式:
|
a
11
a
12
a
21
a
22
|
=
a
11
a
22
−
a
12
a
21
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}}=a_{11}a_{22}-a_{12}a_{21}}
[ 4] :34
3阶矩阵的行列式:
|
a
11
a
12
a
13
a
21
a
22
a
23
a
31
a
32
a
33
|
=
a
11
a
22
a
33
+
a
12
a
23
a
31
+
a
13
a
21
a
32
−
a
13
a
22
a
31
−
a
11
a
23
a
32
−
a
12
a
21
a
33
{\displaystyle \displaystyle {\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}}=a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}-a_{13}a_{22}a_{31}-a_{11}a_{23}a_{32}-a_{12}a_{21}a_{33}}
[ 4] :35
三阶矩阵的行列式为每条红线上的元素的乘积之和,减去蓝线上元素乘积之和。
行列式的一个自然的源起是n 维平行体的体积。行列式的定义和n 维平行体的体积有着本质上的关联[ 1] :92 。在二维与三维实 欧几里德空间 中,可以直观地感受到这种关联。
行列式是向量形成的平行四边形的面积
在一个二维平面 上,考虑两个向量
X
1
=
(
x
1
,
y
1
)
{\displaystyle X_{1}=(x_{1},y_{1})}
和
X
2
=
(
x
2
,
y
2
)
{\displaystyle X_{2}=(x_{2},y_{2})}
。以它们为邻边,可以确定一个平行四边形
D
X
1
,
X
2
{\displaystyle D_{X_{1},X_{2}}}
。定义平行四边形的有向面积为:如果以原点 为轴点将
X
1
{\displaystyle X_{1}}
逆时针转动到
X
2
{\displaystyle X_{2}}
所在方向时,经过平行四边形内部,则平行四边形面积为正,否则为负。则经计算可知,平行四边形
D
X
1
,
X
2
{\displaystyle D_{X_{1},X_{2}}}
的有向面积是
S
(
D
X
1
,
X
2
)
=
x
1
y
2
−
x
2
y
1
{\displaystyle S(D_{X_{1},X_{2}})=x_{1}y_{2}-x_{2}y_{1}}
,正等于以
X
1
{\displaystyle X_{1}}
和
X
2
{\displaystyle X_{2}}
为列向量构成的矩阵的行列式:{r|hme|page1=34}}
det
(
X
1
,
X
2
)
=
|
x
1
x
2
y
1
y
2
|
=
x
1
y
2
−
x
2
y
1
.
{\displaystyle \det(X_{1},X_{2})={\begin{vmatrix}x_{1}&x_{2}\\y_{1}&y_{2}\end{vmatrix}}=x_{1}y_{2}-x_{2}y_{1}.}
比如说,两个向量
X
1
=
(
2
,
1
)
{\displaystyle X_{1}=(2,1)}
和
X
2
=
(
3
,
4
)
{\displaystyle X_{2}=(3,4)}
构成的平行四边形,它的有向面积是:
det
(
X
1
,
X
2
)
=
|
2
3
1
4
|
=
2
⋅
4
−
3
⋅
1
=
5.
{\displaystyle \det(X_{1},X_{2})={\begin{vmatrix}2&3\\1&4\end{vmatrix}}=2\cdot 4-3\cdot 1=5.}
如果两个向量处在同一直线上,则它们的系数成比例,也就是说,存在不全为零的系数a,b 使得
a
x
1
=
b
x
2
,
a
y
1
=
b
y
2
{\displaystyle ax_{1}=bx_{2},\,ay_{1}=by_{2}}
。这时
a
(
x
1
y
2
−
x
2
y
1
)
=
a
x
1
⋅
y
2
−
x
2
⋅
a
y
1
=
b
x
2
y
2
−
x
2
b
y
2
=
0
=
x
1
a
y
1
−
a
x
1
y
1
=
x
1
⋅
b
y
2
−
b
x
2
⋅
y
1
=
b
(
x
1
y
2
−
x
2
y
1
)
.
{\displaystyle {\begin{aligned}a(x_{1}y_{2}-x_{2}y_{1})&=ax_{1}\cdot y_{2}-x_{2}\cdot ay_{1}=bx_{2}y_{2}-x_{2}by_{2}=0\\&=x_{1}ay_{1}-ax_{1}y_{1}=x_{1}\cdot by_{2}-bx_{2}\cdot y_{1}=b(x_{1}y_{2}-x_{2}y_{1}).\end{aligned}}}
所以行列式
x
1
y
2
−
x
2
y
1
=
0
{\displaystyle x_{1}y_{2}-x_{2}y_{1}=0}
。几何直观上,平行四边形退化成线段,面积为零。
在三维的有向空间 中,考虑三个三维向量
X
1
=
(
x
1
,
y
1
,
z
1
)
{\displaystyle X_{1}=(x_{1},y_{1},z_{1})}
、
X
2
=
(
x
2
,
y
2
,
z
2
)
{\displaystyle X_{2}=(x_{2},y_{2},z_{2})}
和
X
3
=
(
x
3
,
y
3
,
z
3
)
{\displaystyle X_{3}=(x_{3},y_{3},z_{3})}
。它们可以确定一个平行六面体
D
X
1
,
X
2
,
X
3
{\displaystyle D_{X_{1},X_{2},X_{3}}}
。假设空间的定向遵循右手定则 ,则经计算可知,这个平行六面体的有向体积为
V
(
D
X
1
,
X
2
,
X
3
)
=
x
1
y
2
z
3
+
x
2
y
3
z
1
+
x
3
y
1
z
2
−
x
1
y
3
z
2
−
x
2
y
1
z
3
−
x
3
y
2
z
1
{\displaystyle V(D_{X_{1},X_{2},X_{3}})=x_{1}y_{2}z_{3}+x_{2}y_{3}z_{1}+x_{3}y_{1}z_{2}-x_{1}y_{3}z_{2}-x_{2}y_{1}z_{3}-x_{3}y_{2}z_{1}}
,正等于以
X
1
{\displaystyle X_{1}}
、
X
2
{\displaystyle X_{2}}
和
X
3
{\displaystyle X_{3}}
为列向量构成的矩阵的行列式。
det
(
X
1
,
X
2
,
X
3
)
=
|
x
1
x
2
x
3
y
1
y
2
y
3
z
1
z
2
z
3
|
=
x
1
y
2
z
3
+
x
2
y
3
z
1
+
x
3
y
1
z
2
−
x
1
y
3
z
2
−
x
2
y
1
z
3
−
x
3
y
2
z
1
.
{\displaystyle \det(X_{1},X_{2},X_{3})={\begin{vmatrix}x_{1}&x_{2}&x_{3}\\y_{1}&y_{2}&y_{3}\\z_{1}&z_{2}&z_{3}\end{vmatrix}}=x_{1}y_{2}z_{3}+x_{2}y_{3}z_{1}+x_{3}y_{1}z_{2}-x_{1}y_{3}z_{2}-x_{2}y_{1}z_{3}-x_{3}y_{2}z_{1}.}
[ 4] :35
比如,三个向量
X
1
=
(
2
,
1
,
5
)
{\displaystyle X_{1}=(2,1,5)}
、
X
2
=
(
6
,
0
,
8
)
{\displaystyle X_{2}=(6,0,8)}
和
X
3
=
(
3
,
2
,
4
)
{\displaystyle X_{3}=(3,2,4)}
确定的平行六面体的体积是:
det
(
X
1
,
X
2
,
X
3
)
=
|
2
6
3
1
0
2
5
8
4
|
=
2
⋅
0
⋅
4
+
6
⋅
2
⋅
5
+
3
⋅
1
⋅
8
−
2
⋅
2
⋅
8
−
6
⋅
1
⋅
4
−
3
⋅
0
⋅
5
=
28
{\displaystyle \det(X_{1},X_{2},X_{3})={\begin{vmatrix}2&6&3\\1&0&2\\5&8&4\end{vmatrix}}=2\cdot 0\cdot 4+6\cdot 2\cdot 5+3\cdot 1\cdot 8-2\cdot 2\cdot 8-6\cdot 1\cdot 4-3\cdot 0\cdot 5=28}
在以上的例子中,我们不加选择地将向量在所谓的正交基 (即直角坐标系 )下分解,实际上在不同的基底 之下,行列式的值并不相同。这并不表示平行四边形或平行六面体的体积不唯一。恰恰相反,它说明了面积和体积的概念依赖于衡量空间的尺度,也就是基底的选取方式。不同基底之间的变换可以看作作用在基底上的线性映射 ,而不同基底下的行列式代表了基底变换映射 对向量组构成的平行体体积的影响。可以证明,对于所有同定向的标准正交基 ,向量组的行列式是一样的。而不同定向的正交基只会改变行列式的符号[ 3] :283 。只要选择的基底都是“单位长度”,并且两两正交 ,那么在这样的基底下,向量组所构成平行体体积的绝对值是同一个[ 5] :136-140 。
经线性映射后的正方体
设E 是一个一般的n 维的有向欧几里得空间 。一个线性变换把一个向量线性地变为另一个向量。比如说,在三维空间中,向量(x, y, z )被映射到向量(x', y', z' ):
x
′
=
a
1
x
+
b
1
y
+
c
1
z
y
′
=
a
2
x
+
b
2
y
+
c
2
z
z
′
=
a
3
x
+
b
3
y
+
c
3
z
{\displaystyle {\begin{matrix}x'=a_{1}x+b_{1}y+c_{1}z\\y'=a_{2}x+b_{2}y+c_{2}z\\z'=a_{3}x+b_{3}y+c_{3}z\end{matrix}}}
其中a 、b 、c 是系数。如右图,正方体(可以看作原来的一组基形成的)经线性变换后可以变成一个普通的平行六面体,或变成一个平行四边形(没有体积)。这两种情况表示了两种不同的线性变换,行列式可以将其很好地分辨出来(为零或不为零)。
更详细地说,行列式表示的是线性变换前后平行六面体的体积的变化系数。如果设左边的正方体体积是一,那么中间的平行六面体的(有向)体积就是线性变换的行列式的值,右边的平行四边形体积为零,同时可以通过计算得出线性变换的行列式为零。这里我们混淆了线性变换的行列式和向量组的行列式,但两者是一样的,因为我们在对基底作变换[ 6] :234-235 。
二维和三维行列式的例子中,行列式被解释为向量形成的图形的面积或体积。面积或体积的定义是恒正的,而行列式是有正有负的,因此需要引入有向面积和有向体积的概念。负的面积或体积在物理学中可能难以理解,但在数学中,它们和有向角 的概念类似,都是对空间镜面对称特性的一种刻画。如果行列式表示的是线性变换对体积的影响,那么行列式的正负就表示了空间的定向[ 5] :132 。
如上图中,左边的黄色骰子(可以看成有单位的有向体积的物体)在经过了线性变换后变成中间绿色的平行六面体,这时行列式为正,两者是同定向的 ,可以通过旋转和拉伸从一个变成另一个。而骰子和右边的红色平行六面体之间也是通过线性变换得到的,但是无论怎样旋转和拉伸,都无法使一个变成另一个,一定要通过镜面反射才行。这时两者之间的线性变换的行列式是负的。可以看出,线性变换可以分为两类,一类对应着正的行列式,保持空间的定向不变,另一类对应负的行列式,颠倒空间的定向[ 5] :132 [ 1] :92-93 [ 7] 。
由二维及三维的例子,可以看到一般域上的行列式应该具有怎样的性质。在n 维欧几里得空间中,作为n 个向量构成的“平行多面体”的“体积”的概念的推广,行列式继承了“体积”函数的性质。首先,行列式需要是线性 的,这可以由面积和体积的性质类比得到。这里的线性是对于每一个向量来说的,因为当一个向量变为原来的k 倍时,“平行多面体”的“体积”也变为原来的k 倍。其次,当一个向量在其它向量组成的“超平面 ”上时,n 维“平行多面体”的“体积”是零(可以想像三维空间的例子)。也就是说,当向量线性相关 时,行列式为零。在一般系数域上的线性空间中,符合这样特性的函数叫做交替多线性形式:
设有系数域为K 的n 维线性空间 E 。E 上的交替n- 线性形式 是指满足以下性质的函数
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
[ 5] :102 :
n -线性:对任意的系数
k
∈
K
{\displaystyle k\in K}
以及任意一个下标
i
∈
{
1
,
2
,
⋯
,
n
}
{\displaystyle i\in \{1,2,\cdots ,n\}}
,都有
D
(
a
1
,
⋯
,
k
a
i
+
a
i
′
,
⋯
,
a
n
)
=
k
D
(
a
1
,
⋯
,
a
i
,
⋯
,
a
n
)
+
D
(
a
1
,
⋯
,
a
i
′
,
⋯
,
a
n
)
,
{\displaystyle D(a_{1},\cdots ,ka_{i}+a_{i}',\cdots ,a_{n})=kD(a_{1},\cdots ,a_{i},\cdots ,a_{n})+D(a_{1},\cdots ,a_{i}',\cdots ,a_{n}),}
交替性:如果
a
i
=
a
j
{\displaystyle a_{i}=a_{j}}
,那么
D
(
a
1
,
⋯
,
a
i
,
⋯
,
a
j
,
⋯
,
a
n
)
=
0.
{\displaystyle D(a_{1},\cdots ,a_{i},\cdots ,a_{j},\cdots ,a_{n})=0.}
由这两个性质可以直接推出:如果n 个向量中的某一个可以通过其余向量的线性组合表示:
a
i
=
∑
j
≠
i
ω
j
a
j
{\displaystyle a_{i}=\sum _{j\neq i}\omega _{j}a_{j}}
,则:
D
(
a
1
,
a
2
,
⋯
,
a
i
,
⋯
,
a
n
)
=
D
(
a
1
,
⋯
,
∑
j
≠
i
ω
j
a
j
,
⋯
,
a
n
)
=
∑
j
≠
i
ω
j
D
(
a
1
,
⋯
,
a
j
,
⋯
,
a
j
,
⋯
,
a
n
)
=
0
{\displaystyle D(a_{1},a_{2},\cdots ,a_{i},\cdots ,a_{n})=D(a_{1},\cdots ,\sum _{j\neq i}\omega _{j}a_{j},\cdots ,a_{n})=\sum _{j\neq i}\omega _{j}D(a_{1},\cdots ,a_{j},\cdots ,a_{j},\cdots ,a_{n})=0}
这正符合对“体积”概念的刻画。
所有E 上的交替n- 线性形式的集合记作An (E )。可以证明,An (E )的维度是1,其中所有的元素都可以表达成某个元素的倍数。
如果给定E 的一个基底
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
,则可以为E 上的交替n- 线性形式进行具体刻画。所有的交替n- 线性形式
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
都可以写成
D
=
ν
D
⋅
ω
B
{\displaystyle D=\nu _{D}\cdot \operatorname {\omega } _{B}}
的形式。其中的
ν
D
∈
K
{\displaystyle \nu _{D}\in K}
是一个只与D 有关的系数,
ω
B
{\displaystyle \omega _{B}}
是一个固定的交替n- 线性形式:
∀
(
a
1
,
⋯
,
a
n
)
∈
E
n
,
ω
B
(
a
1
,
⋯
,
a
n
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
j
=
1
n
a
σ
(
j
)
,
j
∈
K
{\displaystyle \forall (a_{1},\cdots ,a_{n})\in E^{n},\,\,\operatorname {\omega } _{B}(a_{1},\cdots ,a_{n})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{j=1}^{n}a_{\sigma (j),j}\in K}
其中
a
j
=
∑
i
=
1
n
a
i
,
j
e
i
{\displaystyle a_{j}=\sum _{i=1}^{n}a_{i,j}e_{i}}
是
a
j
{\displaystyle a_{j}}
在基底
B
{\displaystyle B}
下的展开[ 3] :43-46 [ 5] :102 。
证明 :
对任一个n- 线性形式
D
:
E
n
→
K
{\displaystyle D:E^{n}\to K}
,对给定的
a
∈
K
{\displaystyle a\in K}
,考虑将D (a )依照多线性性质展开:
D
(
a
)
=
D
(
a
1
,
⋯
,
a
n
)
=
D
(
∑
i
1
=
1
n
a
i
1
,
1
e
i
1
,
…
,
∑
i
n
=
1
n
a
i
n
,
n
e
i
n
)
=
∑
i
1
=
1
n
⋯
∑
i
n
=
1
n
∏
j
=
1
n
a
i
j
,
j
D
(
e
i
1
,
…
,
e
i
n
)
{\displaystyle D(a)=D(a_{1},\cdots ,a_{n})=D\left(\sum _{i_{1}=1}^{n}a_{i_{1},1}e_{i_{1}},\dots ,\sum _{i_{n}=1}^{n}a_{i_{n},n}e_{i_{n}}\right)=\sum _{i_{1}=1}^{n}\cdots \sum _{i_{n}=1}^{n}\prod _{j=1}^{n}a_{i_{j},j}D(e_{i_{1}},\dots ,e_{i_{n}})}
这时,由交替性,
D
(
e
i
1
,
⋯
,
e
i
n
)
≠
0
{\displaystyle D(e_{i_{1}},\cdots ,e_{i_{n}})\neq 0}
当且仅当
i
1
,
⋯
,
i
n
{\displaystyle i_{1},\cdots ,i_{n}}
是
1
,
⋯
,
n
{\displaystyle 1,\cdots ,n}
的一个排列,所以有
D
(
a
1
,
⋯
,
a
n
)
=
∑
(
i
1
,
⋯
,
i
n
)
=
σ
(
1
,
2
,
⋯
,
n
)
σ
∈
S
n
∏
j
=
1
n
a
i
j
,
j
D
(
e
i
1
,
⋯
,
e
i
n
)
=
∑
σ
∈
S
n
∏
j
=
1
n
a
σ
(
j
)
,
j
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
{\displaystyle D(a_{1},\cdots ,a_{n})=\sum _{{(i_{1},\cdots ,i_{n})=\sigma (1,2,\cdots ,n)} \atop {\sigma \in {\mathfrak {S}}_{n}}}\prod _{j=1}^{n}a_{i_{j},j}D(e_{i_{1}},\cdots ,e_{i_{n}})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\prod _{j=1}^{n}a_{\sigma (j),j}D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})}
从交替性还可以推出,
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
{\displaystyle D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})}
和
D
(
e
1
,
⋯
,
e
n
)
{\displaystyle D(e_{1},\cdots ,e_{n})}
之间只相差一个正负号,因此可以将每一个
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
{\displaystyle D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})}
写作一个符号系数与
D
(
e
1
,
⋯
,
e
n
)
{\displaystyle D(e_{1},\cdots ,e_{n})}
的乘积:
∀
σ
∈
S
n
,
∃
ϵ
σ
∈
{
+
1
,
−
1
}
,
{\displaystyle \forall \sigma \in {\mathfrak {S}}_{n},\,\,\exists \epsilon _{\sigma }\in \{+1,-1\},}
使得
D
(
e
σ
(
1
)
,
⋯
,
e
σ
(
n
)
)
=
ϵ
σ
D
(
e
1
,
⋯
,
e
n
)
,
{\displaystyle D(e_{\sigma (1)},\cdots ,e_{\sigma (n)})=\epsilon _{\sigma }D(e_{1},\cdots ,e_{n}),}
而其中的符号系数
ϵ
σ
{\displaystyle \epsilon _{\sigma }}
取决于将排列
(
σ
(
1
)
,
σ
(
2
)
,
⋯
,
σ
(
n
)
)
{\displaystyle (\sigma (1),\sigma (2),\cdots ,\sigma (n))}
经过两个元素的“对调”变换得到
(
1
,
2
,
⋯
,
n
)
{\displaystyle (1,2,\cdots ,n)}
所需要的次数。根据群论 中的相关定理 可知,这个次数的奇偶性是由
σ
{\displaystyle \sigma }
本身唯一确定的。如果需要偶数 次,则
ϵ
σ
=
1
{\displaystyle \epsilon _{\sigma }=1}
;如果需要奇数次,则
ϵ
σ
=
−
1
{\displaystyle \epsilon _{\sigma }=-1}
。这个系数
ϵ
σ
{\displaystyle \epsilon _{\sigma }}
在群论中被记为
sgn
(
σ
)
{\displaystyle \operatorname {sgn}(\sigma )}
,所以D (a )最终可以表示为:
D
(
a
1
,
⋯
,
a
n
)
=
D
(
e
1
,
⋯
,
e
n
)
⋅
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
σ
(
i
)
,
i
=
ν
D
ω
B
{\displaystyle {\begin{aligned}D(a_{1},\cdots ,a_{n})&=D(e_{1},\cdots ,e_{n})\cdot \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i),i}\\&=\nu _{D}\operatorname {\omega } _{B}\end{aligned}}}
这里,
ν
D
=
D
(
e
1
,
⋯
,
e
n
)
{\displaystyle \nu _{D}=D(e_{1},\cdots ,e_{n})}
是一个仅和D 有关的系数,
ω
B
:
(
a
1
,
⋯
,
a
n
)
↦
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
σ
(
i
)
,
i
{\displaystyle \operatorname {\omega } _{B}:\,(a_{1},\cdots ,a_{n})\mapsto \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i),i}}
是一个固定的交替n- 线性形式。
设
B
=
(
e
1
,
⋯
,
e
n
)
{\displaystyle B=(e_{1},\cdots ,e_{n})}
是E 的一个基底,基底B 下的行列式函数 就是上述证明中的
ω
B
{\displaystyle \operatorname {\omega } _{B}}
。
定义 :
E 上的一个基底
B
=
(
e
1
,
⋯
,
e
n
)
{\displaystyle {\mathit {B}}=(e_{1},\cdots ,e_{n})}
下的行列式函数是唯一 一个满足:
det
B
(
e
1
,
⋯
,
e
n
)
=
1
{\displaystyle \det {}_{\mathit {B}}(e_{1},\cdots ,e_{n})=1}
的交替n- 线性形式
det
B
:
E
n
→
K
{\displaystyle \det {}_{\mathit {B}}:E^{n}\to K}
。其具体形式为:
det
B
:
(
a
1
,
⋯
,
a
n
)
↦
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
σ
(
i
)
,
i
{\displaystyle \det {}_{B}:\,(a_{1},\cdots ,a_{n})\mapsto \sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i),i}}
其中
a
j
=
∑
i
=
1
n
a
i
,
j
e
i
{\displaystyle a_{j}=\sum _{i=1}^{n}a_{i,j}e_{i}}
是
a
j
{\displaystyle a_{j}}
在基底
B
{\displaystyle B}
下的展开[ 8] :387-388 。
向量组行列式的直观表达式有时也被称作莱布尼兹公式 。
设B 与B′ 是向量空间中的两个基底,则向量组在两个基底上的行列式之间的关系为:
det
B
′
(
a
1
,
…
,
a
n
)
=
det
B
′
(
B
)
×
det
B
(
a
1
,
…
,
a
n
)
{\displaystyle \det {}_{B'}(a_{1},\dots ,a_{n})=\det {}_{B'}(B)\times \det {}_{B}(a_{1},\dots ,a_{n})}
设
M
n
(
K
)
{\displaystyle \displaystyle {\mathfrak {M}}_{n}(K)}
为所有定义在系数域 K 上的
n
×
n
{\displaystyle n\times n}
矩阵的集合。将
n
×
n
{\displaystyle n\times n}
矩阵M (M 的元素记为
m
i
,
j
{\displaystyle \displaystyle m_{i,j}}
)的n 列写成
m
1
,
…
,
m
n
{\displaystyle m_{1},\ldots ,m_{n}}
,
m
j
=
(
m
i
j
)
1
≤
i
≤
n
{\displaystyle \displaystyle m_{j}=\left(m_{ij}\right)_{1\leq i\leq n}}
可以看作是
R
n
{\displaystyle \mathbb {R} ^{n}}
的向量在
R
n
{\displaystyle \mathbb {R} ^{n}}
的正则基
B
c
{\displaystyle B^{c}}
上的分解。矩阵M 的行列式定义为向量组
m
1
,
…
,
m
n
{\displaystyle m_{1},\ldots ,m_{n}}
的行列式。
定义 :
矩阵M 的行列式
det
(
M
)
=
det
B
c
(
m
1
,
…
,
m
n
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
m
σ
(
i
)
,
i
{\displaystyle \det(M)=\det {}_{B^{c}}(m_{1},\ldots ,m_{n})=\sum _{\sigma \in {\mathfrak {S}}_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}m_{\sigma (i),i}}
[ 5] :109
由莱布尼兹公式,可以证明矩阵行列式的一个重要性质:
定理 :
一个矩阵的行列式等于它的转置矩阵 的行列式:
det
M
=
det
(
t
M
)
{\displaystyle \det M=\det \left({}^{t}{M}\right)}
。[ 8] :405-406
也就是说矩阵的行列式既可以看作n 个行向量 的行列式,也可以看作n 个列向量 的行列式。因此也可以通过行向量组来定义矩阵行列式,并且得到的定义是等价的。
设f 是n 维线性空间 E 到自身的线性变换(自同态 ),对于给定的基底,可以定义线性变换在这个基底下的行列式。
定义 :
设B 是E 的一个基底。设f 在B 下的变换矩阵 为
[
f
]
B
{\displaystyle \left[f\right]_{B}}
,那么f 在B 下的行列式就是:
det
B
(
f
)
=
det
B
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
(
[
f
]
B
)
{\displaystyle \det {}_{B}(f)=\det {}_{B}(f(e_{1}),\cdots ,f(e_{n}))=\det \left([f]_{B}\right)}
。
因此,对向量组
(
x
1
,
…
,
x
n
)
{\displaystyle (x_{1},\dots ,x_{n})}
,有:
det
B
(
f
(
x
1
)
,
⋯
,
f
(
x
n
)
)
=
det
(
[
f
]
B
)
×
det
B
(
x
1
,
⋯
,
x
n
)
=
det
B
(
f
)
×
det
B
(
x
1
,
⋯
,
x
n
)
{\displaystyle \det {}_{B}(f(x_{1}),\cdots ,f(x_{n}))=\det \left([f]_{B}\right)\times \det {}_{B}(x_{1},\cdots ,x_{n})=\det {}_{B}(f)\times \det {}_{B}(x_{1},\cdots ,x_{n})}
。
可以证明,f 在E 的不同基底下的变换矩阵的行列式是相等的[ 5] :104 。
证明 :
考虑两个不同的基底B 和B' 。
det
B
′
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
B
′
(
f
)
×
det
B
′
(
e
1
,
⋯
,
e
n
)
{\displaystyle \det {}_{B'}(f(e_{1}),\cdots ,f(e_{n}))=\det {}_{B'}(f)\times \det {}_{B'}(e_{1},\cdots ,e_{n})}
另一方面,由基变更公式可知:
det
B
′
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
B
′
(
e
1
,
⋯
,
e
n
)
×
det
B
(
f
(
e
1
)
,
⋯
,
f
(
e
n
)
)
=
det
B
′
(
e
1
,
⋯
,
e
n
)
×
det
B
(
f
)
.
{\displaystyle \det {}_{B'}(f(e_{1}),\cdots ,f(e_{n}))=\det {}_{B'}(e_{1},\cdots ,e_{n})\times \det {}_{B}(f(e_{1}),\cdots ,f(e_{n}))=\det {}_{B'}(e_{1},\cdots ,e_{n})\times \det {}_{B}(f).}
所以
det
B
′
(
f
)
=
det
B
(
f
)
{\displaystyle \det {}_{B'}(f)=\det {}_{B}(f)}
因此自同态的行列式定义可以修改为不依赖于基底的形式:
前一节里对正方体做线性变换时,
(
x
1
,
⋯
,
x
n
)
{\displaystyle (x_{1},\cdots ,x_{n})}
是原来的基底,
det
B
(
x
1
,
…
,
x
n
)
=
1
{\displaystyle \det {}_{B}(x_{1},\dots ,x_{n})=1}
,因此可以混淆向量组的行列式和线性变换的行列式[ 5] :102 。
以上的定义中都假设矩阵的系数取自某个域 。实际上,行列式的定义与计算并不涉及除法。所以,矩阵的系数可以是任意的交换环 k 的元素。这时有限维线性空间变为以
B
=
(
e
1
,
…
,
e
n
)
{\displaystyle B=(e_{1},\dots ,e_{n})}
为基的自由k- 模 ,而相应的关于行列式的定义和性质依然成立(在可定义的范畴内)。如果矩阵系数是非交换环的话,以上的行列式定义将不再唯一。1845年,阿瑟·凯莱 首次开始研究非交换环上行列式定义的问题。他注意到,对于系数是四元数 (不可交换)的二阶行列式
|
a
11
a
12
a
21
a
22
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\\\end{vmatrix}}}
表达式
a
11
a
22
−
a
12
a
21
{\displaystyle a_{11}a_{22}-a_{12}a_{21}}
和
a
11
a
22
−
a
21
a
12
{\displaystyle a_{11}a_{22}-a_{21}a_{12}}
是不一样的。1913年,韦德伯恩开始发展非交换环上的行列式理论。1926年,阿兰德·海廷 和A.理查德森提出了非交换除环上的行列式的不同定义。理查德森将二阶行列式定义为:
(
a
11
−
a
12
a
22
−
1
a
21
)
a
22
{\displaystyle (a_{11}-a_{12}a_{22}^{-1}a_{21})a_{22}}
,而海廷则提倡使用
(
a
11
−
a
12
a
22
−
1
a
21
)
{\displaystyle (a_{11}-a_{12}a_{22}^{-1}a_{21})}
。两人都用归纳法定义了更高阶矩阵的行列式。1931年,奥斯丁·欧尔 在一大类非交换环(后来命名为欧尔环 )上定义了行列式的概念。最著名的非交换环上的行列式的定义当属让·迪厄多内 的定义。迪厄多内是布尔巴基学派 的代表成员之一,他将除环
K
{\displaystyle \mathbb {K} }
中的行列式定义在商域
K
/
[
K
,
K
]
{\displaystyle \mathbb {K} /[\mathbb {K} ,\mathbb {K} ]}
上,而不是在
K
{\displaystyle \mathbb {K} }
中。这个定义下的行列式有接近交换环中行列式的性质。例如,迪尔多内的行列式可以保持行列式的乘法定理。而这种行列式与交换环中行列式的区别是:将矩阵的两行或两列互换后,行列式的值不变。迪厄多内的行列式不能用来解线性方程组。[ 9] 之后菲列克斯·别列金 (Березин, Феликс Александрович )、佐藤干夫 等人对迪厄多内的定义进行了探究和扩展[ 10] 。1991年起,I·杰尔方德和V·里塔克提出了准行列式 的概念,将一般自由除环上的n × n 矩阵的行列式定义为n × n 个数,分别是:
|
A
|
i
,
j
=
a
i
,
j
−
(
a
i
,
1
a
i
,
2
⋯
a
i
,
n
)
⋅
A
i
,
j
−
1
⋅
(
a
1
,
j
a
2
,
j
⋮
a
n
,
j
)
{\displaystyle |A|_{i,j}=a_{i,j}-{\begin{pmatrix}a_{i,1}&a_{i,2}&\cdots &a_{i,n}\end{pmatrix}}\cdot A_{i,j}^{-1}\cdot {\begin{pmatrix}a_{1,j}\\a_{2,j}\\\vdots \\a_{n,j}\end{pmatrix}}}
其中的
A
i
,
j
−
1
{\displaystyle A_{i,j}^{-1}}
指第i 行第j 列元素对应的余因式的逆矩阵。由定义本身可知,这个定义仅当
A
i
,
j
−
1
{\displaystyle A_{i,j}^{-1}}
存在时有效。如此定义的准行列式可以用来解线性方程组。[ 11]
行列式的一些基本性质,可以由它的多线性以及交替性定义推出。
在行列式中,一行(列)元素全为0,则此行列式的值为0[ 2] :7-11 。
|
0
0
…
0
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
0
a
12
…
a
1
n
0
a
22
…
a
2
n
⋮
⋮
⋱
⋮
0
a
n
2
…
a
n
n
|
=
0
{\displaystyle {\begin{vmatrix}{\color {blue}0}&{\color {blue}0}&\dots &{\color {blue}0}\\a_{21}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}{\color {blue}0}&a_{12}&\dots &a_{1n}\\{\color {blue}0}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\{\color {blue}0}&a_{n2}&\dots &a_{nn}\end{vmatrix}}=0}
在行列式中,某一行(列)有公因子k ,则可以提出k [ 2] :7-11 。
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
k
a
i
1
k
a
i
2
…
k
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
k
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {blue}k}a_{i1}&{\color {blue}k}a_{i2}&\dots &{\color {blue}k}a_{in}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\color {blue}k}{\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}}
在行列式中,某一行(列)的每个元素是两数之和,则此行列式可拆分为两个相加的行列式[ 2] :7-11 。
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
a
i
1
+
b
i
1
a
i
2
+
b
i
2
…
a
i
n
+
b
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
+
|
a
11
a
12
…
a
1
n
⋮
⋮
…
⋮
b
i
1
b
i
2
…
b
i
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {blue}a_{i1}}+{\color {OliveGreen}b_{i1}}&{\color {blue}a_{i2}}+{\color {OliveGreen}b_{i2}}&\dots &{\color {blue}a_{in}}+{\color {OliveGreen}b_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}+{\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\\vdots &\vdots &\dots &\vdots \\{\color {OliveGreen}b_{i1}}&{\color {OliveGreen}b_{i2}}&\dots &{\color {OliveGreen}b_{in}}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}}
行列式中的两行(列)互换,改变行列式正负符号[ 2] :7-11 。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
=
−
|
⋮
⋮
⋮
⋮
a
j
1
a
j
2
…
a
j
n
a
i
1
a
i
2
…
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\{\color {OliveGreen}a_{j1}}&{\color {OliveGreen}a_{j2}}&\dots &{\color {OliveGreen}a_{jn}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}=-{\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\{\color {OliveGreen}a_{j1}}&{\color {OliveGreen}a_{j2}}&\dots &{\color {OliveGreen}a_{jn}}\\{\color {blue}a_{i1}}&{\color {blue}a_{i2}}&\dots &{\color {blue}a_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
在行列式中,有两行(列)对应成比例或相同,则此行列式的值为0[ 2] :7-11 。
|
2
2
…
2
8
8
…
8
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
0
{\displaystyle {\begin{vmatrix}{\color {blue}2}&{\color {blue}2}&\dots &{\color {blue}2}\\{\color {blue}8}&{\color {blue}8}&\dots &{\color {blue}8}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}=0}
将一行(列)的k 倍加进另一行(列)里,行列式的值不变[ 2] :7-11 。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
=
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
+
k
a
i
1
a
j
2
+
k
a
i
2
…
a
j
n
+
k
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}&a_{j2}&\dots &a_{jn}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}={\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}{\color {blue}+ka_{i1}}&a_{j2}{\color {blue}+ka_{i2}}&\dots &a_{jn}{\color {blue}+ka_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
注意 :一行(列)的k 倍加上 另一行(列),行列式的值改变。
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
a
j
1
a
j
2
…
a
j
n
⋮
⋮
⋮
⋮
|
≠
|
⋮
⋮
⋮
⋮
a
i
1
a
i
2
…
a
i
n
k
a
j
1
+
a
i
1
k
a
j
2
+
a
i
2
…
k
a
j
n
+
a
i
n
⋮
⋮
⋮
⋮
|
{\displaystyle {\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\a_{j1}&a_{j2}&\dots &a_{jn}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}{\color {red}\neq }{\begin{vmatrix}\vdots &\vdots &\vdots &\vdots \\a_{i1}&a_{i2}&\dots &a_{in}\\{\color {red}k}a_{j1}{\color {red}+a_{i1}}&{\color {red}k}a_{j2}{\color {red}+a_{i2}}&\dots &{\color {red}k}a_{jn}{\color {red}+a_{in}}\\\vdots &\vdots &\vdots &\vdots \\\end{vmatrix}}}
将矩阵的行列互换(转置),其行列式的值不变[ 2] :7-11 [ 8] :405-406 。
|
a
11
a
12
…
a
1
n
a
21
a
22
…
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
…
a
n
n
|
=
|
a
11
a
21
…
a
n
1
a
12
a
22
…
a
n
2
⋮
⋮
⋱
⋮
a
1
n
a
2
n
…
a
n
n
|
{\displaystyle {\begin{vmatrix}a_{11}&a_{12}&\dots &a_{1n}\\a_{21}&a_{22}&\dots &a_{2n}\\\vdots &\vdots &\ddots &\vdots \\a_{n1}&a_{n2}&\dots &a_{nn}\end{vmatrix}}={\begin{vmatrix}a_{11}&a_{21}&\dots &a_{n1}\\a_{12}&a_{22}&\dots &a_{n2}\\\vdots &\vdots &\ddots &\vdots \\a_{1n}&a_{2n}&\dots &a_{nn}\end{vmatrix}}}
行列式的乘法定理:方块矩阵 的乘积的行列式等于行列式的乘积:
det
(
A
B
)
=
det
(
A
)
det
(
B
)
{\displaystyle \displaystyle \det(AB)=\det(A)\det(B)}
。特别的,若将矩阵中的每一行每一列上的数都乘以一个常数r ,那么所得到的行列式不是原来的r 倍,而是rn 倍。
det
(
r
A
)
=
det
(
r
I
n
⋅
A
)
=
det
(
r
I
n
)
⋅
det
(
A
)
=
r
n
det
(
A
)
{\displaystyle \det(rA)=\det(rI_{n}\cdot A)=\det(rI_{n})\cdot \det(A)=r^{n}\det(A)}
[ 1] :89 。
以上的乘法公式还可以进一步推广为柯西–比内公式 ,从而使得只要两个矩阵的乘积是方块矩阵,就有类似于以上的结果:假设A 是一个m ×n 矩阵,而B 是一个n ×m 矩阵。如果S 是
{
1
,
⋯
,
n
}
{\displaystyle \left\{1,\cdots ,n\right\}}
中某个有m 个元素的子集
S
=
{
s
1
,
⋯
,
s
m
}
{\displaystyle S=\left\{s_{1},\cdots ,s_{m}\right\}}
,记AS 为A 中列指标位于S 中的
m
×
m
{\displaystyle m\times m}
子矩阵。类似地,记BS 为B 中行指标位于S 中的m ×m 子矩阵。那么
det
(
A
B
)
=
∑
S
det
(
A
S
)
det
(
B
S
)
{\displaystyle \det(AB)=\sum _{S}\det(A_{S})\det(B_{S})\,}
其中的求和号表示遍历
{
1
,
⋯
,
n
}
{\displaystyle \left\{1,\cdots ,n\right\}}
中拥有m 个元素的所有子集S (共有C (n ,m ) 个)。
如果m = n ,即A 与B 是同样大小的方块矩阵,则只有一个容许集合 S ,柯西–比内公式退化为通常行列式的乘法公式。如过m = 1则有n 个容许集合S ,这个公式退化为点积 。如果m > n ,没有容许集合S ,约定行列式det(AB )为零[ 12] 。
若A 是可逆矩阵 ,A 的逆矩阵的行列式等于A 的行列式的倒数:
det
(
A
−
1
)
=
(
det
(
A
)
)
−
1
{\displaystyle \displaystyle \det(A^{-1})=(\det(A))^{-1}}
[ 2] :65 。
由行列式的乘法定理以及逆矩阵的行列式可以知道,行列式定义了一个从一般线性群
(
G
L
n
(
F
)
,
×
)
{\displaystyle (GL_{n}(\mathbb {F} ),\times )}
到
(
F
∗
,
×
)
{\displaystyle (\mathbb {F} ^{*},\times )}
上的群同态 [ 13] 。
若将方块矩阵中的元素取共轭 ,得到的是矩阵的共轭矩阵。共轭矩阵的行列式值等于矩阵行列式值的共轭:
det
(
A
¯
)
=
det
(
A
)
¯
{\displaystyle \det({\overline {A}})={\overline {\det(A)}}}
[ note 1]
若两个矩阵相似 ,那么它们的行列式相同。这是因为两个相似的矩阵可以看作同一个自同态在不同基底下的变换矩阵,而基底变换并不会影响行列式的值。用数学语言来说,就是:
如果两个矩阵A 与B 相似,那么存在可逆矩阵P 使得
A
=
P
B
P
−
1
{\displaystyle \mathbf {A} =\mathbf {PB} \mathbf {P} ^{-1}}
,所以
det
(
A
)
=
det
(
P
B
P
−
1
)
=
det
(
P
)
⋅
det
(
B
)
⋅
det
(
P
−
1
)
=
det
(
B
)
⋅
det
(
P
)
⋅
det
(
P
)
−
1
=
det
(
B
)
{\displaystyle \det(\mathbf {A} )=\det(\mathbf {PB} \mathbf {P} ^{-1})=\det(\mathbf {P} )\cdot \det(\mathbf {B} )\cdot \det(\mathbf {P} ^{-1})=\det(\mathbf {B} )\cdot \det(\mathbf {P} )\cdot \det(\mathbf {P} )^{-1}=\det(\mathbf {B} )}
[ 14]
行列式是所有特征值 (按代数重数计)的乘积。这可由矩阵必和其若尔当标准型 相似推导出[ 15] :39-40 。特殊地,三角矩阵 的行列式等于其对角线上所有元素的乘积[ 15] :40 。
由于三角矩阵的行列式计算简便,当矩阵的系数为域 时,可以通过高斯消去法 将矩阵变换成三角矩阵,或者将矩阵分解成三角矩阵的乘积之后再利用行列式的乘法定理进行计算。可以证明,所有的矩阵A 都可以分解成一个上三角矩阵U 、一个下三角矩阵L 以及一个置换矩阵 P 的乘积:
A
=
P
⋅
L
⋅
U
{\displaystyle A=P\cdot L\cdot U}
。这时,矩阵A 的行列式可以写成:
det
(
A
)
=
det
(
P
)
⋅
det
(
L
)
⋅
det
(
U
)
=
sgn
(
σ
P
)
⋅
∏
i
=
1
n
l
i
i
⋅
∏
i
=
1
n
u
i
i
.
{\displaystyle \det(A)=\det(P)\cdot \det(L)\cdot \det(U)=\operatorname {sgn}(\sigma _{P})\cdot \prod _{i=1}^{n}l_{ii}\cdot \prod _{i=1}^{n}u_{ii}.}
[ 6] :236-237
分块矩阵的行列式并不能简单地表示成每个分块的行列式的乘积组合。对于分块的三角矩阵,仍然有类似的结论:
det
(
A
0
C
D
)
=
det
(
A
B
0
D
)
=
det
(
A
)
det
(
D
)
{\displaystyle \det {\begin{pmatrix}A&0\\C&D\end{pmatrix}}=\det {\begin{pmatrix}A&B\\0&D\end{pmatrix}}=\det(A)\det(D)}
,矩阵的行列式等于对角元素的行列式之乘积。
对于一般情况,若对角元素中有一个是可逆矩阵,则可以分块计算矩阵的行列式。如果A 可逆,那么矩阵的行列式可以分解为:
det
(
A
B
C
D
)
=
det
(
A
)
det
(
D
−
C
A
−
1
B
)
.
{\displaystyle \det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(A)\det(D-CA^{-1}B).}
[ 16]
如果D 可逆,那么矩阵的行列式可以分解为:
det
(
A
B
C
D
)
=
det
(
D
)
det
(
A
−
B
D
−
1
C
)
.
{\displaystyle \det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(D)\det(A-BD^{-1}C).}
[ 16]
由分块矩阵行列式的分解公式,可以推出西尔维斯特定理 :如果A 是n ×m 的矩阵而B 是m ×n 的矩阵,则
det
(
I
n
+
A
B
)
=
det
(
I
m
+
B
A
)
.
{\displaystyle \det(\mathrm {I} _{n}+AB)=\det(\mathrm {I} _{m}+BA).}
[ 16]
矩阵的行列式和矩阵的迹数 有一定的关联,当矩阵的系数为域 时,在定义了矩阵的指数函数 后,有如下的恒等式:
det
(
exp
(
A
)
)
=
exp
(
t
r
(
A
)
)
{\displaystyle \det(\exp(A))=\exp(\mathrm {tr} (A))}
[ 17] :439
对一个n 阶的矩阵M ,去掉M 的第i 行与第j 列后形成的n -1阶矩阵的行列式叫做M 关于元素mij 的馀子式 ,记作Mij [ 2] :3-5 。
M
i
j
=
|
m
1
,
1
…
m
1
,
j
−
1
m
1
,
j
+
1
…
m
1
,
n
⋮
⋮
⋮
⋮
m
i
−
1
,
1
…
m
i
−
1
,
j
−
1
m
i
−
1
,
j
+
1
…
m
i
−
1
,
n
m
i
+
1
,
1
…
m
i
+
1
,
j
−
1
m
i
+
1
,
j
+
1
…
m
i
+
1
,
n
⋮
⋮
⋮
⋮
m
n
,
1
…
m
n
,
j
−
1
m
n
,
j
+
1
…
m
n
,
n
|
{\displaystyle M_{ij}={\begin{vmatrix}m_{1,1}&\dots &m_{1,j-1}&m_{1,j+1}&\dots &m_{1,n}\\\vdots &&\vdots &\vdots &&\vdots \\m_{i-1,1}&\dots &m_{i-1,j-1}&m_{i-1,j+1}&\dots &m_{i-1,n}\\m_{i+1,1}&\dots &m_{i+1,j-1}&m_{i+1,j+1}&\dots &m_{i+1,n}\\\vdots &&\vdots &\vdots &&\vdots \\m_{n,1}&\dots &m_{n,j-1}&m_{n,j+1}&\dots &m_{n,n}\end{vmatrix}}}
皮埃尔-西蒙·拉普拉斯
将M 关于元素mij 的余子式乘以一个符号系数,就得到M 关于元素mij 的代数余子式 Cij 。其中的符号系数定义为-1的行数加列数次方:
C
i
j
=
(
−
1
)
(
i
+
j
)
⋅
M
i
j
{\displaystyle C_{ij}=(-1)^{(i+j)}\cdot M_{ij}}
[ 2] :3-5
如果行数与列数的和是偶数,那么Cij = Mij ;否则Cij = -Mij 。
一个n 阶矩阵M 的行列式可以写成它某一行(或一列)的元素与对应的代数余子式的乘积之和。这种关系称为行列式按一行(或一列)的展开。
det
M
=
∑
i
=
1
n
m
i
j
C
i
j
{\displaystyle \det {M}=\sum _{i=1}^{n}m_{ij}C_{ij}}
det
M
=
∑
j
=
1
n
m
i
j
C
i
j
{\displaystyle \det {M}=\sum _{j=1}^{n}m_{ij}C_{ij}}
这个公式又称拉普拉斯公式 。它把n 阶矩阵的行列式计算变为了n 个n -1阶行列式的计算[ 2] :3-5 [ 3] :47-48 。另一方面,拉普拉斯公式可以看作是行列式的一种归纳定义:在定义了二维行列式后,n 阶矩阵的行列式可以借助拉普拉斯公式用n -1阶矩阵的行列式来定义。这样定义的行列式与前面的定义是等价的[ 1] :92 。
一个矩阵M 的伴随矩阵是由矩阵M 的代数余子式构成的矩阵:
Com
M
=
[
C
i
j
]
1
≤
i
,
j
≤
n
{\displaystyle \operatorname {Com} {M}=\left[C_{ij}\right]_{1\leq i,j\leq n}}
伴随矩阵是行列式关于行与列展开的自然推广。如果观察伴随矩阵的转置矩阵与原矩阵的乘积,就可以发现,乘积的每一个元素都是原矩阵的行列式按行(列)的展开式,因此都等于原矩阵的行列式:
M
×
t
Com
M
=
t
Com
M
×
M
=
det
M
×
I
n
.
{\displaystyle M\times {}^{\operatorname {t} }\operatorname {Com} {M}={}^{\operatorname {t} }\operatorname {Com} {M}\times M=\det {M}\times \mathrm {I} _{n}.}
当矩阵M 的行列式不等于0时,M 的伴随矩阵正等于M 的逆矩阵乘以M 的行列式。因此伴随矩阵实际上给出了一种计算逆矩阵的方法。
计算行列式的值是一个常见的问题。最简单的方法是按照定义
det
(
A
)
=
∑
σ
∈
S
n
sgn
(
σ
)
∏
i
=
1
n
a
i
,
σ
(
i
)
{\displaystyle \det(A)=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{i,\sigma (i)}}
计算或按照拉普拉斯公式 进行递归 运算。这样的算法需要计算
n
!
{\displaystyle n!}
次的加法,复杂度是指数函数。在实际的计算中只能用于计算阶数很小的行列式。注意到拉普拉斯公式的性质,如果一行或一列里面有很多个0,那么就可以把行列式按这一行或一列展开,这时数值为零的系数所对应的代数余子式就不必计算了,因为最后要乘以0,这样就可以简化计算。然而更加简便的算法是利用高斯消去法 或LU分解法 ,把矩阵通过初等变换变成三角矩阵 或三角矩阵的乘积来计算行列式的值。这些算法的复杂度都是
n
3
{\displaystyle n^{3}}
级别,远远小于直接计算的复杂度。[ 18] :44-49
如果行列式的元素都是某个域中的元素(即可以执行除法),那么从任一个可以在
O
(
n
s
)
{\displaystyle {\mathit {O}}(n^{s})}
次运算内算出矩阵乘积的算法出发,都可以构造出一种
O
(
n
s
)
{\displaystyle {\mathit {O}}(n^{s})}
次运算内的行列式求值算法。反之亦然。这说明求矩阵的行列式的值和矩阵的乘法有相同的最小复杂度。于是,通过分治算法或者其它的方法,可以达到比
O
(
n
3
)
{\displaystyle {\mathit {O}}(n^{3})}
更好的结果。比如,由于Coppersmith-Winograd算法 可以在
O
(
n
ω
)
{\displaystyle {\mathit {O}}(n^{\omega })}
次运算(其中
ω
≈
2.375477
{\displaystyle \omega \approx 2.375477}
[ note 2] )中计算矩阵乘法,所以也存在
O
(
n
ω
)
{\displaystyle {\mathit {O}}(n^{\omega })}
次运算以内的行列式求值算法。[ 19] [ 20]
如果行列式的元素是某个环中的元素(比如说都是整数),在不执行除法,以字节运算次数来作为复杂度单位的情况下,则需要考虑行列式元素本身的大小。设一个n 阶行列式A 中绝对值最大的元素占的字节数为bA ,则现有算法可以在
O
(
(
n
η
b
A
)
1
+
o
(
1
)
)
,
η
=
ω
+
1
−
ζ
w
2
−
(
2
+
ζ
)
ω
+
2
{\displaystyle {\mathit {O}}{\big (}(n^{\eta }b_{A})^{1+{\mathit {o}}(1)}{\big )},\quad \eta =\omega +{\frac {1-\zeta }{w^{2}-(2+\zeta )\omega +2}}}
次字节运算内计算行列式的值。其中的
ζ
{\displaystyle \zeta }
是使得域上的n × n 矩阵和n × nζ 矩阵的乘法能够在
O
(
n
2
+
o
(
1
)
)
{\displaystyle {\mathit {O}}{\big (}n^{2+{\mathit {o}}(1)}{\big )}}
次运算内得出结果的最小实数。[ 19]
由行列式的一般表达形式中可以看出,矩阵的行列式是关于其系数的多项式。因此行列式函数具有良好的光滑性质。
设矩阵函数
t
↦
A
(
t
)
{\displaystyle t\mapsto A(t)}
为
C
k
{\displaystyle {\mathcal {C}}^{k}}
(k 阶连续可导 )的函数。由于行列式函数
t
↦
det
A
(
t
)
{\displaystyle t\mapsto \det A(t)}
是矩阵
A
(
t
)
{\displaystyle A(t)}
系数的多项式函数,所以也是
C
k
{\displaystyle {\mathcal {C}}^{k}}
的。它对t 的导数为
d
d
t
(
det
(
A
1
(
t
)
,
⋯
,
A
n
(
t
)
)
)
=
∑
i
=
1
n
det
(
A
1
(
t
)
,
…
,
A
i
−
1
(
t
)
,
A
i
′
(
t
)
,
A
i
+
1
(
t
)
,
…
,
A
n
(
t
)
)
{\displaystyle {\frac {\rm {d}}{{\rm {d}}t}}\left(\det(A_{1}(t),\cdots ,A_{n}(t))\right)=\sum _{i=1}^{n}\det(A_{1}(t),\dots ,A_{i-1}(t),A'_{i}(t),A_{i+1}(t),\dots ,A_{n}(t))}
,其中的每个
A
i
(
t
)
{\displaystyle A_{i}(t)}
是矩阵
A
(
t
)
{\displaystyle A(t)}
的第i 个行向量(也可以全部是列向量)。[ 21] :23-24
函数
A
↦
det
A
{\displaystyle A\mapsto \det A}
是连续的。由此,n阶一般线性群 是一个开集 ,因为是开区间
R
−
{
0
}
{\displaystyle \mathbb {R} -\left\{0\right\}}
的原像,而特殊线性群 则是一个闭集 ,因为是闭集合
{
1
,
−
1
}
{\displaystyle \left\{1,-1\right\}}
的原像[ 22] 。
函数
A
↦
det
A
{\displaystyle A\mapsto \det A}
也是可微的 ,甚至是光滑 的(
C
∞
{\displaystyle {\mathcal {C}}^{\infty }}
)[ 23] 。它在某个矩阵A 处的展开为
det
(
A
+
H
)
=
det
A
+
t
r
(
t
C
o
m
(
A
)
.
H
)
+
o
(
‖
H
‖
)
{\displaystyle \det(A+H)=\det A+{\rm {tr}}({}^{t}{\rm {Com}}(A).H)+o(\|H\|)}
[ 24]
也就是说,在装备正则范数 的矩阵空间Mn (
R
{\displaystyle \mathbb {R} }
)中,伴随矩阵 是行列式函数的梯度 :
∇
det
(
A
)
=
C
o
m
(
A
)
{\displaystyle \nabla \det(A)={\rm {Com}}(A)}
[ 25] :272
特别当A 为单位矩阵 时,
det
(
I
n
+
H
)
=
1
+
t
r
(
H
)
+
o
(
‖
H
‖
)
,
∇
det
(
I
n
)
=
I
n
{\displaystyle \det(\mathrm {I} _{n}+H)=1+{\rm {tr}}(H)+o(\|H\|),\qquad \nabla \det(\mathrm {I} _{n})=\mathrm {I} _{n}}
可逆矩阵行列式的可微性说明一般线性群GLn (
R
{\displaystyle \mathbb {R} }
)是一个李群 [ 26] 。
行列式与外代数 有密切的关系,因为外代数正是在给定的交换环
K
{\displaystyle \mathbb {K} }
上的自由
K
{\displaystyle \mathbb {K} }
-模V 上最“一般性”的有交替性质的结合代数 ,记为
∧
(
V
)
{\displaystyle \wedge (V)}
。外代数是由楔积 构造而成的,而楔积在V 上的交替性质表现如下(定义):
楔积是满足结合律 的双线性 的二元运算,使得对于所有向量
v
∈
V
{\displaystyle v\in V}
,
v
∧
v
=
0
{\displaystyle v\wedge v=0}
这表示
对于所有向量
u
,
v
∈
V
{\displaystyle u,v\in V}
,
u
∧
v
=
−
v
∧
u
{\displaystyle u\wedge v=-v\wedge u}
,以及
当
v
1
,
…
,
v
k
∈
V
{\displaystyle v_{1},\ldots ,v_{k}\in V}
线性相关 时,
v
1
∧
v
2
∧
⋯
∧
v
k
=
0
{\displaystyle v_{1}\wedge v_{2}\wedge \cdots \wedge v_{k}=0}
。
所有形同
v
1
∧
v
2
∧
⋯
∧
v
k
{\displaystyle v_{1}\wedge v_{2}\wedge \cdots \wedge v_{k}}
的元素称为k -向量 。所有k -向量构成了
∧
(
V
)
{\displaystyle \wedge (V)}
的一个子空间,称为V 的k -阶外幂 ,记为
∧
k
(
V
)
{\displaystyle \wedge ^{k}(V)}
。行列式函数是n 重交替线性形式,所以可以看成是将n 个
K
n
{\displaystyle \mathbb {K} ^{n}}
里面的向量映射到它们对应的n -阶外幂
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
这样一个映射。由于
K
n
{\displaystyle \mathbb {K} ^{n}}
的k -阶外幂
∧
k
(
K
n
)
{\displaystyle \wedge ^{k}(\mathbb {K} ^{n})}
的维数等于组合数
(
n
k
)
{\displaystyle {\binom {n}{k}}}
,
∧
n
(
R
n
)
{\displaystyle \wedge ^{n}(\mathbb {R} ^{n})}
的维数是
(
n
n
)
=
1
{\displaystyle {\binom {n}{n}}=1}
,因此
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
实际上同构 于
K
{\displaystyle \mathbb {K} }
,所以行列式实际上可以定义为n 个
K
n
{\displaystyle \mathbb {K} ^{n}}
里面的向量映射到它们对应的n- 阶外幂
∧
n
(
K
n
)
{\displaystyle \wedge ^{n}(\mathbb {K} ^{n})}
的映射。行列式理论实际上是外代数理论的一部分。[ 3] :311-319 [ 27] :747-760
对三维欧几里得空间中
R
3
{\displaystyle \mathbb {R} ^{3}}
可以建立一个线性同构
ϕ
:
Λ
2
(
R
3
)
→
R
3
{\displaystyle \phi :\Lambda ^{2}(\mathbb {R} ^{3})\rightarrow \mathbb {R} ^{3}}
如下:任取
R
3
{\displaystyle \mathbb {R} ^{3}}
的右手的 标准正交基
i
{\displaystyle {\boldsymbol {i}}}
,
j
{\displaystyle {\boldsymbol {j}}}
,
k
{\displaystyle {\boldsymbol {k}}}
,规定
ϕ
{\displaystyle \phi }
把
i
∧
j
{\displaystyle {\boldsymbol {i}}\wedge \mathbf {j} }
,
j
∧
k
{\displaystyle {\boldsymbol {j}}\wedge {\boldsymbol {k}}}
,
k
∧
i
{\displaystyle {\boldsymbol {k}}\wedge {\boldsymbol {i}}}
分别映射为
k
{\displaystyle {\boldsymbol {k}}}
,
i
{\displaystyle {\boldsymbol {i}}}
,
j
{\displaystyle {\boldsymbol {j}}}
,则
ϕ
{\displaystyle \phi }
的定义与右手的标准正交基如何选取无关。
对任意向量
u
{\displaystyle {\boldsymbol {u}}}
和
v
{\displaystyle {\boldsymbol {v}}}
,这个线性同构把楔积
u
∧
v
{\displaystyle {\boldsymbol {u}}\wedge {\boldsymbol {v}}}
映射为叉积
u
×
v
{\displaystyle {\boldsymbol {u}}\times {\boldsymbol {v}}}
。这就是叉乘 (向量积)的实质。叉积可以用带向量的行列式:
a
×
b
=
det
[
i
j
k
a
1
a
2
a
3
b
1
b
2
b
3
]
{\displaystyle \mathbf {a} \times \mathbf {b} =\det {\begin{bmatrix}\mathbf {i} &\mathbf {j} &\mathbf {k} \\a_{1}&a_{2}&a_{3}\\b_{1}&b_{2}&b_{3}\\\end{bmatrix}}}
来表示,但要注意这个行列式形式并不代表一个“真正”的行列式,因为第一行的分量不是数,而是向量。这个计算之所以正确是得益于线性同构
ϕ
{\displaystyle \phi }
。[ 27]
行列式的概念最初是伴随着方程 组的求解而发展起来的。行列式的提出可以追溯到十七世纪,最初的雏形由日本 数学家 关孝和 与德国 数学家戈特弗里德·莱布尼茨 各自独立得出。
关孝和在《解伏题之法》中首次运用行列式的概念
1545年,卡当在著作《大术 》(Ars Magna )中给出了一种解两个一次方程组的方法。他把这种方法称为“母法”(regula de modo )。这种方法和后来的克莱姆法则 已经很相似了,但卡当并没有给出行列式的概念[ 28] :766-774 。
1683年,日本数学家关孝和 在其著作《解伏题之法》中首次引进了行列式的概念。书中出现了
2
×
2
{\displaystyle 2\times 2}
、
3
×
3
{\displaystyle 3\times 3}
乃至
5
×
5
{\displaystyle 5\times 5}
的行列式,行列式被用来求解高次方程组[ 29] [ 30] 。
1693年,德国数学家莱布尼茨开始使用指标数的系统集合来表示有三个未知数的三个一次方程组的系数。他从三个方程的系统中消去了两个未知量后得到一个行列式。这个行列式不等于零,就意味着有一组解同时满足三个方程[ 31] :229-245 [ 32] [ 29] 。由于当时没有矩阵的概念,莱布尼茨将行列式中元素的位置用数对来表示:ij 代表第i 行第j 列。莱布尼茨对行列式的研究成果中已经包括了行列式的展开 和克莱姆法则 ,但这些结果在当时并不为人所知[ 33] 。
1730年,苏格兰 数学家科林·麦克劳林 在他的《论代数》中已经开始阐述行列式的理论,记载了用行列式解二元、三元和四元一次方程的方法,并给出了四元一次方程组的一般解的正确形式,尽管这本书直到麦克劳林逝世两年后(1748年)才得以出版[ 34] 。
约瑟夫·拉格朗日
1750年,瑞士 的加布里尔·克莱姆 首先在他的《代数曲线分析引论》给出了n 元一次方程组求解的法则,用于确定经过五个点的一般二次曲线 的系数,但并没有给出证明[ 35] 。其中行列式的计算十分复杂,因为是定义在奇置换和偶置换 上的[ 36] 。
此后,关于行列式的研究逐渐增多。1764年,法国的艾蒂安·裴蜀 的论文中关于行列式的计算方法的研究简化了克莱姆法则,给出了用结式 来判别线性方程组的方法[ 37] :288–338 。同是法国人的亚历山德·西奥菲勒·范德蒙德 (Alexandre-Théophile Vandermonde )则在1771年的论著中第一个将行列式和解方程理论分离,对行列式单独作出阐述。这是数学家们开始对行列式本身进行研究的开端[ 38] :516-532 。
1772年,皮埃尔-西蒙·拉普拉斯 在论文《对积分和世界体系的探讨》中推广了范德蒙德著作里面将行列式展开为若干个较小的行列式之和的方法,发展出子式 的概念。一年后,约瑟夫·拉格朗日 发现了
3
×
3
{\displaystyle 3\times 3}
的行列式与空间中体积的联系。他发现:原点和空间中三个点所构成的四面体 的体积,是它们的坐标所组成的行列式的六分之一[ 39] [ 37] 。
行列式在大部分欧洲语言中被称为“determinant”(某些语言中词尾加e或o,或变成s),这个称呼最早是由卡尔·弗里德里希·高斯 在他的《算术研究 》中引入的。这个称呼的词根有“决定”意思,因为在高斯的使用中,行列式能够决定二次曲线 的性质。在同一本著作中,高斯还叙述了一种通过系数之间加减来求解多元一次方程组的方法,也就是现在的高斯消元法 [ 37] 。
詹姆斯·约瑟夫·西尔维斯特
进入十九世纪后,行列式理论进一步得到发展和完善。奥古斯丁·路易·柯西 在1812年首先将“determinant”一词用来表示十八世纪出现的行列式,此前高斯只不过将这个词限定在二次曲线所对应的系数行列式中。柯西也是最早将行列式排成方阵并将其元素用双重下标表示的数学家(垂直线记法是阿瑟·凯莱 在1841年率先使用的)[ 40] :198 。柯西还证明了行列式的乘法定理 (实际上是矩阵乘法),这个定理曾经在雅克·菲利普·玛利·比内 (Jacque Philippe Marie Binet )的书中出现过,但没有证明[ 40] :198 [ 41] [ 37] 。
十九世纪五十年代,凯莱和詹姆斯·约瑟夫·西尔维斯特 将矩阵 的概念引入数学研究中[ 40] :208-209 。行列式和矩阵之间的密切关系使得矩阵论 蓬勃发展的同时也带来了许多关于行列式的新结果,例如阿达马不等式 、正交行列式、对称行列式等等[ 40] :207 。
与此同时,行列式也被应用于各种领域中。高斯在二次曲线 和二次型 的研究中使用行列式作为二次曲线 和二次型 划归为标准型时的判别依据。十九世纪五十年代后,卡尔·魏尔斯特拉斯 和西尔维斯特又完善了二次型理论,研究了
λ
{\displaystyle \lambda }
-矩阵的行列式以及初等因子 [ 42] :115-152 [ 43] [ 44] [ 45] :205-206 。行列式被用于多重函数的积分大约始于十九世纪三十年代。1832年至1833年间卡尔·雅可比 发现了一些特殊结果,1839年,欧仁·查尔·卡塔兰 (Eugène Charles Catalan )发现了所谓的雅可比行列式 [ 45] :200 。1841年,雅可比发表了一篇关于函数行列式的论文,讨论函数的线性相关性 与雅可比行列式的关系[ 46] 。整个十九世纪中,数学家对行列式的性质进行了大量研究,很多特殊行列式如对称与斜对称行列式、加边行列式、复合行列式的性质也得到研究[ 45] :207 。
现代的行列式概念最早在19世纪末传入中国。1899年,华蘅芳 和英国传教士傅兰雅合译了《算式解法》十四卷,其中首次将行列式翻译成“定准数”。1909年顾澄在著作中称之为“定列式”。1935年8月,中国数学会审查各种术语译名,9月教育部公布的《数学名词》中正式将译名定为“行列式”。其后“行列式”作为译名沿用至今。[ 47]
行列式的一个主要应用是解线性方程组 。当线性方程组的方程个数与未知数 个数相等时,方程组不一定总是有唯一解。对一个有n 个方程和n 个未知数的线性方程组,我们研究未知数系数所对应的行列式。这个线性方程组有唯一解当且仅当 它对应的行列式不为零。这也是行列式概念出现的根源[ 40] :361 。
当线性方程组对应的行列式不为零时,由克莱姆法则 ,可以直接以行列式的形式写出方程组的解。但用克莱姆法则求解计算量巨大,因此并没有实际应用价值,一般用于理论上的推导[ 48] 。
矩阵的概念出现得比行列式晚,直到十九世纪中期才被引入,然而两者在本质上仍然有密切关系。通过矩阵,线性方程组可以表示为
A
x
=
b
{\displaystyle \mathbf {A} x=b}
其中
A
{\displaystyle \mathbf {A} }
是由方程组中未知数的系数构成的方块矩阵,
x
=
(
x
1
,
x
2
,
⋯
,
x
n
)
T
{\displaystyle x=(x_{1},x_{2},\cdots ,x_{n})^{\mathbf {T} }}
是未知数,而
b
=
(
b
1
,
b
2
,
⋯
,
b
n
)
T
{\displaystyle b=(b_{1},b_{2},\cdots ,b_{n})^{\mathbf {T} }}
。
在矩阵理论中,行列式也有各种用途。多项式
p
(
x
)
=
det
(
x
I
−
A
)
{\displaystyle p(x)=\det(xI-A)}
称为方块矩阵A 的特征多项式。这是一个由行列式定义的多项式,它的解是矩阵所有的特征值 。换句话说,x 是矩阵A 的特征值当且仅当xI - A 不是可逆矩阵。特征值多项式在矩阵理论中有重要的应用[ 2] :213-214 。
西尔维斯特准则 则将实 埃尔米特矩阵 的正定性 与其主对角线上的子矩阵 的行列式对应起来。如果n 阶实系数埃尔米特矩阵
A
=
(
a
i
j
)
1
≤
i
,
j
≤
n
{\displaystyle A=(a_{ij})_{1\leq i,j\leq n}}
的所有主子矩阵:
A
k
=
(
a
i
j
)
1
≤
i
,
j
≤
k
,
1
≤
k
≤
n
{\displaystyle A_{k}=(a_{ij})_{1\leq i,j\leq k},\,\,1\leq k\leq n}
的行列式都是正数,那么A 的所有特征值都是正数,即A 为正定矩阵 。
早在高斯的时代,行列式就和多项式的研究联系在一起。行列式的一个应用是在所谓的“结式 ”上。结式是两个多项式
p
{\displaystyle \displaystyle p}
和
q
{\displaystyle \displaystyle q}
的西尔维斯特矩阵 的行列式。两个多项式的结式等于0 当且仅当它们有高于或等于一次的公因子多项式。结式还可以判断多项式是否有重根:如果多项式
p
{\displaystyle \displaystyle p}
和它的微分多项式
p
′
{\displaystyle \displaystyle p^{\prime }}
的结式不为零,那么这个多项式没有重根,否则有重根[ 49] 。
行列式在多项式逼近理论 中也有出现。给定一组插值点,判别插值多项式的存在性需要看所谓的范德蒙矩阵 ,而由于范德蒙矩阵的行列式不为零,因此根据克莱姆法则,插值多项式唯一存在(次数小于插值点个数)[ 50] :247 。
朗斯基行列式是函数矩阵的行列式,因此本身也是一个函数。给定n 个n- 1次连续 可微 函数,f1 、...、fn ,它们的朗斯基行列式W(f1 , ..., fn ) 为:
W
(
f
1
,
…
,
f
n
)
(
t
)
=
|
f
1
(
t
)
f
2
(
t
)
⋯
f
n
(
t
)
f
1
′
(
t
)
f
2
′
(
t
)
⋯
f
n
′
(
t
)
⋮
⋮
⋱
⋮
f
1
(
n
−
1
)
(
t
)
f
2
(
n
−
1
)
(
t
)
⋯
f
n
(
n
−
1
)
(
t
)
|
{\displaystyle W(f_{1},\ldots ,f_{n})(t)={\begin{vmatrix}f_{1}(t)&f_{2}(t)&\cdots &f_{n}(t)\\f_{1}'(t)&f_{2}'(t)&\cdots &f_{n}'(t)\\\vdots &\vdots &\ddots &\vdots \\f_{1}^{(n-1)}(t)&f_{2}^{(n-1)}(t)&\cdots &f_{n}^{(n-1)}(t)\end{vmatrix}}}
[ 51] :15-17
可以证明,如果f1 、...、fn 线性相关,那么它们的朗斯基行列式恒等于零[ 51] :15-17 。
在线性微分动力系统理论中,朗斯基行列式用来判别若干个解的线性相关性。如果n 个解f1 、...、fn 线性无关,那么它们的朗斯基行列式将总不为零[ 52] 。根据刘维尔定理,n 维空间上的线性微分方程:
Y
′
=
A
(
t
)
Y
{\displaystyle Y^{\prime }=A(t)Y}
的基础解系所构成的朗斯基行列式
W
(
t
)
{\displaystyle W(t)}
满足:
W
′
(
t
)
=
t
r
A
(
t
)
W
(
t
)
{\displaystyle W'(t)={\rm {tr}}\,A(t)W(t)}
,[ 51] :15-17
同样地,线性微分方程:
y
(
n
)
=
a
0
(
t
)
y
+
a
1
(
t
)
y
′
+
a
2
(
t
)
y
″
+
.
.
.
+
a
n
−
1
(
t
)
y
(
n
−
1
)
{\displaystyle y^{(n)}=a_{0}(t)y+a_{1}(t)y'+a_{2}(t)y''+...+a_{n-1}(t)y^{(n-1)}\,}
的基础解系所构成的朗斯基行列式
W
(
t
)
{\displaystyle W(t)}
满足:
W
′
(
t
)
=
a
n
−
1
(
t
)
W
(
t
)
{\displaystyle W'(t)=a_{n-1}(t)W(t)}
[ 51] :15-17
雅可比行列式是把一个体积元(蓝色)变换成另一个(红色)时两者的体积之比
行列式体现了线性变换对于空间体积的作用,对于非线性的函数,其对体积的影响更为复杂,但对于足够“良好”的函数,在一个微小的范围内,比如说在空间中一点的附近,可以将函数的效果近似地用线性的变换来代替。由此,对于某些函数,也可以将它在某一点附近的作用效果用它在这一点上的偏导数构成的矩阵(称为雅可比矩阵 )来表示。这类行列式被称为“雅可比行列式 ”,即是雅可比矩阵 的行列式,只对连续可微 的函数有定义[ 53] :112-115 。
在计算“体积”的多重积分中,雅可比行列式应用于换元积分 的时候。积分的思想是将空间割成许多个微小的体积元,称为积分元素,再将每个体积元上的函数值乘以体积元的体积后相加。将一个积分元素换为另一个积分元素时,实际上作了一次对空间中体积的度量方式的改变:分划体积元的方式不同了。譬如在二维空间中,将直角坐标 积分换为极坐标 积分时,面积元素由方块区域变成扇形区域。因此,要测量这种体积度量方式的改变,可以将这种变换看成一个非线性的变换函数(实际上是一个微分同胚 ):
φ
:
R
n
⟶
R
n
{\displaystyle \varphi :\mathbb {R} ^{n}\longrightarrow \mathbb {R} ^{n}}
。而它在每一点的影响可以通过雅可比行列式来体现[ 54] :79-85 。
运用雅可比行列式的还有非线性方程组的数值求解。对于一般的非线性方程组,不存在求解公式,只能够用数值分析的方法求近似解。求近似解的基本思想也是将非线性问题在局部的地方逐步线性化,化归为线性方程组来求解。设有方程组:
{
f
1
(
x
1
,
x
2
,
⋯
,
x
n
)
=
0
⋮
⋮
f
n
(
x
1
,
x
2
,
⋯
,
x
n
)
=
0
{\displaystyle {\begin{cases}f_{1}(x_{1},x_{2},\cdots ,x_{n})=0\\\quad \vdots \qquad \qquad \qquad \vdots \quad \\f_{n}(x_{1},x_{2},\cdots ,x_{n})=0\end{cases}}}
其中
f
=
(
f
1
,
⋯
,
f
n
)
{\displaystyle f=(f_{1},\cdots ,f_{n})}
是连续可微函数,并在解的附近雅可比行列式不为零,那么可以用牛顿法迭代求得近似解。迭代程序为:
f
(
x
(
k
+
1
)
)
=
x
(
k
)
−
det
(
J
f
(
x
(
k
)
)
)
−
1
f
(
x
(
k
)
)
(
k
=
0
,
1
,
⋯
)
{\displaystyle f(x^{(k+1)})=x^{(k)}-\det(\mathbf {J} _{f}(x^{(k)}))^{-1}f(x^{(k)})\qquad (k=0,1,\cdots )}
其中的
x
(
k
)
=
(
x
1
(
k
)
,
x
2
(
k
)
,
⋯
,
x
n
(
k
)
)
{\displaystyle x^{(k)}=(x_{1}^{(k)},x_{2}^{(k)},\cdots ,x_{n}^{(k)})}
是第k 次迭代时的解的近似数值。每次迭代时先求解关于线性方程组
J
f
(
x
(
k
)
)
Δ
x
(
k
)
=
f
(
x
(
k
)
)
{\displaystyle \mathbf {J} _{f}(x^{(k)})\Delta x^{(k)}=f(x^{(k)})}
然后计算新的近似值
x
(
k
+
1
)
=
x
(
k
)
−
Δ
x
(
k
)
{\displaystyle x^{(k+1)}=x^{(k)}-\Delta x^{(k)}}
[ 55]
在实际应用中,还需要考虑带有参数的非线性方程组:
{
f
1
(
x
1
,
x
2
,
⋯
,
x
n
,
λ
)
=
0
⋮
⋮
f
n
(
x
1
,
x
2
,
⋯
,
x
n
,
λ
)
=
0
{\displaystyle {\begin{cases}f_{1}(x_{1},x_{2},\cdots ,x_{n},\lambda )=0\\\quad \vdots \qquad \qquad \qquad \vdots \quad \\f_{n}(x_{1},x_{2},\cdots ,x_{n},\lambda )=0\end{cases}}}
其中的
λ
{\displaystyle \lambda }
可以代表温度 、外力 等环境因素。当环境改变时,方程解上的雅可比行列式可能从非零变为零。雅可比行列式为零的点称为临界点或分支点,是方程的解改变性质的地方。和线性方程组类似,当雅可比行列式的值为零时,方程组会出现局部多值的情况。寻找分支点和分支方向的研究是非线性方程求解的一大问题。[ 56]
^ ,因为行列式按照定义可以看成关于矩阵系数的多项式。另一方面,若干个复数乘积或和的共轭等于其共轭的乘积或和。从而当每个系数都取共轭后,行列式这个多项式的值也变成原来的共轭。
^ 2014年François Le Gall将
ω
{\displaystyle \omega }
改进为2.3728639
^ 1.0 1.1 1.2 1.3 1.4 (中文) 项武义. 《基础代数学》. 人民教育出版社. 2004. ISBN 7-107-17679-X .
^ 2.00 2.01 2.02 2.03 2.04 2.05 2.06 2.07 2.08 2.09 2.10 2.11 2.12 (中文) 居余马、林翠琴. 《线性代数》. 清华大学出版社. 2002. ISBN 978-7-302-06507-4 .
^ 3.0 3.1 3.2 3.3 3.4 (中文) 张贤科. 《高等代数学》第二版. 清华大学出版社. 2002. ISBN 978-7-302-11088-0 .
^ 4.0 4.1 4.2 (英文) Harold M. Edwards. Linear Algebra . Springer-Verlag New York. 2004年. ISBN 978-0-817-63731-6 .
^ 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 (英文) Werner Hildbert Greub. linear algebra . Springer Verlag. 1975. ISBN 978-0-387-90110-7 .
^ 6.0 6.1 (英文) Gilbert Strang. Linear algebra and its applications . Thomson, Brooks/Cole, Belmont, CA. 2006. ISBN 9780534422004 .
^ (法文) Robert COQUEREAU. Espaces fibrés et Connexions . 2002.
^ 8.0 8.1 8.2 8.3 (英文) Steven Roman. Advanced Linear Algebra . Springer. 2005. ISBN 0-387-24766-1 .
^ (英文) Paul Moritz Cohn. Further algebra and applications . Springer. 2003. ISBN 978-1-852-33667-7 .
^ (英文) A theory of noncommutative determinants and characteristic functions of graphs (PDF) . Functional Analysis and Its Applications (Springer New York). doi:10.1007/BF01075044 .
^ (英文) I. Gelfand, V. Retakh, R. L. Wilson. Quaternionic Quasideterminants and Determinants (PDF) . Quantum Algebra. 2002.
^ (英文) The Cauchy-Binet Formula (PDF) . [2010-05-19 ] .
^ (英文) Gabe Cunningham. The General Linear Group (PDF) . [2010-05-19 ] .
^ (英文) Richard Bronson, Gabriel B. Costa. Linear Algebra: An Introduction . Academic Press. 2007. ISBN 9780120887842 .
^ 15.0 15.1 (英文) N.丹佛,J.T.施瓦茨. 《线性算子》第一章:一般理论. Interscience. 1958.
^ 16.0 16.1 16.2 (英文) Mike Brookes. The Matrix Reference Manual . Imperial College. [2010-02-02 ] .
^ (英文) Roger A. Horn, Charles R. Johnson. Topics in Matrix Analysis . Cambridge University Press. 1991. ISBN 978-0-521-46713-1 .
^ (英文) William H. Press, Brian P. Flannery, Saul A. Teukolsky, William T. Vetterling. Numerical Recipes in C: The Art of Scientific Computing, Second Edition . Cambridge University Press. 1992. ISBN 978-0521431088 .
^ 19.0 19.1 (英文) Erich Kaltofen, Gilles Villard. On the complexity of computing determinants (PDF) . Computational Complexity. doi:10.1007/s00037-004-0185-3 .
^ (英文) Gilles Villard. Exact computation of the determinant and of the inverse of a matrix (PDF) . CNRS - LIP ENS Lyon, INRIA. 2002.
^ (英文) Joel N. Franklin. Matrix Theory . Dover Publications. 2000. ISBN 978-0486411798 .
^ (英文) John O'Connor. The linear groups . [2010-05-20 ] .
^ (英文) Lawrence Conlon. Differentiable manifolds , 2nd edition. Birkhäuser Boston;. 2001. ISBN 978-0817641344 .
^ (英文) Rajendra Bhatia, Tanvi Jai. Higher order derivatives and perturbation Bounds for determinants (PDF) . Indian Statistical Institute, Delhi Centre. [2010-05-20 ] .
^ (中文) 张贤达. 矩阵分析与应用. 清华大学出版社. 2008. ISBN 9787302092711 .
^ (英文) Vladimir G. Ivancevic,Tijana T. Ivancevic. Applied differential geometry: a modern introduction . World Scientific Publishing Company. 2007. ISBN 978-9812706140 .
^ 27.0 27.1 (英文) Joesph J.Rotman. Advanced Modern Algebra . Prentice Hall. 2002. ISBN 978-0-130-87868-7 .
^ (德文) E Knobloch. Determinants , in I Grattan-Guinness (ed.), Companion Encyclopedia of the History and Philosophy of the Mathematical Sciences. London year = 1994: Routledge.
^ 29.0 29.1 (英文) J J O'Connor、E F Robertson. Matrices and determinants .
^ (中文) 曹亮吉. 《關孝和》 . 《科学月刊》第十八卷第二、第三期.
^ (德文) Gottfried Wilhelm, Freiherr von Leibniz. 《莱布尼兹数学文献》(Leibnizens mathematische Schriften )第二卷 . Berlin: A. Asher. 1849-63.
^ (中文) 《行列式》 . 香港教育发展组教育资讯站. [2009-12-10 ] .
^ (德文) E. Knobloch. Der Beginn der Determinantentheorie, Leibnizens nachgelassene Studien zum Determinantenkalkül . Hildesheim. 1980.
^ (英文) C. B. Boyer. A History of Mathematics . John Wiley. 1968.
^ (法文) 加布里尔·克拉默 . Introduction à l'analyse des lignes courbes algébraique . 1750.
^ (德文) M. Cantor. Geschichte der Mathematik . Teubner. 1913.
^ 37.0 37.1 37.2 37.3 (法文) 艾蒂安·裴蜀 . Recherches sur le degré des équations résultantes de l'évanouissement des inconnues, et sur le moyens qu'il convient d'employer pour trouver ces équations . Mém. Acad. Roy. Sci Paris. 1764.
^ (法文) 亚历山德·西奥菲勒·范德蒙德. Mémoire sur l'élimination, Hist. de l'Acad. Roy. des Sciences Paris . 2e partie. 1772.
^ (法文) 拉格朗日 . Nouvelle solution du problème du mouvement de rotation d'un corps de figure quelconque qui n'est animé par aucune force accélératrice . Nouveaux mémoires de l'Académie royale des sciences et des belles-lettres de Berlin. 1773.
^ 40.0 40.1 40.2 40.3 40.4 (中文) 莫里斯·克莱因 著,张理京、张锦炎、江泽涵 译. 《古今数学思想》第二卷. 上海科学技术出版社. 2002. ISBN 7-5323-6172-1 .
^ (法文) Mémoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et des signes contraires par suite des transpositions opérées entre les variables qu'elles renferment . Journal de l'Ecole Polytechnique (l'Ecole Royale Polytechnique). 1815: 29–112.
^ (英文) Thomas Hawkins. The Mathematics of Frobenius in Context: A Journey Through 18th to 20th Century Mathematics . Springer. 2013. ISBN 978-1461463320 .
^ (德文) K. Weierstrass. Über ein die homogenen Functionen zweiten Grades betreffendes Theorem . Monatsberichte der Akademie der Wiss (Berlin). 1858: 207–220.
^ (英文) An Enumeration of The Contacts of Lines and Surfaces of Second Order . Philosophical Magazine. 1851, 1 : 119–140.
^ 45.0 45.1 45.2 (中文) 莫里斯·克莱因 著,张理京、张锦炎、江泽涵 译. 《古今数学思想》第三卷. 上海科学技术出版社. 2002. ISBN 7-5323-6172-1 .
^ (德文) Carl Gustav Jakob. De determinantibus Functionalibus 22 . Paul Stäckel. 1841.
^ (中文) 杨洁菊. 《行列式理论历史研究》. 西北大学博士论文. 2004.
^ (中文) 卢刚. 《线性代数与解析几何》. 高等教育出版社. 2005. ISBN 978-7-040-13651-7 .
^ (中文) 王东明,夏壁灿. 《计算机代数》. 清华大学出版社. 2004. ISBN 9787302159193 .
^ (英文) Matheus Grasselli,Dmitry Pelinovsky. Numerical mathematics . Jones & Bartlett. 2008. ISBN 978-0-763-73767-2 .
^ 51.0 51.1 51.2 51.3 (英文) Andy R. Magid. Lectures on differential Galois theory . American Mathematical Society. 1994. ISBN 978-0821870044 .
^ (中文) 王高雄,周之铭,朱思铭,王寿松. 《常微分方程》. 高等教育出版社. 2006. ISBN 978-7-040-19366-4 .
^ (中文) 清华大学数学科学系《微积分》编写组. 《微积分》. 清华大学出版社. 2004. ISBN 978-7-302-06004-8 .
^ (中文) 齐民友. 《重温微积分》. 高等教育出版社. 2004. ISBN 7-040-12931-0 .
^ (中文) 李庆扬,莫孜中,祁力群. 《非线性方程组的数值解法》. 科学出版社. 1999. ISBN 7-030-02846-5 .
^ (中文) 武际可,滕宁,钩袁勇. 《分叉问题及其计算方法》 (PDF) . 《力学与实践》. 1987, 第4期 .