从穆尔-彭罗斯条件出发,彭罗斯推导出了穆尔-彭罗斯广义逆的一些性质[ 3] :
(
A
H
)
†
=
(
A
†
)
H
{\displaystyle ({\boldsymbol {A}}^{H})^{\dagger }=({\boldsymbol {A}}^{\dagger })^{H}}
A
†
A
A
H
=
A
H
A
A
†
=
A
H
{\displaystyle {\boldsymbol {A}}^{\dagger }{\boldsymbol {A}}{\boldsymbol {A}}^{H}={\boldsymbol {A}}^{H}{\boldsymbol {A}}{\boldsymbol {A}}^{\dagger }={\boldsymbol {A}}^{H}}
A
A
H
(
A
H
)
†
=
(
A
H
)
†
A
H
A
=
A
{\displaystyle {\boldsymbol {A}}{\boldsymbol {A}}^{H}({\boldsymbol {A}}^{H})^{\dagger }=({\boldsymbol {A}}^{H})^{\dagger }{\boldsymbol {A}}^{H}{\boldsymbol {A}}={\boldsymbol {A}}}
A
†
A
{\displaystyle {\boldsymbol {A}}^{\dagger }{\boldsymbol {A}}}
,
A
A
†
{\displaystyle {\boldsymbol {A}}{\boldsymbol {A}}^{\dagger }}
,
(
I
−
A
†
A
)
{\displaystyle ({\boldsymbol {I}}-{\boldsymbol {A}}^{\dagger }{\boldsymbol {A}})}
和
(
I
−
A
†
A
)
{\displaystyle ({\boldsymbol {I}}-{\boldsymbol {A}}^{\dagger }{\boldsymbol {A}})}
都是幂等矩阵。
伪逆存在且唯一:对于任何矩阵
A
{\displaystyle A}
,恰好有一个矩阵
A
†
{\displaystyle A^{\dagger }}
满足定义的四个性质。[ 4]
满足该定义的第一个条件的矩阵被称为广义逆。如果该矩阵也满足第二个定义,它就被称为广义反身逆阵 (generalized reflexive inverse)。广义逆矩阵总存在,但一般不唯一。唯一性是最后两个条件的结果。
这些性质的证明可以在维基教科书中找到。
如果
A
{\displaystyle A}
有实数项,那么
A
†
{\displaystyle A^{\dagger }}
也有。
如果
A
{\displaystyle A}
是可逆的,它的伪逆就是它的逆矩阵,即:
A
†
=
A
−
1
{\displaystyle A^{\dagger }=A^{-1}}
.[ 5] :243
零矩阵 的伪逆是它的转置。
矩阵伪逆的伪逆是原矩阵,即:
(
A
†
)
†
=
A
{\displaystyle \left(A^{\dagger }\right)^{\dagger }=A}
.[ 5] :245
伪转置与转置、复共轭和共轭转置可以交换:[ 5] :245
(
A
T
)
†
=
(
A
†
)
T
{\displaystyle \left(A^{\textsf {T}}\right)^{\dagger }=\left(A^{\dagger }\right)^{\textsf {T}}}
,
(
A
¯
)
†
=
A
†
¯
{\displaystyle \left({\overline {A}}\right)^{\dagger }={\overline {A^{\dagger }}}}
,
(
A
∗
)
†
=
(
A
†
)
∗
{\displaystyle \left(A^{*}\right)^{\dagger }=\left(A^{\dagger }\right)^{*}}
.
矩阵
A
{\displaystyle A}
的标量乘法的伪逆是
A
†
{\displaystyle A^{\dagger }}
的标量的倒数的乘法:
(
α
A
)
†
=
α
−
1
A
†
{\displaystyle \left(\alpha A\right)^{\dagger }=\alpha ^{-1}A^{\dagger }}
对于
α
≠
0
{\displaystyle \alpha \neq 0}
.
下面的恒等式可以用来判定部分涉及伪逆的子表达式的正确性:
A
=
A
A
∗
A
†
∗
=
A
†
∗
A
∗
A
{\displaystyle A={}A{}A^{*}{}A^{\dagger *}{}={}A^{\dagger *}{}A^{*}{}A}
同样的,将
A
†
{\displaystyle A^{\dagger }}
替换为
A
{\displaystyle A}
会得到:
A
†
=
A
†
A
†
∗
A
∗
=
A
∗
A
†
∗
A
†
{\displaystyle A^{\dagger }={}A^{\dagger }{}A^{\dagger *}{}A^{*}{}={}A^{*}{}A^{\dagger *}{}A^{\dagger }}
当用
A
∗
{\displaystyle A^{*}}
替代
A
{\displaystyle A}
时,会得到:
A
∗
=
A
∗
A
A
+
=
A
+
A
A
∗
.
{\displaystyle A^{*}={}A^{*}{}A{}A^{+}{}={}A^{+}{}A{}A^{*}.}
伪逆的计算可以简化为其在埃尔米特 情况下的构造,这可以通过等价关系实现:
A
+
=
(
A
∗
A
)
+
A
∗
,
{\displaystyle A^{+}=\left(A^{*}A\right)^{+}A^{*},}
A
+
=
A
∗
(
A
A
∗
)
+
,
{\displaystyle A^{+}=A^{*}\left(AA^{*}\right)^{+},}
其中
A
∗
A
{\displaystyle A^{*}A}
和
A
A
∗
{\displaystyle AA^{*}}
是埃尔米特矩阵。
令
A
∈
k
m
×
n
,
B
∈
k
n
×
p
{\displaystyle A\in \mathbb {k} ^{m\times n},\ B\in \mathbb {k} ^{n\times p}}
,下列等式等价:[ 6]
(
A
B
)
†
=
B
†
A
†
{\displaystyle (AB)^{\dagger }=B^{\dagger }A^{\dagger }}
A
†
A
B
B
∗
A
∗
=
B
B
∗
A
∗
,
B
B
†
A
∗
A
B
=
A
∗
A
B
.
{\textstyle {\begin{aligned}A^{\dagger }ABB^{*}A^{*}&=BB^{*}A^{*},\\BB^{\dagger }A^{*}AB&=A^{*}AB.\end{aligned}}}
(
A
†
A
B
B
∗
)
∗
=
A
†
A
B
B
∗
,
(
A
∗
A
B
B
†
)
∗
=
A
∗
A
B
B
†
.
{\displaystyle {\begin{aligned}\left(A^{\dagger }ABB^{*}\right)^{*}&=A^{\dagger }ABB^{*},\\\left(A^{*}ABB^{\dagger }\right)^{*}&=A^{*}ABB^{\dagger }.\end{aligned}}}
A
†
A
B
B
∗
A
∗
A
B
B
†
=
B
B
∗
A
∗
A
{\displaystyle A^{\dagger }ABB^{*}A^{*}ABB^{\dagger }=BB^{*}A^{*}A}
A
†
A
B
=
B
(
A
B
)
†
A
B
,
B
B
†
A
∗
=
A
∗
A
B
(
A
B
)
†
.
{\displaystyle {\begin{aligned}A^{\dagger }AB&=B(AB)^{\dagger }AB,\\BB^{\dagger }A^{*}&=A^{*}AB(AB)^{\dagger }.\end{aligned}}}
下方列出了
(
A
B
)
+
=
B
+
A
+
{\displaystyle (AB)^{+}=B^{+}A^{+}}
的充分条件:
A
{\displaystyle A}
的列单位正交(此时
A
∗
A
=
A
†
A
=
I
n
{\displaystyle A^{*}A=A^{\dagger }A=I_{n}}
),或
B
{\displaystyle B}
的行单位正交 (此时
B
B
∗
=
B
B
†
=
I
n
{\displaystyle BB^{*}=BB^{\dagger }=I_{n}}
) ,或
A
{\displaystyle A}
的列线性无关(此时
A
†
A
=
I
{\displaystyle A^{\dagger }A=I}
) 同时
B
{\displaystyle B}
的行线性无关(此时
B
B
†
=
I
{\displaystyle BB^{\dagger }=I}
),或
B
=
A
∗
{\displaystyle B=A^{*}}
,或
B
=
A
†
{\displaystyle B=A^{\dagger }}
。
下方列出了
(
A
B
)
†
=
B
†
A
†
{\displaystyle (AB)^{\dagger }=B^{\dagger }A^{\dagger }}
的必要条件:
(
A
†
A
)
(
B
B
†
)
=
(
B
B
†
)
(
A
†
A
)
{\displaystyle (A^{\dagger }A)(BB^{\dagger })=(BB^{\dagger })(A^{\dagger }A)}
由最后一个充分条件得出等式:
(
A
A
∗
)
+
=
A
+
∗
A
+
,
(
A
∗
A
)
+
=
A
+
A
+
∗
.
{\displaystyle {\begin{aligned}\left(AA^{*}\right)^{+}&=A^{+*}A^{+},\\\left(A^{*}A\right)^{+}&=A^{+}A^{+*}.\end{aligned}}}
注意: 等式
(
A
B
)
†
=
B
†
A
†
{\displaystyle (AB)^{\dagger }=B^{\dagger }A^{\dagger }}
一般不成立,例如:
(
(
1
1
0
0
)
(
0
0
1
1
)
)
+
=
(
1
1
0
0
)
+
=
(
1
2
0
1
2
0
)
≠
(
1
4
0
1
4
0
)
=
(
0
1
2
0
1
2
)
(
1
2
0
1
2
0
)
=
(
0
0
1
1
)
+
(
1
1
0
0
)
+
{\displaystyle {\Biggl (}{\begin{pmatrix}1&1\\0&0\end{pmatrix}}{\begin{pmatrix}0&0\\1&1\end{pmatrix}}{\Biggr )}^{+}={\begin{pmatrix}1&1\\0&0\end{pmatrix}}^{+}={\begin{pmatrix}{\tfrac {1}{2}}&0\\{\tfrac {1}{2}}&0\end{pmatrix}}\quad \neq \quad {\begin{pmatrix}{\tfrac {1}{4}}&0\\{\tfrac {1}{4}}&0\end{pmatrix}}={\begin{pmatrix}0&{\tfrac {1}{2}}\\0&{\tfrac {1}{2}}\end{pmatrix}}{\begin{pmatrix}{\tfrac {1}{2}}&0\\{\tfrac {1}{2}}&0\end{pmatrix}}={\begin{pmatrix}0&0\\1&1\end{pmatrix}}^{+}{\begin{pmatrix}1&1\\0&0\end{pmatrix}}^{+}}
P
=
A
A
†
{\displaystyle P=AA^{\dagger }}
和
Q
=
A
†
A
{\displaystyle Q=A^{\dagger }A}
是正交投影算子,即它们是埃尔米特矩阵(
P
=
P
∗
{\displaystyle P=P^{*}}
,
Q
=
Q
∗
{\displaystyle Q=Q^{*}}
)和幂等矩阵(
P
2
=
P
{\displaystyle P^{2}=P}
,
Q
2
=
Q
{\displaystyle Q^{2}=Q}
)。以下性质成立:
P
A
=
A
Q
=
A
{\displaystyle PA=AQ=A}
,
A
†
P
=
Q
A
†
=
A
†
{\displaystyle A^{\dagger }P=QA^{\dagger }=A^{\dagger }}
P
{\displaystyle P}
是正交投影算子,投影到
A
{\displaystyle A}
的值域(也就是
A
∗
{\displaystyle A^{*}}
的核 的正交补空间)。
Q
{\displaystyle Q}
是正交投影算子,投影到
A
∗
{\displaystyle A^{*}}
的值域(也就是
A
{\displaystyle A}
的核的正交补空间)。
(
I
−
Q
)
=
(
I
−
A
†
A
)
{\displaystyle (I-Q)=\left(I-A^{\dagger }A\right)}
是正交投影算子,投影到
A
{\displaystyle A}
的核。
(
I
−
P
)
=
(
I
−
A
A
†
)
{\displaystyle (I-P)=\left(I-AA^{\dagger }\right)}
是正交投影算子,投影到
A
∗
{\displaystyle A^{*}}
的核。[ 4]
最后两条性质隐含了下列等式:
A
(
I
−
A
†
A
)
=
(
I
−
A
A
†
)
A
=
0
{\displaystyle A\,\ \left(I-A^{\dagger }A\right)=\left(I-AA^{\dagger }\right)A\ \ =0}
A
∗
(
I
−
A
A
†
)
=
(
I
−
A
†
A
)
A
∗
=
0
{\displaystyle A^{*}\left(I-AA^{\dagger }\right)=\left(I-A^{\dagger }A\right)A^{*}=0}
如果
A
∈
k
n
×
n
{\displaystyle A\in \mathbb {k} ^{n\times n}}
是埃尔米特矩阵和幂等矩阵(当且仅当它为正交投影矩阵),则对于任意矩阵
B
∈
k
m
×
n
{\displaystyle B\in \mathbb {k} ^{m\times n}}
,下式成立:[ 7]
A
(
B
A
)
†
=
(
B
A
)
†
{\displaystyle A(BA)^{\dagger }=(BA)^{\dagger }}
这一条性质可以如此证明:定义矩阵
C
=
B
A
{\displaystyle C=BA}
,
D
=
A
(
B
A
)
†
{\displaystyle D=A(BA)^{\dagger }}
,当
A
{\displaystyle A}
是埃尔米特矩阵和幂等矩阵时,通过验证伪逆的性质可以检查
D
{\displaystyle D}
确实是
C
{\displaystyle C}
的一个伪逆。从上一条性质可以看出,当
A
∈
k
n
×
n
{\displaystyle A\in \mathbb {k} ^{n\times n}}
是埃尔米特矩阵和幂等矩阵时,对于任意矩阵
B
∈
k
n
×
m
{\displaystyle B\in \mathbb {k} ^{n\times m}}
(
A
B
)
†
A
=
(
A
B
)
†
{\displaystyle (AB)^{\dagger }A=(AB)^{\dagger }}
当
A
{\displaystyle A}
是一个正交投影矩阵,则它的伪逆就是它自身,即
A
†
=
A
{\displaystyle A^{\dagger }=A}
。
如果我们把矩阵看作是一个在数域
k
{\displaystyle \mathbb {k} }
上的线性映射
A
:
k
n
→
k
m
{\displaystyle A:\mathbb {k} ^{n}\to \mathbb {k} ^{m}}
, 那么
A
†
:
k
m
→
k
n
{\displaystyle A^{\dagger }:\mathbb {k} ^{m}\to \mathbb {k} ^{n}}
可以被分解如下。首先定义符号:
⊕
{\displaystyle \oplus }
表示直和,
⊥
{\displaystyle \perp }
表示正交补,
ker
{\displaystyle \ker }
表示映射的核,
ran
{\displaystyle \operatorname {ran} }
表示映射的像。注意
k
n
=
(
ker
A
)
⊥
⊕
ker
A
{\displaystyle \mathbb {k} ^{n}=\left(\ker A\right)^{\perp }\oplus \ker A}
和
k
m
=
ran
A
⊕
(
ran
A
)
⊥
{\displaystyle \mathbb {k} ^{m}=\operatorname {ran} A\oplus \left(\operatorname {ran} A\right)^{\perp }}
。 限制条件
A
:
(
ker
A
)
⊥
→
ran
A
{\displaystyle A:\left(\ker A\right)^{\perp }\to \operatorname {ran} A}
则是一个同构。这意味着
A
†
{\displaystyle A^{\dagger }}
在
ran
A
{\displaystyle \operatorname {ran} A}
上时这个同构的逆,在
(
ran
A
)
⊥
{\displaystyle \left(\operatorname {ran} A\right)^{\perp }}
上则是零。
换而言之,对于给定的
b
∈
k
m
{\displaystyle b\in \mathbb {k} ^{m}}
要找到
A
†
b
{\displaystyle A^{\dagger }b}
,首先将
b
{\displaystyle b}
正交投影在
A
{\displaystyle A}
的值域中,找到点
p
(
b
)
{\displaystyle p(b)}
,然后构建
A
−
1
(
{
p
(
b
)
}
)
{\displaystyle A^{-1}(\{p(b)\})}
,即就是在
k
n
{\displaystyle \mathbb {k} ^{n}}
中,会被
A
{\displaystyle A}
投影到
p
(
b
)
{\displaystyle p(b)}
的点。这是
k
n
{\displaystyle \mathbb {k} ^{n}}
的一个平行于
A
{\displaystyle A}
的核的仿射子空间。这个子空间中长度最小的元素(也就是最靠近原点的元素),就是我们寻找的
A
+
b
{\displaystyle A^{+}b}
的解。它可以通过从
A
−
1
(
{
p
(
b
)
}
)
{\displaystyle A^{-1}(\{p(b)\})}
中选择任意元素,并将其投影在
A
{\displaystyle A}
的核的正交补空间而得到。
以上描述与线性系统的最小范数解密切相关。
ker
(
A
+
)
=
ker
(
A
∗
)
ran
(
A
+
)
=
ran
(
A
∗
)
{\displaystyle {\begin{aligned}\ker \left(A^{+}\right)&=\ker \left(A^{*}\right)\\\operatorname {ran} \left(A^{+}\right)&=\operatorname {ran} \left(A^{*}\right)\end{aligned}}}
伪逆可以由极限定义:
A
†
=
lim
δ
↘
0
(
A
∗
A
+
δ
I
)
−
1
A
∗
=
lim
δ
↘
0
A
∗
(
A
A
∗
+
δ
I
)
−
1
{\displaystyle A^{\dagger }=\lim _{\delta \searrow 0}\left(A^{*}A+\delta I\right)^{-1}A^{*}=\lim _{\delta \searrow 0}A^{*}\left(AA^{*}+\delta I\right)^{-1}}
(参见吉洪诺夫正则化 )。当
(
A
A
∗
)
−
1
{\displaystyle \left(AA^{*}\right)^{-1}}
或
(
A
∗
A
)
−
1
{\displaystyle \left(A^{*}A\right)^{-1}}
不存在时,这些极限仍然存在。[ 4] :263
与一般的矩阵求逆不同,求伪逆的过程并不连续:如果序列
(
A
n
)
{\displaystyle \left(A_{n}\right)}
收敛到矩阵
A
{\displaystyle A}
(在最大范数或弗罗贝尼乌斯范数意义下),则
(
A
n
)
†
{\displaystyle (A_{n})^{\dagger }}
不一定收敛于
A
†
{\displaystyle A^{\dagger }}
. 然而,如果所有的矩阵
A
n
{\displaystyle A_{n}}
与
A
{\displaystyle A}
有相同的秩,则
(
A
n
)
†
{\displaystyle (A_{n})^{\dagger }}
将收敛于
A
†
{\displaystyle A^{\dagger }}
.[ 8]
实值伪逆矩阵的导数,该矩阵在某点
x
{\displaystyle x}
处具有恒定的秩 可以用原矩阵的导数来计算:[ 9]
d
d
x
A
†
(
x
)
=
−
A
†
(
d
d
x
A
)
A
†
+
A
†
A
†
T
(
d
d
x
A
T
)
(
I
−
A
A
†
)
+
(
I
−
A
†
A
)
(
d
d
x
A
T
)
A
†
T
A
†
{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} x}}A^{\dagger }(x)=-A^{\dagger }\left({\frac {\mathrm {d} }{\mathrm {d} x}}A\right)A^{\dagger }~+~A^{\dagger }A^{\dagger {\textsf {T}}}\left({\frac {\mathrm {d} }{\mathrm {d} x}}A^{\textsf {T}}\right)\left(I-AA^{\dagger }\right)~+~\left(I-A^{\dagger }A\right)\left({\frac {\text{d}}{{\text{d}}x}}A^{\textsf {T}}\right)A^{\dagger {\textsf {T}}}A^{\dagger }}