矩陣指數(matrix exponential)是方塊矩陣的一種矩陣函數,與指數函數類似。矩陣指數給出了矩陣李代數與對應的李群之間的關係。

Xn×n實數複數矩陣X的指數,用eX或exp(X)來表示,是由以下冪級數所給出的n×n矩陣:

以上的級數總是收斂的,因此X的指數是定義良好的。注意,如果X是1×1的矩陣,則X的矩陣指數就是由X的元素的指數所組成的1×1矩陣。

性質

編輯

基本性質

編輯

XYn×n的複數矩陣,並設ab為任意的複數。我們把n×n單位矩陣記為I,把零矩陣記為0。

我們可以從指數級數的定義直接得到矩陣指數的如下性質[1]

  • e0 = I
  • exp(XT) = (exp X)T,其中XT表示X轉置。從中可以推出,如果X對稱矩陣,則eX也是對稱矩陣;如果X斜對稱矩陣,則eX正交矩陣

接下來是一個關鍵性質:

  • 如果 那麼  

由此導出的推論有:

  • eaXebX = e(a + b)X
  • eXeX = I

線性微分方程

編輯

矩陣指數的一個重要性,是它可以用來解微分方程。從(1)可知,以下微分方程

 

其中A是矩陣,具有解

 

矩陣指數也可以用來解非齊次方程:

 

參見以下的例子

A不是常數時,以下形式的微分方程沒有閉式解:

 

馬格努斯級數可以給出無窮級數形式的解。

矩陣指數的行列式

編輯

根據雅可比公式,對任意復矩陣,下列跡等式成立:[2]

 

除了提供一種額外的計算工具,這個等式還表明矩陣指數總是可逆矩陣。這點可以如下證明:因為上述等式的右邊恆不等於0,所以左邊det(eA) ≠ 0,從而eA必可逆。

指數相加

編輯

我們知道,對於任何實數(純量)xy,指數函數都滿足公式ex + y = exey。類似的等式對於可交換矩陣也成立:如果矩陣XY是可交換的(即XY = YX),則:

 

但是,如果它們不是可交換的,則以上的等式不一定成立。

這個命題反過來不成立:eX+Y=eXeY並不一定就意味著XY是可交換的。但是,如果XY只含有代數數,而且它們的大小至少為2×2,則反過來也成立[3]

XY不可交換的情況可以用以下方法計算:

李乘積公式

編輯

即使  不可交換, 可以用李乘積公式來計算[4]

 

貝克爾-坎貝爾-豪斯多夫公式

編輯

從另一個方向講,如果  是元素足夠小(但不一定可交換)的矩陣,我們有:

 

其中 可以通過  的交換子的級數(貝克爾-坎貝爾-豪斯多夫公式)來計算:[5]

 

其中餘項均為與  相關的迭代交換子。

指數映射

編輯

注意矩陣的指數總是非奇異方陣eX逆矩陣eX給出。這與複數的指數總是非零的事實類似。這樣,矩陣指數就給出了一個映射:

 

這是從所有n×n矩陣的空間到一般線性群(所有非奇異方陣所組成的群)的映射。實際上,這個映射是滿射,就是說每一個非奇異方陣都可以寫成某個矩陣的指數。矩陣對數就是這個映射的逆映射。

對於任何兩個矩陣XY,我們有:

 

其中|| · ||表示任意的矩陣範數。從中可以推出,指數映射在Mn(C)的緊子集內是連續利普希茨連續的。

以下的映射

 

定義了一般線性群中的一條光滑曲線,當t = 0時穿過單位元。實際上,這給出了一般線性群的一個單參數子群,這是由於:

 

這條曲線在點t的導數(或切向量)由以下等式給出:

 

t = 0時的導數就是矩陣X,所以我們可以說,X是這個單參數子群的推廣。

更加一般地:

 

矩陣指數的計算

編輯

找到可靠而準確的方法來計算矩陣指數是很困難的,這仍然是目前數學和數值分析領域的一個重要研究課題。MatlabGNU OctaveSciPy都使用帕德近似[6][7][8] 在本節中,我們討論了原則上適用於任何矩陣的方法,並且可以對小矩陣進行顯式處理。[9] 隨後的章節描述了適合對大矩陣進行數值評估的方法。

可對角化矩陣

編輯

如果矩陣是對角的:

 

則把主對角線上的所有元素取指數,就是原矩陣的指數:

 

這也允許了我們計算可對角化矩陣的指數。如果 ,且D是對角矩陣,則 。用西爾維斯特公式,也可以得到相同的結果。

冪零矩陣

編輯

如果對於某個整數q,有Nq = 0,則矩陣N稱為冪零矩陣。在這種情況下,矩陣指數eN可以直接從級數展開式來計算,這是因為級數在有限個項後就終止了:

 

推廣

編輯

當矩陣X最小多項式可以分解為一次多項式的積時,它就可以表示為以下的和:

 

其中:

  • A是可對角化矩陣;
  • N是冪零矩陣;
  • AN是可交換的(也就是說, AN = NA)。

這稱為Dunford分解

這就是說,我們可以通過化為前兩種情況,來計算X的指數:

 

注意為了讓最後一步成立, AN必須是可交換的。

另外一個密切相關的方法,是利用X若爾當標準型。假設X = PJP −1,其中JX若爾當標準型。那麼:

 

另外,由於

 
 

因此,我們只需要知道怎樣計算若爾當塊的矩陣指數。但是,每一個若爾當塊都具有形式

 

其中N是冪零矩陣。則這個區塊的矩陣指數由下式給出:

 

計算

編輯

假設我們想要計算以下矩陣的指數。

 

它的若爾當型為:

 

其中矩陣P由下式給出:

 

我們首先來計算exp(J)。我們有:

 

1×1矩陣的指數僅僅是該矩陣的元素的指數,因此exp(J1(4)) = [e4]。 的指數可以用以上提到的公式exp(λ +N) = eλ exp(N)來算出:

 

因此,原矩陣B的指數為:

 

應用

編輯

線性微分方程

編輯

矩陣指數在解線性微分方程時十分有用。前面曾提到,以下形式的微分方程

 

具有解eCty(0)。如果我們考慮以下向量

 

我們就可以把線性微分方程表示為:

 

如果我們作一個猜想,把兩邊乘以一個積分因子 eAt,便得到:

 
 

如果我們可以計算eAt,那麼就得到了微分方程的解。

例子(齊次)

編輯

假設我們有以下的微分方程組:

 

相關的矩陣為:

 

在以上的例子中,我們計算了矩陣指數

 

因此微分方程組的通解為:

 

也就是說,

 

非齊次的情況──參數變換

編輯

對於非齊次的情況,我們可以用積分因子的方法(類似於參數變換的方法)。我們找到形為yp(t) = exp(tA)z(t)一個特解:

 
 
 

為了讓yp為方程的解,必須有:

 
 
 

因此,

 

其中c由問題的初始條件決定。

例子(非齊次)

編輯

假設我們有以下的微分方程組:

 

那麼我們有

 

以及

 

用前面的方法,我們可以得出齊次微分方程的解。由於齊次方程的通解與非齊次方程的特解的和就是非齊次方程的通解,因此我們只需要找到一個特解(用參數變換法)。

我們有:

 
 
 
 

進一步簡化,就可以得到原方程的特解。

註釋

編輯
  1. ^ Hall 2015 Proposition 2.3
  2. ^ Hall 2015 Theorem 2.12
  3. ^ (Horn & Johnson 1991,第435–437頁)
  4. ^ Hall 2015 Theorem 2.11
  5. ^ Hall 2015 Chapter 5
  6. ^ 矩阵指数 - MATLAB expm - MathWorks Deutschland. Mathworks. 2011-04-30 [2013-06-05]. (原始內容存檔於2012-07-30). 
  7. ^ GNU Octave - 矩阵的函数. Network-theory.co.uk. 2007-01-11 [2013-06-05]. (原始內容存檔於2015-05-29). 
  8. ^ scipy.linalg. expm函数文档. The SciPy Community. 2015-01-18 [2015-05-29]. (原始內容存檔於2021-02-07). 
  9. ^ Hall 2015。2.2節

參考文獻

編輯

參閱

編輯

外部連結

編輯