萊姆克-豪森算法

萊姆克-豪森算法(英語:Lemke–Howson algorithm[1]是一種計算雙矩陣博弈的納什均衡的算法,以其提出者卡爾頓·E·萊姆克和J.T.豪森的名字命名。據說它是「尋找納什均衡的組合算法中最著名的算法」。[2]

說明

編輯

該算法需要輸入兩個參與者的博弈矩陣G,這些參與者分別有m和n個純策略。G由兩個m × n的博弈矩陣A和B組成,它們分別是參與者1和2在所有決策下的收益。在這一算法中,我們假設所有的收益都是正的。

G有兩個相應的多胞形(稱為最佳回應多胞形)  ,分別為m維和n維,定義如下:

 在集合 中,其坐標用{ ,..., }表示。並且 的範圍是被 (其中 )這 個不等式以及 (其中 )這 個不等式所規定的。
 在集合 中,其坐標用{ ,..., }表示。並且 的範圍是被 (其中 )這 個不等式以及 (其中 )這 個不等式所規定的。

 表示參與人1的 個純策略的非歸一化概率分佈集合,即參與人2的期望收益最多為1。前 個約束條件要求概率是非負的,其他 個約束條件要求參與人2的n個純策略的期望收益不超過1, 同理。

 的每個頂點 都與集合 中的一組標籤相關聯。對於 ,如果在頂點 處存在 ,頂點 就會得到標籤 。對於 ,當 時,頂點 就會得到標籤 。假設 是非退化的,每個頂點都關聯到  個刻面,並且有 個標籤。在這裏需要注意的是,原點也是 的一個頂點,它所擁有的標籤集合是 

同理, 的每個頂點 都與集合 中的一組標籤相關聯。對於 ,如果在頂點 處存在 ,頂點 就會得到標籤 。對於 ,當 時,頂點 就會得到標籤 。假設 是非退化的,每個頂點都關聯到  個刻面,並且有 個標籤。在這裏需要注意的是,原點也是 的一個頂點,它所擁有的標籤集合 

對於頂點對 ,其中  ,如果滿足  的併集包含集合 中所有的標籤,那麼我們可以定義這樣一個頂點對是完全標記的。如果  分別為  的原點,那麼頂點對 是完全標記的。如果與 包含了集合 中除 之外的所有標籤,我們就定義頂點對 幾乎完全標記,在這種情況下 中存在一個標籤。

主元運算如下所示:取某頂點對 ,用 中某個與 相鄰的頂點替換 ,或者用 中某個與 相鄰的頂點替換 。這步操作的意義是在 被替換的情況下用另一個標籤替換 的某個標籤。被替換的標籤就會立刻被丟棄。對於 的任何標籤,都可以通過移動到與 相鄰且不包含與該標籤關聯的超平面的頂點來刪除該標籤。

算法從由兩個原點組成的完全標記對 開始。

特點

編輯

該算法最多能找到 個不同的納什均衡,最初放棄標籤的任何選擇決定了最終由算法找到的均衡。

參考文獻

編輯
  1. ^ C. E. Lemke and J. T. Howson. Equilibrium points of bimatrix games. SIAM Journal on Applied Mathematics. 1964, 12 (2): 413–423. doi:10.1137/0112033. 
  2. ^ Nisan, Noam; Roughgarden, Tim; Tardos, Éva; Vazirani, Vijay V. Algorithmic Game Theory (PDF). Cambridge, UK: Cambridge University Press. 2007: 33. ISBN 978-0-521-87282-9. (原始內容 (PDF)存檔於2015-02-11).