平賭 (機率論)

在機率論中，平賭（英語：martingale）是滿足下述條件的隨機過程：已知過去某一時刻 s 以及之前所有時刻的觀測值，若某一時刻 t 的觀測值的條件期望等於過去某一時刻 s 的觀測值，則稱這一隨機過程是平賭。而於博弈論中，平賭經常用來作為公平博弈的數學模型。

歷史

三維布朗運動（維納過程）

鞅的原名「martingale」原指一類於18世紀流行於法國的投注策略，稱為加倍賭注法^[1]。這類策略中最簡單的一種策略是為博弈設計的。在博弈中，賭徒會擲硬幣，若硬幣正面向上，賭徒會贏得賭本，若硬幣反面向上，賭徒會輸掉賭本。這一策略使賭徒在輸錢後加倍賭金投注，為的是在初次贏錢時贏回之前輸掉的所有錢，同時又能另外贏得與最初賭本等值的收益。當賭徒的財產和可用時間同時接近無窮時，他擲硬幣後硬幣正面向上的概率會接近1，由此看來，加倍賭注法似乎是一種必然能贏錢的策略。然而，由於現實中賭徒的資金是有限的，賭金的指數增長最終會導致使用這一策略的賭徒破產。

鞅的概念首先是由保羅·皮埃爾·萊維於1934年提出的，但他只提出了離散時間的版本，而且沒有給予命名。直到1939年，約翰·維爾（英語：Jean Ville）將此概念推廣到連續時間的情況，並且首次提出「martingale」這個名稱。約瑟夫·利奧·杜布（英語：Joseph L. Doob）等人在鞅的相關理論的初期發展做出重大貢獻，而完成這些工作的部分動機是為了表明成功的投注策略不可能存在。此外，伊藤清在分析應用方面作出了重要的貢獻。從1970年代開始，鞅論就在純粹數學和應用數學的很多領域中有廣泛的應用，特別是在數學物理和金融數學中。

定義

離散時間鞅

離散時間鞅是對於所有 n 都滿足

\mathbf {E} (\vert X_{n}\vert )<\infty

\mathbf {E} (X_{n+1}\mid X_{1},\ldots ,X_{n})=X_{n},\quad n\in \mathbb {N} ,

的時間離散的隨機過程 X₁，X₂，X_3,…，也就是說，已知之前所有觀測值，若下一次觀測值的條件期望等於本次觀測值，則稱這一隨機過程（即隨機變量序列）是離散時間鞅。

關於隨機過程的離散時間鞅

相對來說更為一般的定義如下：若對於所有 n 都滿足

\mathbf {E} (\vert Y_{n}\vert )<\infty

\mathbf {E} (Y_{n+1}\mid X_{1},\ldots ,X_{n})=Y_{n},\quad n\in \mathbb {N} ,

則稱隨機過程 Y₁，Y₂，Y₃，…是關於另一隨機過程 X₁，X₂，X₃，…的鞅。

連續時間鞅

與離散時間鞅的定義相似，連續時間鞅的定義為：若對於所有 t 都滿足

\mathbf {E} (\vert Y_{t}\vert )<\infty

\mathbf {E} (Y_{t}\mid \{X_{\tau },\tau \leq s\})=Y_{s},\ \forall \ s\leq t,

則稱關於隨機過程 X_t 的連續時間鞅是隨機過程 Y_t 。

上述定義表達了鞅的性質，即在 s ≤ t 的條件下，已知時刻 s 以及之前所有時刻的觀測值，若時刻 t 的觀測值的條件期望等於時刻 s 的觀測值，則隨機過程是鞅。

廣義的定義

更為一般性的定義如下：若隨機過程 $Y:T\times \Omega \to S$ 滿足如下性質，則稱 Y 是一個關於濾鏈 Σ_∗和概率測度 P 的鞅。

Σ_∗ 是給定機率空間 (Ω, Σ, P) 的濾鏈（英語：filtration）；
Y 是適應於濾鏈 Σ_∗ 的適應過程，即對於指標集 T 中的每一 t ，隨機變量 Y_t 是一個 Σ_t 可測函數；
對於任意 t ，Y_t 存在於 L^p 空間 L¹(Ω, Σ_t, P; S) 中，即

\mathbf {E} _{\mathbf {P} }(|Y_{t}|)<+\infty ;

對於所有 s 和 t （s < t ）和所有 F ∈ Σ_s，

\mathbf {E} _{\mathbf {P} }\left([Y_{t}-Y_{s}]\chi _{F}\right)=0,

其中 χ_F 表示事件 F 的指示函數。在 Grimmett 和 Stirzaker 的《Probability and Random Processes》一書中，最後一個條件被表示為條件期望的一般形式^[2]：

Y_{s}=\mathbf {E} _{\mathbf {P} }(Y_{t}|\Sigma _{s}),

要注意的重點是鞅成立的性質與濾鏈以及關於選定期望的機率測度都有關。Y 可能是某一測度的鞅，但不是另一測度的鞅；而要說明某一伊藤過程是鞅，則可以利用吉爾薩諾夫定理（英語：Girsanov theorem）找出相關的測度。

鞅的例子

設 X_n 是一個賭徒 n 次拋擲公平硬幣後的財產，規則是如果硬幣正面朝上，則賭徒贏得 1 美元，硬幣反面朝上，則賭徒輸掉 1 美元。在已知過去不同時刻所擁有的財產之下，下一次試驗後賭徒財產的條件期望與其現在的財產相等，故這一隨機過程是鞅。這個例子稱為賭徒謬誤。

令 Y_n = X_n² − n ，其中 X_n 是上例中賭徒的財產，則隨機過程{ Y_n : n = 1, 2, 3, ... }是鞅。這一例子可以表明賭徒的全部收益或損失大致在拋擲次數的正負平方根之間變化。

（棣莫弗鞅）設拋擲的是有偏硬幣（或稱為不公平硬幣），正面向上的概率為 p，反面向上的概率為 q = 1 − p 。令

X_{n+1}=X_{n}\pm 1

正面情況用「+」，反面情況用「−」。令

Y_{n}=(q/p)^{X_{n}},

則{ Y_n : n = 1, 2, 3, ... }是關於{ X_n : n = 1, 2, 3, ... }的鞅。證明如下：

{\begin{aligned}E[Y_{n+1}\mid X_{1},\dots ,X_{n}]&=p(q/p)^{X_{n}+1}+q(q/p)^{X_{n}-1}\\&=p(q/p)(q/p)^{X_{n}}+q(p/q)(q/p)^{X_{n}}\\&=q(q/p)^{X_{n}}+p(q/p)^{X_{n}}=(q/p)^{X_{n}}=Y_{n}.\end{aligned}}

複合補償泊松過程的2條軌道，強度分別為2.4（藍）和0.6（紅），服從正態分布

N(0.25,1)\,

（波利亞罐子模型）一個罐子中最初裝有 r 個紅球和 b 個藍球。某人隨機取出一個球，然後將此球與另一個與此球顏色相同的球放回罐子中。令 X_n 為重複上述步驟 n 次後罐子中的紅球數，令 Y_n = X_n / (n + r + b)。這時隨機過程{ Y_n : n = 1, 2, 3, ... }是鞅。

（統計學中的似然比檢驗）某一總體可能是按照概率密度 f 分布，也可能是按照概率密度 g 分布。從總體中取出一個隨機樣本，數據為 X₁, ..., X_n 。令 Y_n 為「似然比」：

Y_{n}=\prod _{i=1}^{n}{\frac {g(X_{i})}{f(X_{i})}}

（上式在應用中用作檢驗統計量。）若總體實際上是按照概率密度 f 而不是 g 分布，則{ Y_n : n = 1, 2, 3, ... }是關於{ X_n : n = 1, 2, 3, ... }的鞅。

設每一變形蟲不是以概率 p 分裂成兩個變形蟲，就是以概率 1 − p 最終死亡。令 X_n 為 n 代後變形蟲的存活數目（若種群在某一時刻滅絕，則這一時刻的 X_n = 0）。令 r 為最終滅絕的概率（英語：Galton–Watson process）。（找出 r 關於 p 的函數在實際應用中是非常有用的。提示：已知最初的一個變形蟲已經分裂了，則這個變形蟲的後代最終滅絕的概率等於其分裂直接得到的兩個後代中任何一個死亡的概率。）則

\{\,r^{X_{n}}:n=1,2,3,\dots \,\}

是關於{ X_n : n = 1, 2, 3, ... }的鞅。

軟件生成的鞅序列

一個大小固定生態系統中，任一特定物種的個體數量都是一個（離散）時間函數，可被視為一個隨機過程（隨機變量序列）。這一隨機過程是生物多樣性和生物地理學的統一中性理論（英語：unified neutral theory of biodiversity）下的鞅。

若{ N_t : t ≥ 0 }是強度為λ的泊松過程，則補償泊松過程{ N_t − λt : t ≥ 0 }是具有右連續且有左極限的樣本軌道的連續時間鞅（更確切地說是局部鞅）。

利用計算機軟件，鞅序列可以很容易地製作出來：
- Microsoft Excel或類似的電子製表軟件：在A1（左上角）單元格中輸入0.0，在下方的A2單元格中輸入=A1+NORMINV(RAND(),0,1)。這時下拉複製此單元格，得到大約300個單元格，這樣就能創建均值為0，標準差為1的鞅序列。在這些單元格仍處於選中狀態的情況下，利用圖表創建工具創建這些值的圖表。這時每次重新計算後（在Excel中可按F9實現），圖表都會顯示出不同的鞅序列。
- R語言：若要再現上述例子，可運行如下命令。若要顯示另一個鞅，重新輸入如下命令即可。
  plot(cumsum(rnorm(100, mean=0, sd=1)), t="l", col="darkblue", lwd=3)

下鞅與上鞅

（離散時間）下鞅（submartingale，又稱亞鞅）是滿足

{}E[X_{n+1}|X_{1},\ldots ,X_{n}]\geq X_{n},\quad n\in \mathbb {N}

的可積隨機過程 X₁，X₂，X₃，…。

類似地，（離散時間）上鞅（supermartingale，又稱超鞅）是滿足

{}E[X_{n+1}|X_{1},\ldots ,X_{n}]\leq X_{n},\quad n\in \mathbb {N}

的可積隨機過程 X₁，X₂，X₃，…。

下鞅或上鞅的定義都可由前述的離散時間和連續時間鞅的更為一般的定義轉換得到，只需將條件期望的等式代換成不等式即可。

這裡給出一個區分下鞅和上鞅的記憶方法：「生活是一個上鞅：隨着時間的推進，期望降低。」

例子

每一個鞅既是下鞅又是上鞅，反過來任何既是下鞅又是上鞅的隨機過程是鞅。
再次考慮賭徒的例子，若硬幣正面向上，賭徒贏得1美元，若硬幣反面向上，賭徒輸掉1美元。設此時硬幣是有偏的，則硬幣正面向上的概率為p 。
- 若 p 等於 1/2，平均起來，賭徒既未贏錢也未輸錢，則隨着時間的流逝，賭徒的財產是一個鞅。
- 若 p 小於 1/2，平均起來，賭徒輸了錢，則隨着時間的流逝，賭徒的財產是一個上鞅。
- 若 p 大於 1/2，平均起來，賭徒贏了錢，則隨着時間的流逝，賭徒的財產是一個下鞅。
由延森不等式求出的鞅的凸函數（convex function）是下鞅。例如，公平硬幣博弈中賭徒財產的平方是下鞅（同時也是根據 X_n² − n 是鞅的事實得出的）。類似地，鞅的凹函數（concave function）是一個上鞅。

鞅與停時

關於隨機過程 X₁，X₂，X₃，… 的停時是隨機變量 τ，這一隨機變量具有如下性質：對於每一個時間，事件 τ = t 的發生與否僅取決於 X₁，X₂，X₃，…，X_t 的取值。從定義中可以感受到的直覺是在任一特定時刻 t，我們都可以知道在這一時刻隨機過程是否到了停時。現實生活中停時的例子如賭徒離開賭桌的時刻，這一時刻可能是賭徒以前贏得錢財的函數（例如，僅當他沒有錢時，他才可能離開賭桌），但是他不可能根據還未完成的博弈的結果來選擇離開還是留下。

上述停時定義滿足強條件，下面給出一個弱條件的停時定義：若事件 τ = t 的發生與否統計獨立於 X_t+1，X_t+2，… 但並不是完全決定於時刻 t 以及之前的過程歷史，則隨機變量 τ 是停時。雖然這是一個弱條件，但在需要用到停時的證明中的一些情況也算是足夠強的條件。

鞅的一個基本性質是若 $(X_{t})_{t>0}$ 是下\上鞅且 $\tau$ 是停時，由 $X_{t}^{\tau }:=X_{\min\{\tau ,t\}}$ 定義的對應停止過程 $(X_{t}^{\tau })_{t>0}$ 也是下\上鞅。

停時鞅的概念引出了一系列定理，例如可選停止定理（又稱可選抽樣定理）：在特定條件下，停時的鞅的期望值等於其初始值。利用這一定理，我們可以證明對於一個壽命有限且房產有限的賭徒，成功的投注策略不可能存在。

參見

吾妻不等式
布朗運動
伊藤微積分
鞅中心極限定理
鞅表示定理
Doob鞅（英語：Doob martingale）
鞅收斂定理（英語：Doob's martingale convergence theorems）
柯爾莫哥洛夫鞅不等式（英語：Doob's martingale inequality）
Doob-Meyer分解定理（英語：Doob–Meyer decomposition theorem）
局部鞅（英語：Local martingale）
馬爾可夫鏈
馬爾可夫性質
半鞅

參考文獻

腳註

^ N. J. Balsara. Money Management Strategies for Futures Traders. Wiley Finance. 1992: 第122頁. ISBN 0-47-152215-5.
^ G. Grimmett、D. Stirzaker. Probability and Random Processes 第3版. Oxford University Press. 2001. ISBN 0-19-857223-9.

參考書目

The Splendors and Miseries of Martingales. Electronic Journal for History of Probability and Statistics. June 2009, 5 (1) [2010-09-06]. ISSN 1773-0074. （原始內容存檔於2021-04-24）.
David Williams. Probability with Martingales. Cambridge University Press. 1991. ISBN 0-521-40605-6.
Hagen Kleinert. Path Integrals in Quantum Mechanics, Statistics, Polymer Physics, and Financial Markets 第4版. 新加坡: 世界科學出版社（英語：World Scientific）. 2004 [2010-09-06]. ISBN 981-238-107-4. （原始內容存檔於2008-06-15）. 平裝
有關鞅的演示文稿講義
歐洲輪盤策略：概率論（頁面存檔備份，存於網際網路檔案館）

[1] N. J. Balsara. Money Management Strategies for Futures Traders. Wiley Finance. 1992: 第122頁. ISBN 0-47-152215-5.

[2] G. Grimmett、D. Stirzaker. Probability and Random Processes 第3版. Oxford University Press. 2001. ISBN 0-19-857223-9.

[1]

[2]