鞅 (概率论)

在概率论中，鞅（英语：martingale）是满足下述条件的随机过程：已知过去某一时刻 s 以及之前所有时刻的观测值，若某一时刻 t 的观测值的条件期望等于过去某一时刻 s 的观测值，则称这一随机过程是鞅。而于博弈论中，鞅经常用来作为公平博弈的数学模型。

历史

三维布朗运动（维纳过程）

鞅的原名“martingale”原指一类于18世纪流行于法国的投注策略，称为加倍赌注法^[1]。这类策略中最简单的一种策略是为博弈设计的。在博弈中，赌徒会掷硬币，若硬币正面向上，赌徒会赢得赌本，若硬币反面向上，赌徒会输掉赌本。这一策略使赌徒在输钱后加倍赌金投注，为的是在初次赢钱时赢回之前输掉的所有钱，同时又能另外赢得与最初赌本等值的收益。当赌徒的财产和可用时间同时接近无穷时，他掷硬币后硬币正面向上的概率会接近1，由此看来，加倍赌注法似乎是一种必然能赢钱的策略。然而，由于现实中赌徒的资金是有限的，赌金的指数增长最终会导致使用这一策略的赌徒破产。

鞅的概念首先是由保罗·皮埃尔·莱维于1934年提出的，但他只提出了离散时间的版本，而且没有给予命名。直到1939年，约翰·维尔（英语：Jean Ville）将此概念推广到连续时间的情况，并且首次提出“martingale”这个名称。约瑟夫·利奥·杜布（英语：Joseph L. Doob）等人在鞅的相关理论的初期发展做出重大贡献，而完成这些工作的部分动机是为了表明成功的投注策略不可能存在。此外，伊藤清在分析应用方面作出了重要的贡献。从1970年代开始，鞅论就在纯粹数学和应用数学的很多领域中有广泛的应用，特别是在数学物理和金融数学中。

定义

离散时间鞅

离散时间鞅是对于所有 n 都满足

\mathbf {E} (\vert X_{n}\vert )<\infty

\mathbf {E} (X_{n+1}\mid X_{1},\ldots ,X_{n})=X_{n},\quad n\in \mathbb {N} ,

的时间离散的随机过程 X₁，X₂，X_3,…，也就是说，已知之前所有观测值，若下一次观测值的条件期望等于本次观测值，则称这一随机过程（即随机变量序列）是离散时间鞅。

关于随机过程的离散时间鞅

相对来说更为一般的定义如下：若对于所有 n 都满足

\mathbf {E} (\vert Y_{n}\vert )<\infty

\mathbf {E} (Y_{n+1}\mid X_{1},\ldots ,X_{n})=Y_{n},\quad n\in \mathbb {N} ,

则称随机过程 Y₁，Y₂，Y₃，…是关于另一随机过程 X₁，X₂，X₃，…的鞅。

连续时间鞅

与离散时间鞅的定义相似，连续时间鞅的定义为：若对于所有 t 都满足

\mathbf {E} (\vert Y_{t}\vert )<\infty

\mathbf {E} (Y_{t}\mid \{X_{\tau },\tau \leq s\})=Y_{s},\ \forall \ s\leq t,

则称关于随机过程 X_t 的连续时间鞅是随机过程 Y_t 。

上述定义表达了鞅的性质，即在 s ≤ t 的条件下，已知时刻 s 以及之前所有时刻的观测值，若时刻 t 的观测值的条件期望等于时刻 s 的观测值，则随机过程是鞅。

广义的定义

更为一般性的定义如下：若随机过程 $Y:T\times \Omega \to S$ 满足如下性质，则称 Y 是一个关于滤链 Σ_∗和概率测度 P 的鞅。

Σ_∗ 是给定概率空间 (Ω, Σ, P) 的滤链（英语：filtration）；
Y 是适应于滤链 Σ_∗ 的适应过程，即对于指标集 T 中的每一 t ，随机变量 Y_t 是一个 Σ_t 可测函数；
对于任意 t ，Y_t 存在于 L^p 空间 L¹(Ω, Σ_t, P; S) 中，即

\mathbf {E} _{\mathbf {P} }(|Y_{t}|)<+\infty ;

对于所有 s 和 t （s < t ）和所有 F ∈ Σ_s，

\mathbf {E} _{\mathbf {P} }\left([Y_{t}-Y_{s}]\chi _{F}\right)=0,

其中 χ_F 表示事件 F 的指示函数。在 Grimmett 和 Stirzaker 的《Probability and Random Processes》一书中，最后一个条件被表示为条件期望的一般形式^[2]：

Y_{s}=\mathbf {E} _{\mathbf {P} }(Y_{t}|\Sigma _{s}),

要注意的重点是鞅成立的性质与滤链以及关于选定期望的概率测度都有关。Y 可能是某一测度的鞅，但不是另一测度的鞅；而要说明某一伊藤过程是鞅，则可以利用吉尔萨诺夫定理（英语：Girsanov theorem）找出相关的测度。

鞅的例子

设 X_n 是一个赌徒 n 次抛掷公平硬币后的财产，规则是如果硬币正面朝上，则赌徒赢得 1 美元，硬币反面朝上，则赌徒输掉 1 美元。在已知过去不同时刻所拥有的财产之下，下一次试验后赌徒财产的条件期望与其现在的财产相等，故这一随机过程是鞅。这个例子称为赌徒谬误。

令 Y_n = X_n² − n ，其中 X_n 是上例中赌徒的财产，则随机过程{ Y_n : n = 1, 2, 3, ... }是鞅。这一例子可以表明赌徒的全部收益或损失大致在抛掷次数的正负平方根之间变化。

（棣莫弗鞅）设抛掷的是有偏硬币（或称为不公平硬币），正面向上的概率为 p，反面向上的概率为 q = 1 − p 。令

X_{n+1}=X_{n}\pm 1

正面情况用“+”，反面情况用“−”。令

Y_{n}=(q/p)^{X_{n}},

则{ Y_n : n = 1, 2, 3, ... }是关于{ X_n : n = 1, 2, 3, ... }的鞅。证明如下：

{\begin{aligned}E[Y_{n+1}\mid X_{1},\dots ,X_{n}]&=p(q/p)^{X_{n}+1}+q(q/p)^{X_{n}-1}\\&=p(q/p)(q/p)^{X_{n}}+q(p/q)(q/p)^{X_{n}}\\&=q(q/p)^{X_{n}}+p(q/p)^{X_{n}}=(q/p)^{X_{n}}=Y_{n}.\end{aligned}}

复合补偿泊松过程的2条轨道，强度分别为2.4（蓝）和0.6（红），服从正态分布

N(0.25,1)\,

（波利亚罐子模型）一个罐子中最初装有 r 个红球和 b 个蓝球。某人随机取出一个球，然后将此球与另一个与此球颜色相同的球放回罐子中。令 X_n 为重复上述步骤 n 次后罐子中的红球数，令 Y_n = X_n / (n + r + b)。这时随机过程{ Y_n : n = 1, 2, 3, ... }是鞅。

（统计学中的似然比检验）某一总体可能是按照概率密度 f 分布，也可能是按照概率密度 g 分布。从总体中取出一个随机样本，数据为 X₁, ..., X_n 。令 Y_n 为“似然比”：

Y_{n}=\prod _{i=1}^{n}{\frac {g(X_{i})}{f(X_{i})}}

（上式在应用中用作检验统计量。）若总体实际上是按照概率密度 f 而不是 g 分布，则{ Y_n : n = 1, 2, 3, ... }是关于{ X_n : n = 1, 2, 3, ... }的鞅。

设每一变形虫不是以概率 p 分裂成两个变形虫，就是以概率 1 − p 最终死亡。令 X_n 为 n 代后变形虫的存活数目（若种群在某一时刻灭绝，则这一时刻的 X_n = 0）。令 r 为最终灭绝的概率（英语：Galton–Watson process）。（找出 r 关于 p 的函数在实际应用中是非常有用的。提示：已知最初的一个变形虫已经分裂了，则这个变形虫的后代最终灭绝的概率等于其分裂直接得到的两个后代中任何一个死亡的概率。）则

\{\,r^{X_{n}}:n=1,2,3,\dots \,\}

是关于{ X_n : n = 1, 2, 3, ... }的鞅。

软件生成的鞅序列

一个大小固定生态系统中，任一特定物种的个体数量都是一个（离散）时间函数，可被视为一个随机过程（随机变量序列）。这一随机过程是生物多样性和生物地理学的统一中性理论（英语：unified neutral theory of biodiversity）下的鞅。

若{ N_t : t ≥ 0 }是强度为λ的泊松过程，则补偿泊松过程{ N_t − λt : t ≥ 0 }是具有右连续且有左极限的样本轨道的连续时间鞅（更确切地说是局部鞅）。

利用计算机软件，鞅序列可以很容易地制作出来：
- Microsoft Excel或类似的电子制表软件：在A1（左上角）单元格中输入0.0，在下方的A2单元格中输入=A1+NORMINV(RAND(),0,1)。这时下拉复制此单元格，得到大约300个单元格，这样就能创建均值为0，标准差为1的鞅序列。在这些单元格仍处于选中状态的情况下，利用图表创建工具创建这些值的图表。这时每次重新计算后（在Excel中可按F9实现），图表都会显示出不同的鞅序列。
- R语言：若要再现上述例子，可运行如下命令。若要显示另一个鞅，重新输入如下命令即可。
  plot(cumsum(rnorm(100, mean=0, sd=1)), t="l", col="darkblue", lwd=3)

下鞅与上鞅

（离散时间）下鞅（submartingale，又称亚鞅）是满足

{}E[X_{n+1}|X_{1},\ldots ,X_{n}]\geq X_{n},\quad n\in \mathbb {N}

的可积随机过程 X₁，X₂，X₃，…。

类似地，（离散时间）上鞅（supermartingale，又称超鞅）是满足

{}E[X_{n+1}|X_{1},\ldots ,X_{n}]\leq X_{n},\quad n\in \mathbb {N}

的可积随机过程 X₁，X₂，X₃，…。

下鞅或上鞅的定义都可由前述的离散时间和连续时间鞅的更为一般的定义转换得到，只需将条件期望的等式代换成不等式即可。

这里给出一个区分下鞅和上鞅的记忆方法：“生活是一个上鞅：随着时间的推进，期望降低。”

例子

每一个鞅既是下鞅又是上鞅，反过来任何既是下鞅又是上鞅的随机过程是鞅。
再次考虑赌徒的例子，若硬币正面向上，赌徒赢得1美元，若硬币反面向上，赌徒输掉1美元。设此时硬币是有偏的，则硬币正面向上的概率为p 。
- 若 p 等于 1/2，平均起来，赌徒既未赢钱也未输钱，则随着时间的流逝，赌徒的财产是一个鞅。
- 若 p 小于 1/2，平均起来，赌徒输了钱，则随着时间的流逝，赌徒的财产是一个上鞅。
- 若 p 大于 1/2，平均起来，赌徒赢了钱，则随着时间的流逝，赌徒的财产是一个下鞅。
由延森不等式求出的鞅的凸函数（convex function）是下鞅。例如，公平硬币博弈中赌徒财产的平方是下鞅（同时也是根据 X_n² − n 是鞅的事实得出的）。类似地，鞅的凹函数（concave function）是一个上鞅。

鞅与停时

关于随机过程 X₁，X₂，X₃，… 的停时是随机变量 τ，这一随机变量具有如下性质：对于每一个时间，事件 τ = t 的发生与否仅取决于 X₁，X₂，X₃，…，X_t 的取值。从定义中可以感受到的直觉是在任一特定时刻 t，我们都可以知道在这一时刻随机过程是否到了停时。现实生活中停时的例子如赌徒离开赌桌的时刻，这一时刻可能是赌徒以前赢得钱财的函数（例如，仅当他没有钱时，他才可能离开赌桌），但是他不可能根据还未完成的博弈的结果来选择离开还是留下。

上述停时定义满足强条件，下面给出一个弱条件的停时定义：若事件 τ = t 的发生与否统计独立于 X_t+1，X_t+2，… 但并不是完全决定于时刻 t 以及之前的过程历史，则随机变量 τ 是停时。虽然这是一个弱条件，但在需要用到停时的证明中的一些情况也算是足够强的条件。

鞅的一个基本性质是若 $(X_{t})_{t>0}$ 是下\上鞅且 $\tau$ 是停时，由 $X_{t}^{\tau }:=X_{\min\{\tau ,t\}}$ 定义的对应停止过程 $(X_{t}^{\tau })_{t>0}$ 也是下\上鞅。

停时鞅的概念引出了一系列定理，例如可选停止定理（又称可选抽样定理）：在特定条件下，停时的鞅的期望等于其初始值。利用这一定理，我们可以证明对于一个寿命有限且房产有限的赌徒，成功的投注策略不可能存在。

参见

吾妻不等式
布朗运动
伊藤微积分
鞅中心极限定理
鞅表示定理
Doob鞅（英语：Doob martingale）
鞅收敛定理（英语：Doob's martingale convergence theorems）
柯尔莫哥洛夫鞅不等式（英语：Doob's martingale inequality）
Doob-Meyer分解定理（英语：Doob–Meyer decomposition theorem）
局部鞅（英语：Local martingale）
马尔可夫链
马尔可夫性质
半鞅

参考文献

脚注

^ N. J. Balsara. Money Management Strategies for Futures Traders. Wiley Finance. 1992: 第122页. ISBN 0-47-152215-5.
^ G. Grimmett、D. Stirzaker. Probability and Random Processes 第3版. Oxford University Press. 2001. ISBN 0-19-857223-9.

参考书目

The Splendors and Miseries of Martingales. Electronic Journal for History of Probability and Statistics. June 2009, 5 (1) [2010-09-06]. ISSN 1773-0074. （原始内容存档于2021-04-24）.
David Williams. Probability with Martingales. Cambridge University Press. 1991. ISBN 0-521-40605-6.
Hagen Kleinert. Path Integrals in Quantum Mechanics, Statistics, Polymer Physics, and Financial Markets 第4版. 新加坡: 世界科学出版社（英语：World Scientific）. 2004 [2010-09-06]. ISBN 981-238-107-4. （原始内容存档于2008-06-15）. 平装
有关鞅的演示文稿讲义
欧洲轮盘策略：概率论（页面存档备份，存于互联网档案馆）

[1] N. J. Balsara. Money Management Strategies for Futures Traders. Wiley Finance. 1992: 第122页. ISBN 0-47-152215-5.

[2] G. Grimmett、D. Stirzaker. Probability and Random Processes 第3版. Oxford University Press. 2001. ISBN 0-19-857223-9.

[1]

[2]