統計學機器學習中,想用一組變量推斷一個隨機變量時,通常子集就夠了,其他變量都是無用的。這種包含所有有效信息的子集就稱作馬爾可夫毯(Markov blanket)。若馬爾可夫毯是最小的,即放棄任何變量都會損失信息,就稱之為馬爾可夫邊界(Markov boundary)。識別馬爾可夫毯和馬爾可夫邊界有助於提取有用特徵。這兩個術語是朱迪亞·珀爾 (1988)創造的。[1]馬爾可夫毯可視作是多個馬爾科夫鏈組成的。

貝葉斯網絡中,節點A的馬爾可夫邊界包括其父節點、子節點及所有子節點的其他父節點。

馬爾可夫毯

編輯

隨機變量集 中隨機變量Y的馬爾可夫毯是 的任意子集 ,條件是其他變量與Y相互獨立:

 

即, 至少包含推斷Y所需的全部信息,其中 中的變量是冗餘的。

一般來說,給定的馬爾可夫毯不唯一。 中任何包含馬爾可夫毯的集合本身也是馬爾可夫毯。 具體說,  Y的馬爾可夫毯。

馬爾可夫邊界

編輯

 Y馬爾可夫邊界 的子集 ,使得 本身是Y的馬爾可夫毯,但 的真子集都不是Y的馬爾可夫毯。也就是說,馬爾可夫邊界是最小馬爾可夫毯。

貝葉斯網絡節點A的馬爾可夫邊界是由A的父節點、子節點與子節點的其他父節點構成的節點集。馬爾可夫網絡中,節點的馬爾可夫邊界是其鄰節點集合。依賴網絡中,節點的馬爾可夫邊界是其父節點的集合。

馬爾可夫邊界的唯一性

編輯

馬爾可夫邊界總存在。某些較溫和的條件下,馬爾可夫邊界是唯一的。但對大多數情形,多個馬爾可夫邊界可能會提供不同的解。[2]存在多個馬爾可夫邊界時,測量因果效應的數量可能失效。[3]

另見

編輯

注釋

編輯
  1. ^ Pearl, Judea. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference . Representation and Reasoning Series. San Mateo CA: Morgan Kaufmann. 1988. ISBN 0-934613-73-7. 
  2. ^ Statnikov, Alexander; Lytkin, Nikita I.; Lemeire, Jan; Aliferis, Constantin F. Algorithms for discovery of multiple Markov boundaries (PDF). Journal of Machine Learning Research. 2013, 14: 499–566. 
  3. ^ Wang, Yue; Wang, Linbo. Causal inference in degenerate systems: An impossibility result. Proceedings of the 23rd International Conference on Artificial Intelligence and Statistics. 2020: 3383–3392.