狄利克雷分布

狄利克雷分布是一組連續多變量概率分布,是多變量普遍化的Β分布。為了紀念德國數學家約翰·彼得·古斯塔夫·勒熱納·狄利克雷(Peter Gustav Lejeune Dirichlet)而命名。狄利克雷分布常作為貝葉斯統計的先驗概率。當狄利克雷分布維度趨向無限時,這過程便稱為狄利克雷過程(Dirichlet process)。

狄利克雷分布
機率密度函數
A panel illustrating probability density functions of a few Dirichlet distributions over a 2-simplex, for the following α vectors (clockwise, starting from the upper left corner): (1.3, 1.3, 1.3), (3,3,3), (7,7,7), (2,6,11), (14, 9, 5), (6,2,6).
參數 分類數 (整數)
concentration parameters
值域
機率密度函數



期望值

(試看 digamma function)
眾數
變異數


其中

而且

狄利克雷分布奠定了狄利克雷過程的基礎,被廣泛應用於自然語言處理特別是主題模型(topic model)的研究。

概率密度函數

編輯
 
此圖展示了當K=3、參數αα=(0.3, 0.3, 0.3)變化到(2.0, 2.0, 2.0)時,密度函數取對數後的變化。

維度K ≥ 2的狄利克雷分布在參數α1, ..., αK > 0上、基於歐幾里得空間RK-1里的勒貝格測度有個概率密度函數,定義為:

 

其中 滿足 ,同時對於任意 ,都有 。即 在(K − 1)維的單純形開集上密度為0。

歸一化衡量B(α)是多項Β函數,可以用Γ函數(gamma function)表示:

 


參見

編輯

參考

編輯