受限玻爾茲曼機
受限玻爾茲曼機(英語:restricted Boltzmann machine, RBM)是一種可通過輸入數據集學習概率分佈的隨機生成神經網絡。RBM最初由發明者保羅·斯模稜斯基於1986年命名為簧風琴(Harmonium)[1],但直到傑弗里·辛頓及其合作者在2000年代中葉發明快速學習算法後,受限玻茲曼機才變得知名。受限玻茲曼機在降維[2]、分類[3]、協同過濾[4]、特徵學習[5]和主題建模[6]中得到了應用。根據任務的不同,受限玻茲曼機可以使用監督學習或無監督學習的方法進行訓練。
正如名字所提示的那樣,受限玻茲曼機是一種玻茲曼機的變體,但限定模型必須為二分圖。模型中包含對應輸入參數的輸入(可見)單元和對應訓練結果的隱單元,圖中的每條邊必須連接一個可見單元和一個隱單元。(與此相對,「無限制」玻茲曼機包含隱單元間的邊,使之成為循環神經網絡。)這一限定使得相比一般玻茲曼機更高效的訓練算法成為可能,特別是基於梯度的對比分歧(contrastive divergence)算法[7]。
受限玻茲曼機也可被用於深度學習網絡。具體地,深度信念網絡可使用多個RBM堆疊而成,並可使用梯度下降法和反向傳播算法進行調優[8]。
結構
編輯標準的受限玻爾茲曼機由二值(布爾/伯努利)隱層和可見層單元組成。權重矩陣 中的每個元素指定了隱層單元 和可見層單元 之間邊的權重。此外對於每個可見層單元 有偏置 ,對每個隱層單元 有偏置 。在這些定義下,一種受限玻爾茲曼機配置(即給定每個單元取值)的「能量」(v,h)被定義為
或者用矩陣的形式表示如下:
這一能量函數的形式與霍普菲爾德神經網絡相似。在一般的玻爾茲曼機中,隱層和可見層之間的聯合概率分佈由能量函數給出:[9]
其中, 為配分函數,定義為在節點的所有可能取值下 的和(亦即使得概率分佈和為1的歸一化常數)。類似地,可見層取值的邊緣分佈可通過對所有隱層配置求和得到:[9]
由於RBM為一個二分圖,層內沒有邊相連,因而隱層是否激活在給定可見層節點取值的情況下是條件獨立的。類似地,可見層節點的激活狀態在給定隱層取值的情況下也條件獨立[7]。亦即,對 個可見層節點和 個隱層節點,可見層的配置v對於隱層配置h的條件概率如下:
- .
類似地,h對於v的條件概率為
- .
其中,單個節點的激活概率為
- 和
其中 代表邏輯函數。
與其他模型的關係
編輯訓練算法
編輯受限玻爾茲曼機的訓練目標是針對某一訓練集 ,最大化概率的乘積。其中, 被視為一矩陣,每個行向量作為一個可見單元向量 :
訓練受限玻爾茲曼機,即最優化權重矩陣 ,最常用的算法是傑弗里·辛頓提出的對比分歧(contrastive divergence,CD)算法。這一算法最早被用於訓練辛頓提出的「專家積」模型[13]。這一算法在梯度下降的過程中使用吉布斯採樣完成對權重的更新,與訓練前饋神經網絡中利用反向傳播算法類似。
基本的針對一個樣本的單步對比分歧(CD-1)步驟可被總結如下:
- 取一個訓練樣本v,計算隱層節點的概率,在此基礎上從這一概率分佈中獲取一個隱層節點激活向量的樣本h;
- 計算v和h的外積,稱為「正梯度」;
- 從h獲取一個重構的可見層節點的激活向量樣本v',此後從v'再次獲得一個隱層節點的激活向量樣本h';
- 計算v'和h'的外積,稱為「負梯度」;
- 使用正梯度和負梯度的差以一定的學習率更新權重 : 。
偏置a和b也可以使用類似的方法更新。
參見
編輯參考資料
編輯- ^ Smolensky, Paulgengxin. Chapter 6: Information Processing in Dynamical Systems: Foundations of Harmony Theory. Rumelhart, David E.; McLelland, James L. (編). Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Volume 1: Foundations (PDF). MIT Press. 1986: 194–281 [2014-09-16]. ISBN 0-262-68053-X. (原始內容 (PDF)存檔於2013-06-13).
- ^ G. E. Hinton, R. R. Salakhutdinov. Reducing the Dimensionality of Data with Neural Networks. Science. 2006-07-28, 313 (5786): 504–507 [2018-04-02]. ISSN 0036-8075. doi:10.1126/science.1127647. (原始內容存檔於2018-03-20) (英語).
- ^ Hugo Larochelle, Yoshua Bengio. Classification using discriminative restricted Boltzmann machines. ACM: 536–543. 2008-07-05 [2018-04-02]. ISBN 9781605582054. doi:10.1145/1390156.1390224.
- ^ Salakhutdinov, R.; Mnih, A.; Hinton, G. Restricted Boltzmann machines for collaborative filtering. Proceedings of the 24th international conference on Machine learning - ICML '07: 791. 2007. ISBN 9781595937933. doi:10.1145/1273496.1273596.
- ^ Coates, Adam; Lee, Honglak; Ng, Andrew Y. An analysis of single-layer networks in unsupervised feature learning (PDF). International Conference on Artificial Intelligence and Statistics (AISTATS). 2011 [2014-09-16]. (原始內容 (PDF)存檔於2013-05-10).
- ^ Ruslan Salakhutdinov and Geoffrey Hinton (2010). Replicated softmax: an undirected topic model (頁面存檔備份,存於互聯網檔案館). Neural Information Processing Systems 23.
- ^ 7.0 7.1 Miguel Á. Carreira-Perpiñán and Geoffrey Hinton (2005). On contrastive divergence learning. Artificial Intelligence and Statistics.
- ^ Hinton, G. Deep belief networks. Scholarpedia. 2009, 4 (5): 5947. Bibcode:2009SchpJ...4.5947H. doi:10.4249/scholarpedia.5947.
- ^ 9.0 9.1 Geoffrey Hinton (2010). A Practical Guide to Training Restricted Boltzmann Machines (頁面存檔備份,存於互聯網檔案館). UTML TR 2010–003, University of Toronto.
- ^ 10.0 10.1 Sutskever, Ilya; Tieleman, Tijmen. On the convergence properties of contrastive divergence (PDF). Proc. 13th Int'l Conf. on AI and Statistics (AISTATS). 2010 [2014-09-16]. (原始內容 (PDF)存檔於2015-06-10).
- ^ 11.0 11.1 Asja Fischer and Christian Igel. Training Restricted Boltzmann Machines: An Introduction (頁面存檔備份,存於互聯網檔案館). Pattern Recognition 47, pp. 25-39, 2014
- ^ María Angélica Cueto; Jason Morton; Bernd Sturmfels. Geometry of the restricted Boltzmann machine (PDF). Algebraic Methods in Statistics and Probability (American Mathematical Society). 2010, 516. arXiv:0908.4425 .[永久失效連結]
- ^ Geoffrey E. Hinton. Training Products of Experts by Minimizing Contrastive Divergence. Neural Computation. 2006-03-30, 14 (8): 1771–1800 [2018-04-02]. doi:10.1162/089976602760128018. (原始內容存檔於2018-11-27) (英語).
外部連結
編輯- Introduction to Restricted Boltzmann Machines(頁面存檔備份,存於互聯網檔案館). Edwin Chen's blog, July 18, 2011.