組合範疇語法
組合範疇語法(Combinatory categorial grammar,CCG),是在AB演算基礎上進行擴展而產生的範疇語法。從語法理論視角看,CCG是一種詞彙形式化的方法;從計算語言學視角看,CCG屬於一類適度上下文相關文法;從邏輯語義學視角看,CCG在句法與語義的接口方面非常融洽。無論是CCG語言的、計算的,還是邏輯的特徵,都使得 CCG非常適用於自然語言信息處理,對於計算語言學具有很好的理論和實際價值[1]。
介紹
編輯組合範疇語法CCG應該算作是20世紀末的理性主義產物,它在20 世紀 80至90年代開始出現,在AB演算基礎上進行擴展而產生,其核心的擴展在於「組合」,即基於範疇語法增添了函子範疇的組合運算,從而增強了表達與描述能力。另一方面,由於組合規則與柯里的組合算子非常接近,因此每個組合規則在分析過程中都具有一個語義解讀,這樣使得句法派生的同時,又能夠構造謂詞-論元結構作為語義解讀[2]。
形式化規則
編輯範疇
編輯在CCG中,範疇指的是這樣一個簡潔描述:它能夠和什麼樣的論元組合以及與該論元組合之後會生成什麼,換言之,就是它的函數類型。 詞彙便成了從詞彙條目到範疇的映射,意味着每個詞彙條目尋求論元的行為。Lambek(1958)[3]這樣描述過詞彙化的益處: 一個形式化語言的句子結構完全是由它的類型列表[詞彙]決定的。 範疇的構造的起點是原子。在經典的AB範疇語法中,原子範疇集僅僅由S(在Montagovian術語中,即表示真值類型t)和N(即表示實體的類型e)構成。有了這兩個基本原子,我們能夠通過遞歸利用原子生成更複雜的範疇來建造詞庫。 範疇的正式集合是由一個原子類集合組合而成的: 定義1 給定一個有限的原子範疇類F,集合C是滿足下列條件的最小集合:
- F C
- 如果X,Y C,那麼X/Y, X\Y C
例如,如果F = {S, NP},那麼C的元素例中包括原子S和原子NP,以及(S\NP)和(NP\NP)\(NP\NP)。由原子不斷遞歸生成的對象被稱為函子或複合範疇。
組合規則
編輯組合規則給多個標記(token)賦予主要類型(principled types),並基於輸入符號的範疇來限制組合的類型。由於組合規則與Curry等(1958)的組合子(combinators)之間緊密相關(close relationship),每個組合規則都有一個語義解釋,這在語法分析過程中,允許語法派生同時構建謂詞-論元結構(predicate-argument structure)。
函項應用規則
編輯
函數應用規則適用於標準的函項範疇與其所尋找的論元範疇相毗連的情況。只包含這兩條函項應用規則的範疇語法就是著名的AB語法,這是以最先提出該語法的兩位語言/邏輯學家Ajdukiewicz(1935)和Bar-Hillel(1953)的首字母命名的。這樣的一種語法就等同於將生成規則整合在詞彙中的短語結構語法。AB語法和上下文無關文法的等價性由Bra-Hillel等人(1960)證明,這種範疇語法的形式化因為只包含兩條函項應用規則,因此具有一定的局限性。
組合規則
編輯
類型提升
編輯
在只有應用的情景中,只有函子(functor)才能消耗它們的論元。而類型提升規則允許論元反過來消耗函子。