WordNet
WordNet是一個由普林斯頓大學認識科學實驗室在心理學教授喬治·A·米勒的指導下建立和維護的英語字典。開發工作從1985年開始,從此以後該項目接受了超過300萬美元的資助(主要來源於對機器翻譯有興趣的政府機構)[1]。
由於它包含了語義信息,所以有別於通常意義上的字典。WordNet根據詞條的意義將它們分組,每一個具有相同意義的字條組稱為一個synset(同義詞集合)。WordNet為每一個synset提供了簡短,概要的定義,並記錄不同synset之間的語義關係。
WordNet的開發有兩個目的:
WordNet的數據庫及相應的軟件工具的發放遵照BSD許可證書,可以自由的下載和使用,亦可在線查詢和使用。
WordNet內部結構
編輯在WordNet中,名詞、動詞、形容詞和副詞各自被組織成一個同義詞的網絡,每個同義詞集合都代表一個基本的語義概念,並且這些集合之間也由各種關係連接。(一個多義詞將出現在它的每個意思的同義詞集合中)。在WordNet的第一版中(標記為1.x),四種不同詞性的網絡之間並無連接。WordNet的名詞網絡是第一個發展起來的。
名詞網絡的主幹是蘊涵關係的層次(上位/下位關係),它占據了關係中的將近80%。層次中的最頂層是11個抽象概念,稱為基本類別始點(unique beginners),例如實體(entity,「有生命的或無生命的具體存在」)和心理特徵(psychological feature,「生命有機體的精神上的特徵)。名詞層次中最深的層次是16個節點。
參考資料
編輯- ^ WordNet发展概况. 北京大學中國語言學研究中心. [2018-09-27]. (原始內容存檔於2018-09-27) (中文).
外部連結
編輯- WordNet 首頁 (頁面存檔備份,存於網際網路檔案館)