語料庫

信息技术名词,大批量电子化自然语言样本所构成的集合

語料庫一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記。

根據語料庫的特徵,可以分為單語語料庫、雙語語料庫、平行語料庫等,根據語料的來源,可以分為書面語語料庫、口語語料庫、作文語料庫、學習者語料庫、古文書語料庫等。[1]

語料庫列表

編輯

多語

編輯

英語

編輯

漢語

編輯

繁體中文

編輯

簡體中文

編輯

日語

編輯

研究機構

編輯

外部連結

編輯

參考文獻

編輯
  1. ^ 狐狸等間隔. 日语语料库超入门. 微信公眾平台. [2022-12-20]. (原始內容存檔於2022-12-20).