语料库

信息技术名词,大批量电子化自然语言样本所构成的集合

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记。

根据语料库的特征,可以分为单语语料库、双语语料库、平行语料库等,根据语料的来源,可以分为书面语语料库、口语语料库、作文语料库、学习者语料库、古文书语料库等。[1]

语料库列表

编辑

多语

编辑

英语

编辑

汉语

编辑

繁体中文

编辑

简体中文

编辑

日语

编辑

研究机构

编辑

外部链接

编辑

参考文献

编辑
  1. ^ 狐狸等间隔. 日语语料库超入门. 微信公众平台. [2022-12-20]. (原始内容存档于2022-12-20).