ISO 639-3是个国际语种代号标准,在2007年2月5日出版。它延伸了ISO 639-2里的Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。所以,它是ISO 639-1的超集合。ISO 639-3是ISO 639-2个别语言的超集合,但是因为ISO 639-3没有ISO 639-2的语言集合,所以ISO 639-3不是整个ISO 639-2的超集合。

自2005年7月30日发布的计划草案,共有7,602个语言条目,这些语言的来源有三个:基本资料来自ISO 639-2所收录的个别语言,和取自《民族语》里的现代语言调查资料。而过去历史的各类语言及古老的语言和人工语言,则是出自语言学家列表的资料。


其中有4个代码用来代表特殊情况:

  • mis──“uncoded languages”(未编码语言);
  • mul──“multiple languages”(多语种);
  • und──“undetermined language”(未确定的语种);
  • zxx──“no linguistic content”(没有语言内容)。

标准中亦有一个供私人使用的范围: qaa-qtz

大语言 (Macrolanguages)

编辑

在ISO 639-3代码中,以下的语言被视为是某些其他语言的大语言(macrolanguage),即这些语言可再细分为数种以上的语言。就以汉语为例,SIL就把汉语细分为 14 种语言。

集合语言 (Collectives)

编辑

SIL在检视过七千多种语言之后,发现以下11种被列在ISO 639-2的语言,它们之下所包含的语言,并非属于同一语种,故在ISO 639-3代码中被删除。

注:比哈尔语之下有10多种语言之多,故理论上不应获发一个ISO 639-1代码 bh

参见

编辑

外部链接

编辑