ISO 639-3
ISO 639-3是个国际语种代号标准,在2007年2月5日出版。它延伸了ISO 639-2里的Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。所以,它是ISO 639-1的超集合。ISO 639-3是ISO 639-2个别语言的超集合,但是因为ISO 639-3没有ISO 639-2的语言集合,所以ISO 639-3不是整个ISO 639-2的超集合。
自2005年7月30日发布的计划草案,共有7,602个语言条目,这些语言的来源有三个:基本资料来自ISO 639-2所收录的个别语言,和取自《民族语》里的现代语言调查资料。而过去历史的各类语言及古老的语言和人工语言,则是出自语言学家列表的资料。
其中有4个代码用来代表特殊情况:
mis
──“uncoded languages”(未编码语言);mul
──“multiple languages”(多语种);und
──“undetermined language”(未确定的语种);zxx
──“no linguistic content”(没有语言内容)。
标准中亦有一个供私人使用的范围: qaa-qtz
。
大语言 (Macrolanguages)
编辑在ISO 639-3代码中,以下的语言被视为是某些其他语言的大语言(macrolanguage),即这些语言可再细分为数种以上的语言。就以汉语为例,SIL就把汉语细分为 14 种语言。
- 阿坎语(aka)
- 阿拉伯语(ara)
- 艾马拉语(aym)
- 阿塞拜疆语(aze)
- 俾路支语(bal)
- 比科尔语(bik)
- 布里亚特语(bua)
- 马里语(chm)
- 克里语(cre)
- 特拉华语(del)
- 史拉维语(den)
- 丁卡语(din)
- 多格拉语(doi)
- 爱沙尼亚语(est)自2008-043号修订,2009年1月16日生效
- 波斯语(fas)
- 弗里西亚语(fry)
- 富拉语(ful)
- 巴亚语(gba)
- 贡德语(gon)
- 格列博语(grb)
- 瓜拉尼语(grn)
- 海达语(hai)
- 塞尔维亚-克罗地亚语(hbs)
- 苗语(hmn)
- 因纽特语(iku)
- 依努庇克语(ipk)
- 犹太-阿拉伯语(jrb)
- 卡努里语(kau)
- 卡伦金语(kln)自2007-169号修订,2008年1月14日生效
- 孔卡尼语(kok)
- 科米语(kom)
- 刚果语(kon)
- 克佩勒语(kpe)
- 库尔德语(kur)
- 拉亨达语(lah)
- Luyia(luy)自2007-171号修订,2008年1月14日生效
- 曼丁哥语(man)
- 马达加斯加语(mlg)
- 蒙古语(mon)
- 马来语(msa)
- 马尔瓦利语(mwr)
- 挪威语(nor)
奥克语(oci)由2007年3月14日取消- 奥吉布瓦语(oji)
- 奥洛莫语(orm)
- 普什图语(pus)
- 凯楚亚语(que)
- 拉贾斯坦语(raj)
- 吉普赛语(rom)
- 阿尔巴尼亚语(sqi)
- 撒丁语(srd)
- 斯瓦希里语(swa)
- 古叙利亚语(syr)
- 塔马奇克语(tmh)
- 乌兹别克语(uzb)
- 依地语(yid)
- 萨波特克语(zap)
- 壮语(zha)
- 汉语(zho)
- 扎扎其语(zza)
集合语言 (Collectives)
编辑SIL在检视过七千多种语言之后,发现以下11种被列在ISO 639-2的语言,它们之下所包含的语言,并非属于同一语种,故在ISO 639-3代码中被删除。
- bad 班达语
- bih 比哈尔语(有一个ISO 639-1代码 bh)
- btk 巴塔克语
- day 达雅克语
- him 喜马偕尔语
- ijo 伊乔语
- kar 克伦语
- kro 克鲁语
- nah 纳瓦特尔语
- son 桑海语
- znd 赞德语
注:比哈尔语之下有10多种语言之多,故理论上不应获发一个ISO 639-1代码 bh。