卡慕思计画
卡慕思计画为透过线上合作所构成的网路辞典。此计画旨在为世界上各种语言建立其辞典和语言资源,并让每人都得以免费享用。"卡慕思"在斯瓦希里语中代表字典。用户经登录后,即可使用站内提供的资讯并参与贡献。目前,此计画隶属于国际卡慕思组织,登记立案于瑞士日内瓦。[1]
卡慕思计画始于1994年,为美国耶鲁大学非洲研究理事会的研究项目。此项目旨在建立斯瓦希里语的线上辞典,创办人为现任计画主任马丁・班杰明。[2]
此计画于2007年与耶鲁大学分拆,并自2009年起与位于日内瓦的国际卡慕思非营利组织和美国卡慕思非营利组织共同运营。从2013年至今,此计画于洛桑联邦理工学院的分布资讯系统实验室设立研究据点。
卡慕思计画从2010年开始从斯瓦希里语-英语资料库扩张到其他语言,并致力于连结当今所有现存语言,以构成多语辞典资料库。2013年,卡慕思成为欧巴马政府在白宫大数据倡议中的推广伙伴。[3]2015年此计画因多语资料超载造成伺服器停摆,经重新编写图形数据库后于2016年再度问世。然而,即便系统提供了比过往更多元的语料库,由于资金短缺,原有的斯瓦希里语资料库尚未能完全转换至新系统。
卡慕思计画自2017年起启动名为"卡慕思实验室"的技术发展实验计画,并开放让世界各地的学生实习。同年,此计画在其行动应用程式"英语-斯瓦希里语辞典(English Swahili Dictionary Fr)"发布了六万件以上的词条。[4]
目前,卡慕思计画的语言概念链结库有1,769,137条词汇,涵盖了43种语言和1806种组合的双语辞典。使用者可透过kamusi.org官方网站、"Kamusi Here!"行动应用程式(支援Android和iPhone)、"Kamusi Bot"应用程式(支援Facebook介面)、以及"Emoji World Bot"(支援Telegram介面)享用其此语言资料库。依拉丁字母排序,卡慕思语料库包含的语言有: 阿拉伯语、阿萨姆语、巴斯克语、孟加拉语、博多语、保加利亚语、加泰隆尼亚语、克罗埃西亚语、捷克语、丹麦语、荷兰语、英语、加利西亚语、希腊语、古吉拉特语、印地语、爱尔兰语、义大利语、康纳达语、喀什米尔语、孔卡尼语、马拉亚拉姆语、汉语/中文、曼尼普尔语、马拉提语、尼泊尔语、欧利亚语、波斯语、葡萄牙语、旁遮普语、罗马尼亚语、俄罗斯语、梵语、北索托语、斯洛伐克语、西班牙语、坦米尔语、泰卢固语、札那语、乌尔都语、文达语、科萨语、祖鲁语。
参考来源
编辑- ^ Kamusi Project International. kamusi.ch. [2018-03-11]. (原始内容存档于2014-08-18).
- ^ Kamusi GOLD: History of Kamusi 1993 - 2015. kamusi.org. [2018-03-11]. (原始内容存档于2019-04-12).
- ^ Vanacek, Jacqueline. SAPVoice: The White House Honors SAP, Stanford and NCT for Genomics Advances. Forbes. [2018-03-11]. (原始内容存档于2021-02-24) (英语).
- ^ Kamusi GOLD: Kamusi Labs. kamusi.org. [2018-03-11]. (原始内容存档于2019-04-12).