古谚文

(重定向自古谚文

古谚文指现在已不使用的一些谚文字母,也可以指使用该种文字书写的古文。韩语称为“옛 한글”、“옛글”或“아래아한글”,中文中一般也叫着古韩文,老韩文,旧朝鲜文等。口语中一般简称为“아래아”,而“아래아”本来是指古谚文的其中一个字母。本条目主要叙述古谚文在现代的使用。

Unicode中的谚文字符

古谚文概要

编辑

如前文所定义,古谚文也称作“아래아한글”。在古韩文中叫作“아래아”的字母,是“ᄋᆞ”中处于下部的点状的中声字母“”。该字母发音介于“ㅏ[a]”“ㅡ[ɯ]”之间,在中古朝鲜语仍然存在,但在现代韩语里已经不复存在。由于“ㆍ”在现代韩语中大部分变为了“ㅏ[a]”,所以该点状字母常常被称为“下a”,也就是“아래아”。而和“아래아”同样的古字母,不管是否有发音区别,直到二十世纪初叶这些字母仍然在被使用着。

现代的古谚文

编辑

由于古谚文给人一种古典感,所以偶尔会在商标中使用。其中最具有代表性的是Hancom公司所开发的名为아래아한글的文字处理软件。该软件的商标设计是韩文“ᄒᆞᆫ”。此外,在其他的商标设计中也常有使用아래아的情况,但是除该字母以外的古谚文则罕为使用。

古谚文对于一般人来说并非必要,但是对于古文研究者则是十分重要的。但由于电脑中古谚文输入法以及其配套字体存在问题,因而其使用比较困难。

古谚文在电脑中的显示

编辑

文字编码体系

编辑

初中终编码

编辑

初声-中声-终声文字符号化方式(첫소리-가운뎃소리-끝소리 글자부호화 방식、Syllable-Initial-Peak-Final Encoding Approach)谚文符号系[1],略称为初中终编码,是一种在Unicode的谚文字母区段中(U+1100~U+11FF页面存档备份,存于互联网档案馆),U+A960~U+A97C页面存档备份,存于互联网档案馆),U+D7B0~U+D7FB页面存档备份,存于互联网档案馆))以初声-中声(-终声)(-傍点)的顺序的排列方法。

使用初中终编码所表示的《训民正音》谚解本最开头一句如下。

나랏〮말〯ᄊᆞ미〮 中듀ᇰ에〮 달아〮 문ᄍᆞᆼ와〮로 서르 ᄉᆞᄆᆞᆺ디〮 아니〮ᄒᆞᆯᄊᆡ〮

通常,使用初中终编码时会有以下一些问题。

  1.  无法输出构型美观的谚文。无法输出如打字机一般的字型。
  2.  汉阳PUA中一部分古谚文字母无法单独使用初中终编码输入,而必须要以初、中、终组合的形式才能输入。

以上第一个问题能通过使用OpenType GSUB技术以及其对应字体解决[2]。在微软的环境下,有部分字体可以支持Uniscribe技术,如바탕 옛한글、굴림 옛한글、돋움 옛한글、궁서 옛한글 글꼴等都是广为人知的几种字体,这些字体在Microsoft Word 2002以上版本中通常都有附带,可以显示出较为美观的古谚文字母组合。但是,这些字体只能与软件包一起捆绑购买也是其缺点之一。Windows 8起附带的Malgun Gothic、Adobe的思源黑体、Google的Noto Sans CJK也可以显示古谚文字母组合。

开放源代码的Linux、Android可以通过HarfBuzz和最新版的Pango执行GSUB技术以显示出古谚文。此外苹果Apple Advanced Typography(AAT)的mort/morx table、SIL国际Graphite的mort/morx table都可以用来编写构型美观的古谚文字体。

而对于第二个问题,使用了GSUB的合字功能的字体,可以通过使用初中终编码组合而变化为汉阳PUA编码中对应的字型字形。此外在Unicode中5.2也包含了汉阳PUA编码所含的所有字母,因而没有必要再只使用汉阳PUA编码。但是,也有可能发现一些新的构字成分,而这些成分在Unicode5.2的区段中并未包含。因而若要使用初声(L)、中声(V)、终声(T)逐个构字的方法来输出古谚文的话,则必须使用GSUB技术和相应的TrueType字体。

汉阳私用区编码

编辑

汉阳私用区编码(Hanyang private use area code,汉阳PUA编码)是使用Unicode中指定的私用区储存古谚文以及口诀的一种编码。直到Windows XP,韩文版的Windows的系统字体都是对应这种编码来制作的。

该编码在Microsoft Word 2000及“아래아한글”中有官方支持,此外在政府机关以及谚文相关的古籍整理中也被广泛使用。然而,汉阳私人使用区中已经组合好的谚文音节仅有五千余个。而在Word的最新版本中已经不再支持汉阳PUA编码中的古谚文,为了克服这一点,“아래아한글2000”在支持初中终编码标准的同时,考虑到对既有的“아래아한글”文本的支持和兼容性,依然支持汉阳PUA编码。

使用汉阳PUA编码所表示的《训民正音》谚解本最开头一句如下。

나랏말미 귁에 달아 문와로 서르 디 아니

汉阳PUA编码中的谚文如下排列。

  • U+E0BC~U+EFFF,U+F100~U+F66E:古谚文组合完成型文字
  • U+F784~U+F800:古谚文初声(组合型)
  • U+F806~U+F864:古谚文中声(组合型)
  • U+F86A~U+F8F7:古谚文终声(组合型)

此外的文字如下排列。

  • U+E000~U+E0BB:空白文字
  • U+F000~U+F0FF:特殊的象形符号(支持字体:Wingdings 1, 2, 3)
  • U+F67E~U+F77C:口诀

汉阳PUA编码领域的谚文音节包含了现代谚文以外的已经组合完成的古谚文音节。在这些组合完成以外的音节,可以使用U+F784~U+F8F7区域内的文字进行组合。

在此之外使用单个字符(ㄱ、ㅗ等)输入时,尽可能利用了谚文兼容字母区域(U+3130~U+318F)中的字母,在该区域不存在的字母则使用则使用了初中终编码(U+1100~U+11FF)的字母。此外,为了使用谚文字母区段的文字进行组合,按照Unicode协会的方针,字体的中声和终声需要按照文字的空间构造以零宽度的方式来制作(即根据终声有无来确定音节的比例)。而支持汉阳PUA的一部分字体无视了这个原理,直接按照中声和终声一般所占比例来制作。

汉阳PUA编码存在一些不存在于旧版Unicode编码中的字母。例如,汉阳PUA中的ㆍ+ㅏ(汉阳PUA:)在Unicode标准并不存在。在Unicode5.2追加一些新的古谚文字母之后,此类字母即可使用。但汉阳PUA中非标准编码的组合完成型音节有五千多个,不支持汉阳PUA的字体一般无法正常显示。韩国微软支持的最新Office中的字体只支持初中终编码而不支持汉阳PUA编码。

由于汉阳PUA中组合完成型音节被使用得相当广泛,量产出了很多不使用标准编码的文本。为解决此问题,像韩国TeX使用者论坛这样的地方已经提出了将汉阳PUA编码中组合完成型文字转换为对应的初中终编码的方案,如此即可解决大部分问题。

参考

编辑
  1. ^ Yergeau, F. UTF-8, a transformation format of Unicode and ISO 10646. 1996-10. 
  2. ^ 存档副本. [2015-01-02]. (原始内容存档于2015-10-28).