Unicode中的音标符号

Unicode通过已有的书写系统和添加带音标字符的额外的区块支持一些音标文字和标记法。这些语音学符号产生于已有的文字,通常是拉丁文、希腊文或西里尔文。Unicode中没有专门的“国际音标字符”。除官方标准的国际音标外,这些区块还包括了已被现今标准规范废除的国际音标符号、乌拉尔音标英语Uralic Phonetic Alphabet、过去使用的汉语音调符号等。

音标字符

编辑

国际音标利用来自其他书写系统最常用的标音字母。国际音标常使用拉丁字母、希腊字母和西里尔字母,组合用变音符号还补充语音文本的意义。最后,这些标音字母利用为表达语言学含义特别修订的字母。一个“修饰字母”不是作为独立的字母,但作为前面字符的修饰[1]产生有区别的字素,尤其是在国际音标中。例如,ʰ不是用来表达它本身,但修饰了前面的符号。因此,是单独的区别于t的国际音标符号。然而,这些“修饰字母”的一部分也用于全音素文字。例如,ʿ 用来转写闪米特语的ayin或夏威夷语okina,或者 ˚ 转写阿布哈兹语 ә

从国际音标到Unicode

编辑

辅音

编辑

下表包含了国际音标用的音位的Unicode码点。加粗的码点表示Unicode图标提供应用程序注释,如U+026D ɭ LATIN SMALL LETTER L WITH RETROFLEX HOOK ,HTML:ɭ用于“浊卷舌边音”。粗斜体表示字符名称本身标示了发音,如U+0298 ʘ LATIN LETTER BILABIAL CLICK ,HTML:ʘ

双唇 唇齿 齿 齿龈 龈后 卷舌 唇硬腭
塞音 p 0070 b 0062 0070 032A 0062 032A 0074 032A 0064 032A t
0074
d 0064 ʈ 0288 ɖ 0256
内爆音 ɓ̥ 0253 0325 ɓ 0253 ɗ̪ 0257 032A ɗ 0257 *
挤喉音 0070 02BC t̪ʼ 0074 032A 02BC 0074 02BC ʈʼ 0288 02BC
鼻音 006D 0325 m 006D ɱ̊ 0271 030A ɱ 0271 n̪̊ 006E 032A 030A 006E 032A 006E 0325 n 006E ɳ̊ 0273 030A ɳ 0273
颤音 ʙ 0299 0072 0325 r 0072 *
闪音 ⱱ̟ 2C71 031F 2C71 ɾ 027E ɽ 027D
边闪音 ɺ 027A *
擦音 ɸ 0278 β 03B2 f
0066
v 0076 θ 03B8 ð 00F0 s 0073 z 007A ʃ 0283 ʒ 0292 ʂ 0282 ʐ 0290
边擦音 ɬ 026C ɮ 026E *
挤喉擦音 0073 02BC ʃʼ 0283 02BC
挤喉边擦音 ɬʼ 026C 02BC
敲击音 ʬ
02AC
ʭ
02AD
近音 β̞̊ 03B2 031E 030A β̞ 03B2 031E ʋ̥ 028B 0325 ʋ 028B ð̞ 00F0 031E ɹ̥ 0279 0325 ɹ 0279 ɻ̊ 027B 030A ɻ 027B ɥ̊ 0265 030A ɥ 0265
边近音 006C 0325 l 006C ɭ 026D
搭嘴音 ʘ
0298
ǀ
01C0
ǃ
01C3
ǃ / ǂ
01C3 / 01C2
边搭嘴音 * ǁ
01C1
龈腭 硬腭 唇软腭 软腭 小舌 会厌 声门
塞音 ȶ 0236 ȡ 0221 c 0063 ɟ 025F k͡p 006B 0361 0070 ɡ͡b 0261 0361 0062 k 006B ɡ 0261 q 0071 ɢ 0262 ʡ 02A1 ʔ 0294
内爆音 ʄ 0284 ɠ 0260 ʛ 029B
挤喉音 0063 02BC 006B 02BC 0071 02BC
鼻音 ȵ 0235 ɲ 0272 ŋ͡m 014B 0361 006D ŋ 014B ɴ 0274
颤音 ʀ 0280 *
闪音 *
边闪音 * *
擦音 ɕ 0255 ʑ 0291 ç 0063 0327 ʝ 029D x 0078 ɣ 0263 χ 03C7 ʁ 0281 ħ 0127 ʕ 0295 ʜ 029C ʢ 02A2 h 0068 ɦ 0266
近音 j 006A ʍ 028D w 0077 ɰ 0270
边近音 ȴ 0234 ʎ 028E ʟ 029F

元音

编辑
 

下表描述了元音及其Unicode / UCS码点。表格中成对的元音分别地表示不圆唇和圆唇的变化。另外,带Unicode名称的字符以粗体标出。带有额外应用程序注释的字符以粗斜体标出。直接借用其他文字(拉丁字母、希腊字母或西里尔字母)的以斜体标出。

Unicode元音码点
本表格表示语音学上的元音图

圆点两边的元音格式为不圆唇 · 圆唇

i · y
0069 0079
ɨ · ʉ
0268 0289
ɯ · u
026F 0075
次闭 ɪ · ʏ
026A 028F
ɪ̈ · ʊ̈
026A 0308 · 028A 0308
 · ʊ
028A
半闭 e · ø
0065 00F8
ɘ · ɵ
0258 0275
ɤ · o
0264 006F
ə
0259
半开 ɛ · œ
025B 0153
ɜ · ɞ
025C 025E
ʌ · ɔ
028C 0254
次开 æ ·
00E6
ɐ
0250
a · ɶ
0061 0276
ɑ · ɒ
0251 0252
元音长度标记 ː
02D0

Unicode区块

编辑

不同于标准拉丁字母或希腊字母如m和ɛ,这些符号放在特定的语音学用区块:

从Unicode区块到文字

编辑

语音学用的字符放在六个Unicode区块中。

国际音标扩展(U+0250–02AF)

编辑
国际音标扩展
IPA Extensions[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+025x ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ
U+026x ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
U+027x ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
U+028x ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
U+029x ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
U+02Ax ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
注释
1.^ 依据 Unicode 14.0

占位修饰符号(U+02B0–02FF)

编辑

占位修饰符号区块里面的字符用来和前面的字母组成一个单元(即“修饰”)。如字符U+02B0 ʰ MODIFIER LETTER SMALL H不是简单的表示上标h(h),但是作为送气音符号放在字母后面表示送气,像是。这个区块包含了:

  • 拉丁上标修饰符号(U+02B0–U+02B8): ʰ 送气 ʱ 呼气音 ʲ 腭音化 ʳ, ʴ, ʵ, ʶ 儿化或 r-offglides ʷ 唇化 ʸ 腭化,美式标音系统英语Americanist phonetic notation用(U+02B2)
  • 杂项语音学修饰符(U+02B9–U+02D7):ʹ ʺ ʻ ʼ ʽ ʾ ʿ ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ ː ˑ ˒ ˓ ˔ ˕ ˖ ˗
  • 间隔用变音符号(U+02D8–U+02DD):˘ 抑扬符 ˙ 上点 ˚ 上圈; ˛ ogonek ˜ 腭化符; ˝ 双尖音符
  • 基于1989年国际音标附加的(U+02DE–U+02E4):˞ ˟ ˠ ˡ ˢ ˣ ˤ
  • 声调符号(U+02E5–U+02E9):˥ ˦ ˧ ˨ ˩
  • 扩展注音符号声调标记:U+02EA ˪ YIN DEPARTING TONE MARKU+02EB ˫ YANG DEPARTING TONE MARK
  • 国际音标修饰字符:U+02EC ˬ MODIFIER LETTER VOICING,不送气
  • 其他修饰符号:U+02EE ˮ MODIFIER LETTER DOUBLE APOSTROPHE,用于涅涅茨语
  • 乌拉尔音标修饰符号(U+02EF–U+02FF):˯ ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
占位修饰符号
Spacing Modifier Letters[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+02Bx ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ʹ ʺ ʻ ʼ ʽ ʾ ʿ
U+02Cx ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ
U+02Dx ː ˑ ˒ ˓ ˔ ˕ ˖ ˗ ˘ ˙ ˚ ˛ ˜ ˝ ˞ ˟
U+02Ex ˠ ˡ ˢ ˣ ˤ ˥ ˦ ˧ ˨ ˩ ˪ ˫ ˬ ˭ ˮ ˯
U+02Fx ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
注释
1.^ 依据 Unicode 14.0

音标扩展(U+1D00–1D7F)

编辑

这个区块和下面的音标扩展增补包括了:

  • 小型大写字母“ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ”
  • 倒转的小写字母“ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ”
  • 额外的小型大写字母“ʁ ʛ ᴀ ᴁ ᴃ ᴄ ᴅ ᴆ ᴇ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ ᴐ ᴘ ᴙ ᴚ ᴛ ᴜ ᴠ ᴡ ᴢ ᴣ ᴦ ᴧ ᴨ ᴩ ᴪ”
  • 带硬腭音钩的小写字母“ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ”
  • 带卷舌钩的小写字母“ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶩ ᶯ ᶼ”
音标扩展
Phonetic Extensions[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D0x
U+1D1x
U+1D2x
U+1D3x ᴿ
U+1D4x
U+1D5x
U+1D6x
U+1D7x ᵿ
注释
1.^ 依据 Unicode 14.0

音标扩展增补(U+1D80–1DBF)

编辑
音标扩展补充
Phonetic Extensions Supplement[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D8x
U+1D9x
U+1DAx
U+1DBx ᶿ
注释
1.^ 依据 Unicode 15.0

声调修饰符号(U+A700–A71F)

编辑
  • U+A700到U+A707的8个符号不是标准的国际音标符号。它们只是在早期被用于标示汉语的声调调类(不是调值,平上去入、各分阴阳,所以一共8个符号),标准国际音标规范中没有这8个符号。
  • U+A717到U+A71A不是标准的国际音标符号,它们用于记录奇南特克语的声调符号。
  • U+A71B到U+A71F不是标准的国际音标符号,它们用于记录非洲语言的声调
声调修饰符号
Modifier Tone Letters[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+A70x
U+A71x
注释
1.^ 依据 Unicode 15.0

上标和下标(U+2070–209F)

编辑
上标和下标
Superscripts and Subscripts[1][2][3]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+207x
U+208x
U+209x
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域表示未分配的码位
3.^ 字符¹(U+00B9),²(U+00B2)与³(U+00B3)位于拉丁字母补充-1


参见

编辑

参考资料

编辑
  1. ^ 存档副本. [2014-08-27]. (原始内容存档于2021-02-24). 

外部链接

编辑