国际音标扩展 (Unicode区段)

国际音标扩展是一个位于基本多文种平面Unicode区块,主要收录了不在基本拉丁字母拉丁字母补充-1拉丁字母扩展-A拉丁字母扩展-B国际音标(IPA)字符,其中包括正在使用中的、已弃用的、曾提议使用的国际音标(IPA)符号,还有数个非IPA的语音符号。同样用于语音学的其他字符,如腭音化符号“◌ʲ”,则被收录在音标扩展U+1D00..U+1D7F)和音标扩展补充U+1D80..1DBF)。变音符号可以在占位修饰符号U+02B0..U+02FF)和组合附加符号U+0300..U+036F)等区块找到。

国际音标扩展
IPA Extensions
范围U+0250..U+02AF
(96个码位)
平面基本多文种平面BMP
文字拉丁字母
应用IPA
已分配96个码位
未分配0个保留码位
Unicode版本历史
1.0.089 (+89)
3.094 (+5)
4.096 (+2)
相关区块
音标扩展 · 音标扩展补充
注释[1][2]

随着Unicode能够完整地标示出所有音标, 基于ASCII开发的音标系统(如X-SAMPAKirshenbaum等)因此逐渐被替代。[3]

完整字符表 编辑

编码 字符 HTML 中文名称 Unicode名称 用途 IPA编号
国际音标字母
U+0250
ɐ
ɐ 拉丁小写字母颠倒的A Latin Small Letter Turned A 次开央元音 324
U+0251
ɑ
ɑ 拉丁小写字母Alpha Latin Small Letter Alpha 开后不圆唇元音 305
U+0252
ɒ
ɒ 拉丁小写字母颠倒的Alpha Latin Small Letter Turned Alpha 开后圆唇元音 313
U+0253
ɓ
ɓ 拉丁小写字母带钩的B Latin Small Letter B with Hook 浊双唇内爆音 160
U+0254
ɔ
ɔ 拉丁小写字母开O Latin Small Letter Open O 半开后圆唇元音 306
U+0255
ɕ
ɕ 拉丁小写字母卷曲的C Latin Small Letter C with Curl 清龈腭擦音 182
U+0256
ɖ
ɖ 拉丁小写字母带尾巴的D Latin Small Letter D with Tail 浊卷舌塞音 106
U+0257
ɗ
ɗ 拉丁小写字母带钩的D Latin Small Letter D with Hook 浊齿龈内爆音 162
U+0258
ɘ
ɘ 拉丁小写字母倒转的E Latin Small Letter Reversed E 半闭央不圆唇元音 397
U+0259
ə
ə 拉丁小写字母Schwa Latin Small Letter Schwa 中央元音 322
U+025A
ɚ
ɚ 拉丁小写字母带钩的Schwa Latin Small Letter Schwa with Hook 卷舌中央元音 327
U+025B
ɛ
ɛ 拉丁小写字母开E Latin Small Letter Open E 半开前不圆唇元音 303
U+025C
ɜ
ɜ 拉丁小写字母倒转的开E Latin Small Letter Reversed Open E 半开央不圆唇元音 326
U+025D
ɝ
ɝ 拉丁小写字母带钩的倒转开E Latin Small Letter Reversed Open E with Hook 卷舌半开央不圆唇元音
U+025E
ɞ
ɞ 拉丁小写字母闭的带钩倒转开E Latin Small Letter Closed Reversed Open E 半开央圆唇元音 395
U+025F
ɟ
ɟ 拉丁小写字母带删节线的无点J Latin Small Letter Dotless J with Stroke 浊硬腭塞音 108
U+0260
ɠ
ɠ 拉丁小写字母带钩的G Latin Small Letter G with Hook 浊软腭内爆音 166
U+0261
ɡ
ɡ 拉丁小写字母印刷体G Latin Small Letter Script G 浊软腭塞音 110
U+0262
ɢ
ɢ 拉丁小型大写字母G Latin Letter Small Capital G 浊小舌塞音 112
U+0263
ɣ
ɣ 拉丁小写字母Gamma Latin Small Letter Gamma 浊软腭擦音 141
U+0264
ɤ
ɤ 拉丁小写字母“羊角号” Latin Small Letter Rams Horn 半闭后不圆唇元音 315
U+0265
ɥ
ɥ 拉丁小写字母颠倒的H Latin Small Letter Turned H 浊圆唇硬腭近音 171
U+0266
ɦ
ɦ 拉丁小写字母带钩的H Latin Small Letter H with Hook 浊声门擦音 147
U+0267
ɧ
ɧ 拉丁小写字母带钩的Heng(Ꜧ) Latin Small Letter Heng with Hook sj音(与清腭龈擦音清软腭擦音稍微相似) 175
U+0268
ɨ
ɨ 拉丁小写字母带删节线的I Latin Small Letter I with Stroke 闭央不圆唇元音 317
U+0269
ɩ
ɩ 拉丁小写字母Iota Latin Small Letter Iota 字母“ɪ”在1989年以前的形式(已弃用 399
U+026A
ɪ
ɪ 拉丁小型大写字母I Latin Letter Small Capital I 次闭前不圆唇元音 319
U+026B
ɫ
ɫ 拉丁小写字母带中位波浪号的L Latin Small Letter L with Middle Tilde 软腭化咽化齿龈边近音 209
U+026C
ɬ
ɬ 拉丁小写字母带带的L Latin Small Letter L with Belt 清齿龈边擦音 148
U+026D
ɭ
ɭ 拉丁小写字母带卷舌钩的L Latin Small Letter L with Retroflex Hook 卷舌边近音 156
U+026E
ɮ
ɮ 拉丁小写字母Lezh Latin Small Letter Lezh 浊齿龈边擦音 149
U+026F
ɯ
ɯ 拉丁小写字母颠倒的M Latin Small Letter Turned M 闭后不圆唇元音 316
U+0270
ɰ
ɰ 拉丁小写字母长脚的颠倒M Latin Small Letter Turned M with Long Leg 软腭近音 154
U+0271
ɱ
ɱ 拉丁小写字母带钩的M Latin Small Letter M with Hook 唇齿鼻音 115
U+0272
ɲ
ɲ 拉丁小写字母带左钩的N Latin Small Letter N with Left Hook 硬腭鼻音 118
U+0273
ɳ
ɳ 拉丁小写字母带卷舌钩的N Latin Small Letter N with Retroflex Hook 卷舌鼻音 117
U+0274
ɴ
ɴ 拉丁小型大写字母N Latin Letter Small Capital N 小舌鼻音 120
U+0275
ɵ
ɵ 拉丁小写字母带横删节线的O Latin Small Letter Barred O 半闭央圆唇元音 323
U+0276
ɶ
ɶ 拉丁小型大写字母OE Latin Letter Small Capital OE 开前圆唇元音 312
U+0277
ɷ
ɷ 拉丁小写字母闭Omega Latin Small Letter Closed Omega 字母“ʊ”在1989年以前的形式(已弃用 398
U+0278
ɸ
ɸ 拉丁小写字母Phi Latin Small Letter Phi 清双唇擦音 126
U+0279
ɹ
ɹ 拉丁小写字母颠倒的R Latin Small Letter Turned R 齿龈近音 151
U+027A
ɺ
ɺ 拉丁小写字母长脚的颠倒R Latin Small Letter Turned R with Long Leg 齿龈边闪音 181
U+027B
ɻ
ɻ 拉丁小写字母带钩的颠倒R Latin Small Letter Turned R with Hook 卷舌近音 152
U+027C
ɼ
ɼ 拉丁小写字母长脚的R Latin Small Letter R with Long Leg 齿龈颤音 206
U+027D
ɽ
ɽ 拉丁小写字母带尾巴的R Latin Small Letter R with Tail 卷舌闪音 125
U+027E
ɾ
ɾ 拉丁小写字母带鱼钩的R Latin Small Letter R with Fishhook 齿龈闪音 124
U+027F
ɿ
ɿ 拉丁小写字母带鱼钩的倒转R Latin Small Letter Reversed R with Fishhook 成音节的浊齿龈擦音(用于汉语)
U+0280
ʀ
ʀ 拉丁小型大写字母R Latin Letter Small Capital R 小舌颤音 123
U+0281
ʁ
ʁ 拉丁小型大写字母颠倒的R Latin Letter Small Capital Inverted R 浊小舌擦音 143
U+0282
ʂ
ʂ 拉丁小写字母带钩的S Latin Small Letter S with Hook 清卷舌擦音 136
U+0283
ʃ
ʃ 拉丁小写字母Esh Latin Small Letter Esh 清腭龈擦音 134
U+0284
ʄ
ʄ 拉丁小写字母带横线与钩的无点J Latin Small Letter Dotless J with Stroke and Hook 浊硬腭内爆音 164
U+0285
ʅ
ʅ 拉丁小写字母矮胖的倒转Esh Latin Small Letter Squat Reversed Esh 成音节的浊卷舌擦音(用于汉语)
U+0286
ʆ
ʆ 拉丁小写字母卷曲的Esh Latin Small Letter Esh with Curl 清龈腭擦音(已弃用) 204
U+0287
ʇ
ʇ 拉丁小写字母颠倒的T Latin Small Letter Turned T 齿搭嘴音(已弃用) 201
U+0288
ʈ
ʈ 拉丁小写字母带卷舌钩的T Latin Small Letter T with Retroflex Hook 清卷舌塞音 105
U+0289
ʉ
ʉ 拉丁小写字母带横删节线的U Latin Small Letter U Bar 闭央圆唇元音 318
U+028A
ʊ
ʊ 拉丁小写字母Upsilon Latin Small Letter Upsilon 次闭后圆唇元音 321
U+028B
ʋ
ʋ 拉丁小写字母带钩的V Latin Small Letter V with Hook 唇齿近音 150
U+028C
ʌ
ʌ 拉丁小写字母颠倒的V Latin Small Letter Turned V 半开后不圆唇元音 314
U+028D
ʍ
ʍ 拉丁小写字母颠倒的W Latin Small Letter Turned W 清圆唇软腭近音 169
U+028E
ʎ
ʎ 拉丁小写字母颠倒的Y Latin Small Letter Turned Y 硬腭边音 157
U+028F
ʏ
ʏ 拉丁小型大写字母Y Latin Letter Small Capital Y 次闭前圆唇元音 320
U+0290
ʐ
ʐ 拉丁小写字母带卷舌钩的Z Latin Small Letter Z with Retroflex Hook 浊卷舌擦音 137
U+0291
ʑ
ʑ 拉丁小写字母卷曲的Z Latin Small Letter Z with Curl 浊龈腭擦音 183
U+0292
ʒ
ʒ 拉丁小写字母Ezh Latin Small Letter Ezh 浊腭龈擦音 135
U+0293
ʓ
ʓ 拉丁小写字母卷曲的Ezh Latin Small Letter Ezh with Curl 浊龈腭擦音(已弃用) 205
U+0294
ʔ
ʔ 拉丁字母声门塞音 Latin Letter Glottal Stop 声门塞音 113
U+0295
ʕ
ʕ 拉丁字母浊咽擦音 Latin Letter Pharyngeal Voiced Fricative 浊咽擦音 145
U+0296
ʖ
ʖ 拉丁字母颠倒的声门塞音 Latin Letter Inverted Glottal Stop 齿龈边搭嘴音(已弃用) 203
U+0297
ʗ
ʗ 拉丁字母伸长的C Latin Letter Stretched C 齿龈后搭嘴音英语Alveolar click(已弃用) 202
U+0298
ʘ
ʘ 拉丁字母双唇搭嘴音 Latin Letter Bilabial Click 双唇搭嘴音 176
U+0299
ʙ
ʙ 拉丁小型大写字母B Latin Letter Small Capital B 双唇颤音 121
U+029A
ʚ
ʚ 拉丁小写字母闭的开E Latin Small Letter Closed Open E [œ]的错字 396
U+029B
ʛ
ʛ 拉丁小型大写字母带钩的G Latin Letter Small Capital G with Hook 浊小舌内爆音 168
U+029C
ʜ
ʜ 拉丁小型大写字母H Latin Letter Small Capital H 清会厌擦音 172
U+029D
ʝ
ʝ 拉丁小写字母带交叉尾巴的J Latin Small Letter J with Crossed Tail 浊硬腭擦音 139
U+029E
ʞ
ʞ 拉丁小写字母颠倒的K Latin Small Letter Turned K 软腭搭嘴音(已弃用) 291
U+029F
ʟ
ʟ 拉丁小型大写字母L Latin Letter Small Capital L 软腭边音 158
U+02A0
ʠ
ʠ 拉丁小写字母带钩的Q Latin Small Letter Q with Hook 浊小舌内爆音(已弃用) 167
U+02A1
ʡ
ʡ 拉丁字母带删节线的声门塞音 Latin Letter Glottal Stop with Stroke 声门塞音 173
U+02A2
ʢ
ʢ 拉丁字母倒转的带删节线的声门塞音 Latin Letter Reversed Glottal Stop with Stroke 浊会厌擦音 174
U+02A3
ʣ
ʣ 拉丁小写二合字母DZ Latin Small Letter DZ Digraph 浊齿龈塞擦音(已弃用) 212
U+02A4
ʤ
ʤ 拉丁小写二合字母Dezh Latin Small Letter Dezh Digraph 浊腭龈塞擦音(已弃用) 214
U+02A5
ʥ
ʥ 拉丁小写二合字母卷曲的DZ Latin Small Letter DZ Digraph with Curl 浊龈腭塞擦音(已弃用) 216
U+02A6
ʦ
ʦ 拉丁小写二合字母TS Latin Small Letter TS Digraph 清齿龈塞擦音(已弃用) 211
U+02A7
ʧ
ʧ 拉丁小写二合字母Tesh Latin Small Letter Tesh Digraph 清腭龈塞擦音(已弃用) 213
U+02A8
ʨ
ʨ 拉丁小写二合字母卷曲的TC Latin Small Letter TC Digraph with Curl 清龈腭塞擦音(已弃用) 215
问题发音的国际音标字符
U+02A9
ʩ
ʩ 拉丁小写二合字母Feng Latin Small Letter Feng Digraph 腭咽擦音英语velopharyngeal consonant 602
U+02AA
ʪ
ʪ 拉丁小写二合字母LS Latin Small Letter LS Digraph 清开槽边齿龈擦音 603
U+02AB
ʫ
ʫ 拉丁小写二合字母LZ Latin Small Letter LZ Digraph 浊开槽边齿龈擦音 604
U+02AC
ʬ
ʬ 拉丁字母双唇撞击音 Latin Letter Bilabial Percussive 双唇撞击音英语Bilabial percussive
U+02AD
ʭ
ʭ 拉丁字母双齿撞击音 Latin Letter Bidental Percussive 双齿撞击音英语Bidental percussive 601
汉语语言学音标补充
U+02AE
ʮ
ʮ 拉丁小写字母带鱼钩的颠倒H Latin Small Letter Turned H with Fishhook 成音节的唇音化浊齿龈擦音(用于汉语)
U+02AF
ʯ
ʯ 拉丁小写字母带鱼钩和尾巴的颠倒H Latin Small Letter Turned H with Fishhook and Tail 成音节的唇音化浊卷舌擦音(用于汉语)

子标题 编辑

国际音标扩展共包含了3个子标题,他们分别对应到在不同Unicode版本中加入的三组字符:国际音标扩展(IPA extensions)、问题发音的国际音标字符(IPA characters for disordered speech)与汉语语言学音标补充(Additions for Sinology)。[4]

国际音标扩展 编辑

此副标题下包括了本区块的前89个字符,它们都是只在国际音标中经常使用的拉丁字母变体和希腊字母。[4]此副标题下的所有字符皆包含在1991年10月发布的Unicode 1.0中。

问题发音的国际音标字符 编辑

此副标题下的字符用以记录一些不存在于自然语言中,但出现于婴儿的发声、语言障碍者的发音,以及其他在语音学上能记录的发音。[4] (这类音标称作国际音标扩展/ExtIPA,但与上节的中的字符不同。)此副标题下的所有字符皆包含在1999年9月发布的Unicode 3.0中。

汉语语言学音标补充 编辑

此副标题下包含了2个用于汉语的音素:ʮʯ[4]它们在2003年4月发表的Unicode 4.0中加入此区块。

简化字符表 编辑

国际音标扩展
IPA Extensions[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+025x ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ
U+026x ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
U+027x ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
U+028x ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
U+029x ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
U+02Ax ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
注释
1.^ 依据 Unicode 14.0

历史 编辑

自Unicode 1.0以来,国际音标扩展区块一直存在于Unicode中,且透过与ISO 10646的一致而保持不变。直到Unicode 3.0才加以扩展,增加了用于表示问题发音的语音符号,Unicode 4.0又再次加入汉语语言学语音符号。[5]

下列与Unicode相关的文档记录了在本区块中定义特定字符的目的和过程:

版本 最终码位[a] 码位数 UTC ID L2英语International Committee for Information Technology Standards ID WG2英语ISO/IEC JTC 1/SC 2 ID 文档
1.0.0 U+0250..0296 71 (待考)
X3L2/95-090 N1253 (doc, txt页面存档备份,存于互联网档案馆)) Umamaheswaran, V. S.; Ksar, Mike, 4.2, Unconfirmed Minutes of WG 2 Meeting # 28 in Helsinki, Finland; 1995-06-26--27, 1995-09-09 
L2/05-212 Davis, Mark, Background Information on IPA, 2005-08-05 
L2/07-022 N3219页面存档备份,存于互联网档案馆 Priest, Lorna; Aumann, Greg, Glyph corrections for U+027F and U+0285 in TUS, 2007-01-12 
L2/10-268 Priest, Lorna, Annotation additions resulting from encoding LATIN CAPITAL LETTER H WITH HOOK, 2010-07-29 
U+0297..02A8 18 UTC/1991-047 Becker, Joe, Extended Latin, Standard Phonetic, Modifier Letters, General Diacritical Marks, Greek, Cyrillic 
UTC/1991-048B Whistler, Ken, IPA additions, Draft Minutes from the UTC meeting #46 day 2, 3/27 at Apple, 1991-03-27 
3.0 U+02A9..02AD 5 L2/98-209 N1742页面存档备份,存于互联网档案馆 Everson, Michael, Additional IPA characters for the UCS, 1998-05-25 
L2/98-293 N1885页面存档备份,存于互联网档案馆 2.2, Comments on proposals to add various characters to ISO/IEC 10646, 1998-08-25 
L2/98-299 N1845页面存档备份,存于互联网档案馆 Everson, Michael, Additional IPA “disturbed speech” characters for the UCS, 1998-09-08 
L2/98-301 N1847页面存档备份,存于互联网档案馆 Everson, Michael, Responses to NCITS/L2 and Unicode Consortium comments on numerous proposals, 1998-09-12 
L2/98-372 N1884R2 (pdf, doc页面存档备份,存于互联网档案馆)) Whistler, Ken; et al, Additional Characters for the UCS, 1998-09-22 
L2/98-329 N1920页面存档备份,存于互联网档案馆 Combined PDAM registration and consideration ballot on WD for ISO/IEC 10646-1/Amd. 30, AMENDMENT 30: Additional Latin and other characters, 1998-10-28 
L2/99-010 N1903 (pdf, html页面存档备份,存于互联网档案馆), doc页面存档备份,存于互联网档案馆)) Umamaheswaran, V. S., 8.2.10, Minutes of WG 2 meeting 35, London, U.K.; 1998-09-21--25, 1998-12-30 
4.0 U+02AE..02AF 2 L2/01-272 N2366页面存档备份,存于互联网档案馆 Cook, Richard; Everson, Michael, Proposal to add five phonetic characters to the UCS, 2001-07-02 
L2/01-295R Moore, Lisa, Minutes from the UTC/L2 meeting #88, 2001-11-06 
L2/01-347 N2366R页面存档备份,存于互联网档案馆 Cook, Richard; Everson, Michael, Proposal to add six phonetic characters to the UCS, 2001-09-20 
L2/02-154 N2403页面存档备份,存于互联网档案馆 Umamaheswaran, V. S., Draft minutes of WG 2 meeting 41, Hotel Phoenix, Singapore, 2001-10-15/19, 2002-04-22 
  1. ^ 提案中建议的码位和字符名称可能与最终结果不同。

参见 编辑

参考资料 编辑

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
  3. ^ Wells, John C. Phonetic symbols in word processing and on the web (PDF). Solé, Maria-Josep; Recasens, Daniel; Romero, Joaquín (编). Proceedings of the 15th International Congress of Phonetic Sciences. Barcelona. 2003 [2019-06-05]. (原始内容存档 (PDF)于2018-09-02). 
  4. ^ 4.0 4.1 4.2 4.3 Unicode 6.2 code charts (PDF). The Unicode Standard. [1 April 2013]. (原始内容存档 (PDF)于2018-07-04). 
  5. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.