组合字符
组合字符(Combining character)在字体排印学中是用来改变其它字符所用的字符。在拉丁字母中,最常见的组合字符为附加符号(包含重音号)。 [1]
统一码也包含许多预组字符(Precomposed character),即事先将字符组好并赋予码位。所以有可能同时使用组合字符和预组字符。这导致了若要比较两个统一码字串或设计编码转换器时,需要先执行Unicode正规化。[2]
在统一码中,用于欧洲语言和国际音标的组合用附加符号为〈U+0300–U+036F〉。组合用附加符号亦存在统一码中的多个区块。在统一码中,附加符号总是加在主要字符之后。因此,有可能加入多个附加符号。直到2006年,只有少数软体能正确显示此类组合。
OpenType
编辑OpenType则有ccmp功能标签,以定义字形是由其它组合字符所组合出来或可分解之,另有mark标签用以将组合字符叠加于基本字符,以及mkmk标签用以组合字符彼此之间的组合。
统一码范围
编辑- 组合附加符号(Combining Diacritical Marks,0300–036F),由版本1.0始,陆续修改到4.1。[3][4]
- 组合附加符号扩展(Combining Diacritical Marks Extended,1AB0–1AFF),由版本7.0开始加入。[5]
- 组合附加符号补充(Combining Diacritical Marks Supplement,1DC0–1DFF),由版本4.1开始,陆续修改到5.2。[5]
- 符号用组合附加符号(Combining Diacritical Marks for Symbols,20D0–20FF),由版本1.0开始,陆续修改到5.1。[5]
- 组合半符号(Combining Half Marks,FE20–FE2F),由版本1.0开始,陆续修改到8.0。[5]
组合附加符号 Combining Diacritical Marks[1] Unicode Consortium 官方码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+030x | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̅ | ◌̆ | ◌̇ | ◌̈ | ◌̉ | ◌̊ | ◌̋ | ◌̌ | ◌̍ | ◌̎ | ◌̏ |
U+031x | ◌̐ | ◌̑ | ◌̒ | ◌̓ | ◌̔ | ◌̕ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌̜ | ◌̝ | ◌̞ | ◌̟ |
U+032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌̧ | ◌̨ | ◌̩ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U+033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌̶ | ◌̷ | ◌̸ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U+034x | ◌̀ | ◌́ | ◌͂ | ◌̓ | ◌̈́ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U+035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜◌ | ◌͝◌ | ◌͞◌ | ◌͟◌ |
U+036x | ◌͠◌ | ◌͡◌ | ◌͢◌ | ◌ͣ | ◌ͤ | ◌ͥ | ◌ͦ | ◌ͧ | ◌ͨ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ͬ | ◌ͭ | ◌ͮ | ◌ͯ |
注释
|
码点U+0346–034A为国际音标符号:
- U+034B ͋ :鼻腔泄气
- U+034C ͌ :腭咽擦音
- U+034D ͍ :唇部伸展
- U+034E ͎ :哨音
组合附加符号扩展 Combining Diacritical Marks Extended[1][2] Unicode Consortium 官方码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1ABx | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U+1ACx | ◌ᫀ | ᫁ | ᫂ | ᫃ | ᫄ | ᫅ | ᫆ | ᫇ | ᫈ | ᫉ | ᫊ | ᫋ | ᫌ | ᫎ | ᫎ | |
U+1ADx | ||||||||||||||||
U+1AEx | ||||||||||||||||
U+1AFx | ||||||||||||||||
注释 |
组合附加符号补充 Combining Diacritical Marks Supplement[1][2] Unicode Consortium 官方码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1DCx | ◌᷀ | ◌᷁ | ◌᷂ | ◌᷃ | ◌᷄ | ◌᷅ | ◌᷆ | ◌᷇ | ◌᷈ | ◌᷉ | ◌᷊ | ◌᷋ | ◌᷌ | ◌᷍ | ◌᷎ | ◌᷏ |
U+1DDx | ◌᷐ | ◌᷑ | ◌᷒ | ◌ᷓ | ◌ᷔ | ◌ᷕ | ◌ᷖ | ◌ᷗ | ◌ᷘ | ◌ᷙ | ◌ᷚ | ◌ᷛ | ◌ᷜ | ◌ᷝ | ◌ᷞ | ◌ᷟ |
U+1DEx | ◌ᷠ | ◌ᷡ | ◌ᷢ | ◌ᷣ | ◌ᷤ | ◌ᷥ | ◌ᷦ | ◌ᷧ | ◌ᷨ | ◌ᷩ | ◌ᷪ | ◌ᷫ | ◌ᷬ | ◌ᷭ | ◌ᷮ | ◌ᷯ |
U+1DFx | ◌ᷰ | ◌ᷱ | ◌ᷲ | ◌ᷳ | ◌ᷴ | ◌᷵ | ◌᷶ | ◌᷷ | ◌᷸ | ◌᷹ | ᷺ | ◌᷻ | ◌᷼ | ◌᷽ | ◌᷾ | ◌᷿ |
注释 |
符号用组合附加符号 Combining Diacritical Marks for Symbols[1][2] Unicode Consortium 官方码表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+20Dx | ◌⃐ | ◌⃑ | ◌⃒ | ◌⃓ | ◌⃔ | ◌⃕ | ◌⃖ | ◌⃗ | ◌⃘ | ◌⃙ | ◌⃚ | ◌⃛ | ◌⃜ | ◌⃝ | ◌⃞ | ◌⃟ |
U+20Ex | ◌⃠ | ◌⃡ | ◌⃢ | ◌⃣ | ◌⃤ | ◌⃥ | ◌⃦ | ◌⃧ | ◌⃨ | ◌⃩ | ◌⃪ | ◌⃫ | ◌⃬ | ◌⃭ | ◌⃮ | ◌⃯ |
U+20Fx | ◌⃰ | |||||||||||||||
注释 |
组合半符号 Combining Half Marks[1] Unicode Consortium 官方码表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+FE2x | ◌︠ | ◌︡ | ◌︢ | ◌︣ | ◌︤ | ◌︥ | ◌︦ | ◌︧ | ◌︨ | ◌︩ | ◌︪ | ◌︫ | ◌︬ | ◌︭ | ◌︮ | ◌︯ |
注释
|
注释
编辑- ^ Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
- ^ 例如,当在做windows-1258和越南资讯交换标准代码之间的转换时,前者使用组合字符而后者使用大量预组字符。转换器若只是单纯地与统一码做转换,则会导致混乱。
- ^ Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
- ^ Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
- ^ 5.0 5.1 5.2 5.3 Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
参见
编辑外部链接
编辑- Combining diacritics chart (页面存档备份,存于互联网档案馆)(Adobe PDF格式)
- Combining diacritics supplement chart (页面存档备份,存于互联网档案馆)(Adobe PDF格式)
- Combining marks (页面存档备份,存于互联网档案馆) 测试组合与预组字母
- Alan Wood的Unicode相关资源 (页面存档备份,存于互联网档案馆)
- DecodeUnicode.org 组合用附加符号参考资料 (页面存档备份,存于互联网档案馆)