拉丁字母扩展-A
拉丁字母扩展-A是Unicode标准下的第二个Unicode区块。它包含了ISO/IEC 8859标准中的拉丁字母字符(但已编码于拉丁字母补充-1区块的Latin-1除外),以及ISO/IEC 6937标准中遗留的拉丁字母字符。
拉丁字母扩展-A Latin Extended-A | |
---|---|
范围 | U+0100..U+017F (128个码位) |
平面 | 基本多文种平面(BMP) |
文字 | 拉丁字母 |
应用 | |
已分配 | 128个码位 |
未分配 | 0个保留码位 1个废弃码位 |
统一码版本历史 | |
1.0.0 | 127 (+127) |
1.1 | 128 (+1) |
码表 | |
点击此处 | |
注释:[1][2] |
自1.0版本起,拉丁字母扩展-A区块就已存于Unicode标准中。在1.1版本与ISO 10646统一的过程中,U+017F ſ LATIN SMALL LETTER LONG S被加入本区块。[3]本区块在1.0版本的名称为欧洲拉丁字母(European Latin)。[4]
字符表
编辑下表列出拉丁字母扩展-A包含的所有字符:
|
子标题
编辑拉丁字母扩展-A只包含两个子标题:欧洲拉丁字母与废弃字母。[5]
欧洲拉丁字母
编辑欧洲拉丁字母子标题囊括了拉丁字母扩展-A区块中除了U+0149 ʼn LATIN SMALL LETTER N PRECEDED BY APOSTROPHE之外的所有字符。它包含了带有附加符号的变体大写和小写拉丁字母,大多数用于书写东欧语言。[6]
废弃字母
编辑废弃字母子标题仅包含U+0149,该字符的存在是为了兼容ISO/IEC 6937标准。[5]自5.2.0版本起该字符废弃[7],其注释为:“U+0149 LATIN SMALL LETTER N PRECEDED BY APOSTROPHE是为了南非语的使用而编码的。该字符已废弃,并强烈建议不使用。”在几乎所有的情况下,用撇号加上“n”来表示此字符更佳(’n)[6]。
字符数量
编辑下表展示本区段各子标题的字母数量。
子标题名称 | 字符数量 | 码位范围 |
---|---|---|
欧洲拉丁字母 | 63对欧洲拉丁字母,U+0149及U+017F ſ LATIN SMALL LETTER LONG S | U+0100..U+017F(包括U+0149) |
废弃字母 | U+0149 ʼn LATIN SMALL LETTER N PRECEDED BY APOSTROPHE | U+0149 |
区块
编辑拉丁字母扩展-A Latin Extended-A[1][2] Unicode Consortium 官方码表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+010x | Ā | ā | Ă | ă | Ą | ą | Ć | ć | Ĉ | ĉ | Ċ | ċ | Č | č | Ď | ď |
U+011x | Đ | đ | Ē | ē | Ĕ | ĕ | Ė | ė | Ę | ę | Ě | ě | Ĝ | ĝ | Ğ | ğ |
U+012x | Ġ | ġ | Ģ | ģ | Ĥ | ĥ | Ħ | ħ | Ĩ | ĩ | Ī | ī | Ĭ | ĭ | Į | į |
U+013x | İ | ı | IJ | ij | Ĵ | ĵ | Ķ | ķ | ĸ | Ĺ | ĺ | Ļ | ļ | Ľ | ľ | Ŀ |
U+014x | ŀ | Ł | ł | Ń | ń | Ņ | ņ | Ň | ň | ʼn | Ŋ | ŋ | Ō | ō | Ŏ | ŏ |
U+015x | Ő | ő | Œ | œ | Ŕ | ŕ | Ŗ | ŗ | Ř | ř | Ś | ś | Ŝ | ŝ | Ş | ş |
U+016x | Š | š | Ţ | ţ | Ť | ť | Ŧ | ŧ | Ũ | ũ | Ū | ū | Ŭ | ŭ | Ů | ů |
U+017x | Ű | ű | Ų | ų | Ŵ | ŵ | Ŷ | ŷ | Ÿ | Ź | ź | Ż | ż | Ž | ž | ſ |
注释 |
历史
编辑以下Unicode文档记录了定义本区块中特定字符的目的与过程:
版本 | 最终码位[a] | 码位数 | L2 ID | 文档 |
---|---|---|---|---|
1.0.0 | U+0100..017E | 127 | (待考) | |
L2/08-275 | Freytag, Asmus, Comments on the proposed deprecation of characters (public review item #122), 2008-07-31 | |||
L2/08-278 | Pentzlin, Karl, Comments on Public Review Issue #122, 2008-08-04 | |||
L2/08-287 | Davis, Mark, Public Review Issue #122: Proposal for Additional Deprecated Characters, 2008-08-04 | |||
L2/08-253R2 | Moore, Lisa, Consensus 116-C13, UTC #116 Minutes, 2008-08-19, Change the deprecated property by removing 0340, 0341, 17D3, and adding 0149, 0F77, 0F79, 17A4, 2329, 232A. | |||
L2/08-328 (html, xls (页面存档备份,存于互联网档案馆)) | Whistler, Ken, Spreadsheet of Deprecation and Discouragement, 2008-10-14 | |||
L2/10-268 | Priest, Lorna, Annotation additions resulting from encoding LATIN CAPITAL LETTER H WITH HOOK, 2010-07-29 | |||
1.1 | U+017F | 1 | (待考) | |
|
另见
编辑参考资料
编辑- ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25).
- ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29).
- ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.
- ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2022-05-17]. (原始内容 (PDF)存档于2021-02-11).
- ^ 5.0 5.1 Unicode 6.2 code charts (PDF). The Unicode Standard. [1 April 2013]. (原始内容 (PDF)存档于2018-07-04).
- ^ 6.0 6.1 The Unicode Standard Version 6.0 – Core Specification (PDF). The Unicode Consortium: 207–208. [2014-09-17]. (原始内容 (PDF)存档于2019-03-31).
- ^ Unicode Standard Annex #44 - Change History. www.unicode.org. [2014-09-17]. (原始内容存档于2022-05-25).