半形及全形字符 (Unicode区段)

半形及全形字符Unicode 基本多文种平面内的最后第二个区段,范围包括 U+FF00..U+FFEF。本区段包含全形和半形字符以便可以无损从旧编码系统转换至 Unicode。该区段于 Unicode 1.0 的旧称为 半形及全形变体(Halfwidth and Fullwidth Variants)。[4]

半形及全形字符
Halfwidth and Fullwidth Forms
范围U+FF00..U+FFEF
(240个码位)
平面基本多文种平面BMP
文字谚文(52 个字符)
片假名(55 个字符)
拉丁文字(52 个字符)
普通(66 char.)
符号系列异体宽度字符
已分配225个码位
未分配15个保留码位
统一码版本历史
1.0.0216 (+216)
1.0.1223 (+7)
3.2225 (+2)
注释[1][2][3]

U+FF01..U+FF5E 编码了 ASCII 内 21 至 7E 的全形版本。U+FF00 未对应 ASCII 20 (空格)字符,该字符已经由 U+3000   IDEOGRAPHIC SPACE 表意空格取代。

U+FF65..U+FF9F 编码了JIS X 0201 内的半形片假名——参见半形假名

U+FFA0..U+FFDC 编码了谚文KS C 5601 1974年版谚文兼容字母。其对应的字符用于 IBM 的韩文编码页 933,其中包括 Shift In 和 Shift Out 的字符以对应双字节编码。[5]基于双字节编码可能包括兼容字母,本区段包含了部分半形变体以便可以无损从 KS C 5601 转码至 Unicode。[6][7]

U+FFE0..U+FFEE 编码了全形及半形符号。

码表

编辑
半形及全形字符
Halfwidth and Fullwidth Forms
[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FF0x
U+FF1x
U+FF2x
U+FF3x _
U+FF4x
U+FF5x
U+FF6x
U+FF7x ソ
U+FF8x
U+FF9x
U+FFAx  HW 
HF
U+FFBx
U+FFCx
U+FFDx
U+FFEx
注解
1.^ 依据 Unicode 13.0
2.^ 灰色区域指未分配码位

异体字选择器

编辑

本区段包含部分标点位置的异体字选择器[8][9] 其中使用了 U+FE00 VARIATION SELECTOR-1 (VS01) 及 U+FE01 VARIATION SELECTOR-2 (VS02):

标点符号位置变体
U+ FF01 FF0C FF0E FF1A FF1B FF1F 位置
基本字符
基本字符 + VS01 !︀ ,︀ .︀ :︀ ;︀ ?︀ 左下角
基本字符 + VS02 !︁ ,︁ .︁ :︁ ;︁ ?︁ 置中

该规范也定义了 U+FF10 全宽数字〇另加短斜线:U+FE00 VS1(0︀)。[10][9]

历史

编辑

以下的Unicode相关档案记录了本区域中出现之字符的提议及定稿。

另见

编辑

参见

编辑
  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始内容存档 (PDF)于2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-07-10). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
  4. ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2021-02-04]. (原始内容存档 (PDF)于2021-02-11). 
  5. ^ ICU Demonstration - Converter Explorer. demo.icu-project.org. [7 May 2018]. 
  6. ^ 存档副本. [2021-02-04]. (原始内容存档于2021-02-16). 
  7. ^ 存档副本. [2021-02-04]. (原始内容存档于2021-01-16). 
  8. ^ Lunde, Ken. L2/17-436: Proposal to add standardized variation sequences for fullwidth East Asian punctuation (PDF). 2018-01-21 [2021-02-04]. (原始内容存档 (PDF)于2020-01-31). 
  9. ^ 9.0 9.1 Unicode Character Database: Standardized Variation Sequences. The Unicode Consortium. [2021-02-04]. (原始内容存档于2021-02-09). 
  10. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray. L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set (PDF). 2015-10-30 [2021-02-04]. (原始内容存档 (PDF)于2016-10-21).