半形及全形字元 (Unicode區段)

半形及全形字元Unicode 基本多文種平面內的最後第二個區段,範圍包括 U+FF00..U+FFEF。本區段包含全形和半形字元以便可以無失真從舊編碼系統轉換至 Unicode。該區段於 Unicode 1.0 的舊稱為 半形及全形變體(Halfwidth and Fullwidth Variants)。[4]

半形及全形字元
Halfwidth and Fullwidth Forms
範圍U+FF00..U+FFEF
(240個碼位)
平面基本多文種平面BMP
文字諺文(52 個字元)
片假名(55 個字元)
拉丁文字(52 個字元)
普通(66 char.)
符號系列異體寬度字元
已分配225個碼位
未分配15個保留碼位
統一碼版本歷史
1.0.0216 (+216)
1.0.1223 (+7)
3.2225 (+2)
註釋[1][2][3]

U+FF01..U+FF5E 編碼了 ASCII 內 21 至 7E 的全形版本。U+FF00 未對應 ASCII 20 (空格)字元,該字元已經由 U+3000   IDEOGRAPHIC SPACE 表意空格取代。

U+FF65..U+FF9F 編碼了JIS X 0201 內的半形片假名——參見半形假名

U+FFA0..U+FFDC 編碼了諺文KS C 5601 1974年版諺文相容字母。其對應的字元用於 IBM 的韓文編碼頁 933,其中包括 Shift In 和 Shift Out 的字元以對應雙位元組編碼。[5]基於雙位元組編碼可能包括相容字母,本區段包含了部分半形變體以便可以無失真從 KS C 5601 轉碼至 Unicode。[6][7]

U+FFE0..U+FFEE 編碼了全形及半形符號。

碼表

編輯
半形及全形字元
Halfwidth and Fullwidth Forms
[1][2]
Unicode 聯盟官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FF0x
U+FF1x
U+FF2x
U+FF3x _
U+FF4x
U+FF5x
U+FF6x
U+FF7x ソ
U+FF8x
U+FF9x
U+FFAx  HW 
HF
U+FFBx
U+FFCx
U+FFDx
U+FFEx
註解
1.^ 依據 Unicode 13.0
2.^ 灰色區域指未分配碼位

異體字選擇器

編輯

本區段包含部分標點位置的異體字選擇器[8][9] 其中使用了 U+FE00 VARIATION SELECTOR-1 (VS01) 及 U+FE01 VARIATION SELECTOR-2 (VS02):

標點符號位置變體
U+ FF01 FF0C FF0E FF1A FF1B FF1F 位置
基本字元
基本字元 + VS01 !︀ ,︀ .︀ :︀ ;︀ ?︀ 左下角
基本字元 + VS02 !︁ ,︁ .︁ :︁ ;︁ ?︁ 置中

該規範也定義了 U+FF10 全寬數字〇另加短斜線:U+FE00 VS1(0︀)。[10][9]

歷史

編輯

以下的Unicode相關檔案記錄了本區域中出現之字元的提議及定稿。

另見

編輯

參見

編輯
  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始內容存檔 (PDF)於2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始內容存檔於2016-07-10). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始內容存檔於2016-06-29). 
  4. ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2021-02-04]. (原始內容存檔 (PDF)於2021-02-11). 
  5. ^ ICU Demonstration - Converter Explorer. demo.icu-project.org. [7 May 2018]. 
  6. ^ 存档副本. [2021-02-04]. (原始內容存檔於2021-02-16). 
  7. ^ 存档副本. [2021-02-04]. (原始內容存檔於2021-01-16). 
  8. ^ Lunde, Ken. L2/17-436: Proposal to add standardized variation sequences for fullwidth East Asian punctuation (PDF). 2018-01-21 [2021-02-04]. (原始內容存檔 (PDF)於2020-01-31). 
  9. ^ 9.0 9.1 Unicode Character Database: Standardized Variation Sequences. The Unicode Consortium. [2021-02-04]. (原始內容存檔於2021-02-09). 
  10. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray. L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set (PDF). 2015-10-30 [2021-02-04]. (原始內容存檔 (PDF)於2016-10-21).