中日韓相容表意文字

中日韓相容表意文字區(英語:CJK Compatibility Ideographs)收錄的,是指中日韓越統一表意文字中因為「原規格分離原則」未與正式字集(包括擴展A、B、C、D區)的字統一的字。

中日韓相容表意文字
CJK Compatibility Ideographs
範圍U+F900..U+FAFF
(512個碼位)
平面基本多文種平面BMP
文字漢字
已分配472個碼位
未分配40個保留碼位
來源標準KS X 1001
Big5
IBM 32英語Code page 932 (IBM)
JIS X 0213英語JIS X 0213
ARIB STD-B24
KPS 10721-2000
統一碼版本歷史
1.0.1302 (+302)
3.2361 (+59)
4.1467 (+106)
5.2470 (+3)
6.1472 (+2)
註釋[1][2]

有些字只是同一字在不同地區的寫法,理應統一,但因為原規格分離原則而分開編碼。以下標準均有字形非常接近但編碼上分離的字,為實現與這些標準的互換性而創立此區。

  • 南韓KS X 1001(U+F900-U+FA0B,268個字;多個字和正式字集區的字寫法相同,但因讀音不同而於原字集分開編碼)
  • 台灣Big5CNS 11643(U+FA0C-U+FA0D,2個於原字集重複了的字)
  • 日本IBM 32CP932變種;U+FA0E-U+FA2D,32個字)
  • 南韓KS X 1001(U+FA2E-U+FA2F,2個字)
  • 日本JIS X 0213(U+FA30-U+FA6A,59個字)
  • ARIB STD-B24(U+FA6B-U+FA6D,3個字)
  • 北韓KPS 10721-2000(U+FA70-U+FAD9,106個字)

此區含有多個Unicode表意文字變體資料庫(Unicode Ideographic Variation DatabaseIVD)中註冊的變體字。[3][4]

中日韓相容表意文字
CJK Compatibility Ideographs[1][2]
Unicode 聯盟官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+F90x
U+F91x
U+F92x
U+F93x 錄
U+F94x
U+F95x
U+F96x
U+F97x 勵
U+F98x
U+F99x
U+F9Ax
U+F9Bx 樂
U+F9Cx
U+F9Dx
U+F9Ex
U+F9Fx 刺
U+FA0x
U+FA1x
U+FA2x
U+FA3x 憎
U+FA4x
U+FA5x
U+FA6x
U+FA7x 奔
U+FA8x
U+FA9x
U+FAAx
U+FABx 謹
U+FACx
U+FADx
U+FAEx
U+FAFx
注釋
1.^ 依據 Unicode 13.0
2.^ 灰色區域指示未被分配的碼點

參考文獻

編輯
  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始內容存檔於2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始內容存檔於2016-06-29). 
  3. ^ Ideographic Variation Database. Unicode Consortium. [2016-01-22]. (原始內容存檔於2016-01-20). 
  4. ^ UTS #37, Unicode Ideographic Variation Database. Unicode Consortium. [2016-01-22]. (原始內容存檔於2017-09-21).