中日韩兼容表意文字

中日韩兼容表意文字区(英语:CJK Compatibility Ideographs)收录的,是指中日韩越统一表意文字中因为“原规格分离原则”未与正式字集(包括扩展A、B、C、D区)的字统一的字。

中日韩兼容表意文字
CJK Compatibility Ideographs
范围U+F900..U+FAFF
(512个码位)
平面基本多文种平面BMP
文字汉字
已分配472个码位
未分配40个保留码位
来源标准KS X 1001
Big5
IBM 32英语Code page 932 (IBM)
JIS X 0213英语JIS X 0213
ARIB STD-B24
KPS 10721-2000
统一码版本历史
1.0.1302 (+302)
3.2361 (+59)
4.1467 (+106)
5.2470 (+3)
6.1472 (+2)
注释[1][2]

有些字只是同一字在不同地区的写法,理应统一,但因为原规格分离原则而分开编码。以下标准均有字形非常接近但编码上分离的字,为实现与这些标准的互换性而创立此区。

  • 韩国KS X 1001(U+F900-U+FA0B,268个字;多个字和正式字集区的字写法相同,但因读音不同而于原字集分开编码)
  • 台湾Big5CNS 11643(U+FA0C-U+FA0D,2个于原字集重复了的字)
  • 日本IBM 32CP932变种;U+FA0E-U+FA2D,32个字)
  • 韩国KS X 1001(U+FA2E-U+FA2F,2个字)
  • 日本JIS X 0213(U+FA30-U+FA6A,59个字)
  • ARIB STD-B24(U+FA6B-U+FA6D,3个字)
  • 朝鲜KPS 10721-2000(U+FA70-U+FAD9,106个字)

此区含有多个Unicode表意文字变体数据库(Unicode Ideographic Variation DatabaseIVD)中注册的变体字。[3][4]

中日韩兼容表意文字
CJK Compatibility Ideographs[1][2]
Unicode 联盟官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+F90x
U+F91x
U+F92x
U+F93x 錄
U+F94x
U+F95x
U+F96x
U+F97x 勵
U+F98x
U+F99x
U+F9Ax
U+F9Bx 樂
U+F9Cx
U+F9Dx
U+F9Ex
U+F9Fx 刺
U+FA0x
U+FA1x
U+FA2x
U+FA3x 憎
U+FA4x
U+FA5x
U+FA6x
U+FA7x 奔
U+FA8x
U+FA9x
U+FAAx
U+FABx 謹
U+FACx
U+FADx
U+FAEx
U+FAFx
注释
1.^ 依据 Unicode 13.0
2.^ 灰色区域指示未被分配的码点

参考文献 编辑

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
  3. ^ Ideographic Variation Database. Unicode Consortium. [2016-01-22]. (原始内容存档于2016-01-20). 
  4. ^ UTS #37, Unicode Ideographic Variation Database. Unicode Consortium. [2016-01-22]. (原始内容存档于2017-09-21).