中日韩符号和标点

中日韩符号和标点是一个位于基本多文种平面的Unicode区块,包含了用于汉语、日语和韩语的符号和标点。本区块虽然名为“符号和标点”,但也包含了一个汉字“〇”(U+3007)。

中日韩符号和标点
CJK Symbols and Punctuation
范围U+3000..U+303F
(64个码位)
平面基本多文种平面BMP
文字汉字(15个)
谚文(2个)
通用(43个)
继承(4个)
已分配64个码位
未分配0个保留码位
统一码版本历史
1.0.056 (+56)
1.0.156 (+0)
1.157 (+1)
3.061 (+4)
3.264 (+3)
注释[1][2][3]

区块 编辑

中日韩符号和标点
CJK Symbols and Punctuation
[1]
Unicode 联盟官方码表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+300x ID
 SP 
U+301x
U+302x
U+303x  〾 
Notes
1.^ 依据 Unicode 13.0

变体选择符 编辑

本区块包含部分标点位置的变体选择符[4][5] 其中使用了 U+FE00 VARIATION SELECTOR-1 (VS01) 及 U+FE01 VARIATION SELECTOR-2 (VS02):

标点符号位置变体
U+ 3001 3002 位置
基本字符
基本字符 + VS01 、︀ 。︀ 左下角
基本字符 + VS02 、︁ 。︁ 置中

汉字“〇” 编辑

〇是汉字,本应与其他汉字一样置于汉字区,但却被置于本区块,码位为U+3007。这一做法导致检索〇字时连带检索出数字0,使用上极为不便。许多程序把汉字区外的字符都认为不是汉字,这会导致程序无法处理〇字。

绘文字 编辑

本区块含有2个绘文字:U+3030 和 U+303D。[6][7]

此区块有4个标准化变体,为2个基本字符指定显示样式:采用U+FE0F VARIATION SELECTOR-16(VS16)以绘文字显示,或采用U+FE0E VARIATION SELECTOR-15(VS15)以文本显示,基本字符默认为文本显示。[8]

绘文字标准化变体
U+ 3030 303D
基本字符
基本字符+VS15文本 〰︎ 〽︎
基本字符+VS16绘文字 〰️ 〽️

历史 编辑

U+3004于Unicode 1.0是形状类似“仝”的日本“同上符号”;于Unicode 1.0.1为了兼容ISO 10646,与中日韩统一表意文字 U+4EDD 的“仝”字合并了,并由原位于 U+32FF(中日韩带圈字符及月份)的日本工业标准(〄)标志取代[9]

以下Unicode文档记录了定义本区块中特定字符的目的与过程:

参考文献 编辑

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始内容存档 (PDF)于2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2018-12-25). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2018-12-25). 
  4. ^ Lunde, Ken. L2/17-436: Proposal to add standardized variation sequences for fullwidth East Asian punctuation (PDF). 2018-01-21 [2021-02-24]. (原始内容存档 (PDF)于2020-01-31). 
  5. ^ Unicode Character Database: Standardized Variation Sequences. The Unicode Consortium. [2021-02-24]. (原始内容存档于2021-02-09). 
  6. ^ UTR #51: Unicode Emoji. Unicode Consortium. 2017-05-18 [2018-03-20]. (原始内容存档于2019-05-01). 
  7. ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2017-03-27 [2018-03-20]. (原始内容存档于2020-04-16). 
  8. ^ UTS #51 Emoji Variation Sequences. The Unicode Consortium. [永久失效链接]
  9. ^ 存档副本 (PDF). [2019-03-22]. (原始内容存档 (PDF)于2016-07-02).