用户:Mrhso2014/普及区
本页面有关 Wikipedia:Unicode扩展汉字。
在 ISO 10646,一个字符集,里面有 CJKV 统一表意文字,收录了喃字、简化字、繁体字等。Unicode 与其保持同步。
中日韩越统一表意文字也有扩展区,一些生僻字、类推简化在扩展区是有的,例如扩展 E 区就有“𬎆”。截至 2017 年,正式发布的扩展区就有兼容扩展、扩展 A 区、扩展 B 区、扩展 C 区、扩展 D 区、扩展 E 区、扩展 F 区。
目前仍然有很多汉字没有被收录进 Unicode,关于汉字的收录其实和 IRG 有关。
GB 18030 是一种特殊的 UTF,为了兼容 GB 2312 形成了诡异的排序。根据 Ishisashi 制作的 GB 18030 与 Unicode Code Point 的对应表,可以看出 GB 18030 的基本结构。
GB 18030 完全兼容 GB 2312,多数兼容 GBK。GB 18030 除了相对 GBK 映射到 PUA 的汉字映射有改变以及欧元的调整外,基本是兼容的。
GB 18030 的报批稿中同时有单字节和双字节欧元,在正式版删去。