汉字字汇(英语:Ideographic repertoire),在中文信息处理领域中,是指“用汉字编码字符集或者类别指定的汉字集合”[1]

用汉字编码字符集指定的集合如:GB 2312GBKJIS 0208

用类别指定的集合如:简化字繁体字传承字异体字类推简化字略字外字

字汇本身不涉及编码的概念,只是表明“多少字”,“哪些字”。[1]例如:通常所称的简化汉字是指《简化字总表》中的简化汉字,总数为2235个。[1]GB 2312中的简体字对应的繁体字有两千多个。[1]GB 2312中的传承字有四千多个。[1]《中华大字典》收字四万八千多个。

参考

编辑
  1. ^ 1.0 1.1 1.2 1.3 1.4 计算机科学技术百科全书 清华大学出版社 277页[缺少ISBN]