泰文 (Unicode区段)

泰文是一个位于基本多文种平面的Unicode区块,包含了可以用于书写泰语兰纳语巴利语泰文字符。本区块基于TIS 620-2533英语Thai Industrial Standard 620-2533制订。[4]

泰文
Thai
范围U+0E00..U+0E7F
(128个码位)
平面基本多文种平面BMP
文字泰文(86个)
通用(1个)
应用泰语
北部泰语
巴利语
已分配87个码位
未分配41个保留码位
来源标准TIS 620-2529 → TIS 620-2533英语Thai Industrial Standard 620-2533
统一码版本历史
1.0.092 (+92)
1.0.187 (-5)
码表
点击此处
注释:在与ISO 10646统一的过程中,1.0.1版本的泰文区块删除了5个字符。[1][2][3]

区块 编辑

泰文
Thai[1][2]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0E0x
U+0E1x
U+0E2x
U+0E3x ฿
U+0E4x
U+0E5x
U+0E6x
U+0E7x
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域表示未分配的码位

历史 编辑

下列与Unicode相关的文档记录了在泰文区块中定义特定字符的目的和过程:

版本 最终码位[a] 码位数 L2英语International Committee for Information Technology Standards ID WG2英语ISO/IEC JTC 1/SC 2 ID 文档
1.0.0 U+0E01..0E3A,
0E3F..0E5B
87 UTC/1991-058 Whistler, Ken, Thai, Lao 
UTC/1991-048B Whistler, Ken, Thai, Lao, Draft Minutes from the UTC meeting #46 day 2, 3/27 at Apple, 1991-03-27 
UTC/1992-xxx Freytag, Asmus, B. Indic SC, Unconfirmed minutes for UTC Meeting #52, May 8, 1992 at Xerox, 1992-05-12 
L2/02-017 Whistler, Ken, Character Properties for avagrahas, etc., 2002-01-14 
  1. ^ 提案中建议的码位和字符名称可能与最终结果不同。

参考资料 编辑

  1. ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2016-07-09]. (原始内容存档 (PDF)于2016-07-02). 
  2. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25). 
  3. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
  4. ^ Chapter 16: Southeast Asia (PDF). The Unicode Standard: Version 14.0 – Core Specification. The Unicode Consortium. 2021-09-14 [2022-08-27]. (原始内容存档 (PDF)于2021-10-26).