數字符號(又稱Unicode數字)表示一個數字的字符和字符序列。相同的阿拉伯文數字廣泛用於全球多種書寫系統,它們使用相同的表數語義,但是在不同的書寫系統之間,表示這些數字的字母存在較大差異。為了支持這些字母的差異,Unicode將這些數字編碼包含在許多書寫系統區塊之中。小數在23個獨立的塊中重複:在阿拉伯مرات باللغة العربية中出現2次。六個附加的塊還以富文本形式包含了數字,其主要是作為一個專門的數字使用的字母面板。除了各種阿拉伯語數字外,Unicode還包含了一下不常見的數字,例如:愛琴海數字、羅馬數字、計數杆數字、楔形文字數字和古希臘數字。

數字符號總是會涉及字形的合成,有限數量的字符組合成為其他的數字符號。例如在阿拉伯語數字中9-9-0序列組成了數字九百九十(990)。在羅馬數字中,相同的數字表示為數字符號Ⅹↀ或ⅩⅯ。它們是表示相同抽象數字的不同數字符號。數字符號的語義在其特定的組合中是不同的。阿拉伯語小數是位置-值的組合,而羅馬數字是符號-值的組合併且根據其組合增減。

數字符號的數字屬性

編輯

按照在文本使用的數字屬性分組,Unicode有四個數值類型值。首先是「非數字(not a number)」類型。其次是十進制底數數字符號,通常用於西式數字(普通0-9),也可以是非十進制系統的數字,如羅馬數字,和經過排版的十進制數,如環繞數字。

數字類型(Unicode字符屬性)
數字類型 代碼 有數字值 示例 備註
非數字 None

A X(拉丁與) α ! [ § À Д μ に 曉 와

數字值="NaN"
十進制數字 De

0 1 9 ६(梵文字母6) ೬(坎那達語6) 𝟨(數學符號,無襯線字體)

直接數字(十進制底數)。對應兩種方式,通用類型=Nd
十進制表意文字 Di
  • ¹(上標) ① ⒈(有句號的數字)
十進制,但經過排版
數字 Nu
  • ¾ ௰(泰米爾語數字十) Ⅹ(羅馬數字符號) 六(漢數字6) 壹(漢語,用於會計時的值1)
數字值,但並非十進制底數

十六進制數

編輯

Unicode的十六進制數並非單獨字符,而是使用現有的字母和數字。這些字符的字符屬性標為Hex_digit=Yes,某些字符還標記了ASCII_Hex_digit=Yes。

標記了Hex_Digit=Yes的Unicode字符
0123456789ABCDEF 基本拉丁文、大寫 同時ASCII_Hex_Digit=Yes
0123456789abcdef 基本拉丁文、小寫 同時ASCII_Hex_Digit=Yes
0123456789ABCDEF 全形形式、大寫
0123456789abcdef 全形形式、小寫

不同文字的數字符號

編輯

阿拉伯數字

編輯

小數

編輯

十進制小數

編輯

無理數、集合和其他常量的字符

編輯

富文本和其他兼容數字符號

編輯

中日韓花碼數字符號numerals

編輯

Unicode中的花碼數字符號

編輯

日語和韓語數字符號

編輯

古希臘數字

編輯

羅馬數字

編輯

算籌

編輯

Unicode 5.0 開始,在多文種補充平面中增加了一個區塊用於算籌數字。其包含九個「水平向」數字(U+1D360 到 U+1D368)和九個「垂直向」數字(U+1D369 到 U+1D371),水平向數字用於奇數次冪的位置,而垂直向數字用於偶數次冪的位置。而零則用 U+3007 (〇, ideographic number zero) 來表示,負數符號則使用 U+20E5 (combining reverse solidus overlay)。[1]

算籌數字
Counting Rod Numerals[1][2]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D36x 𝍠 𝍡 𝍢 𝍣 𝍤 𝍥 𝍦 𝍧 𝍨 𝍩 𝍪 𝍫 𝍬 𝍭 𝍮 𝍯
U+1D37x 𝍰 𝍱 𝍲 𝍳 𝍴 𝍵 𝍶 𝍷 𝍸
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未分配的碼位

引用

編輯
  1. ^ The Unicode Standard, Version 5.0 – Electronic edition (PDF), Unicode, Inc.: 499–500, 2006 [2013-02-18], (原始內容存檔 (PDF)於2023-08-03)