分類別變數

分類別變數或稱類別變數是統計學中的有限多個取值的變數，其每個值對應於定性屬性（英語：qualitative property）的特定分組（group）或定類類別（英語：nominal category）。^[1]在電腦科學或一些數學分支中，分類別變數對應於列舉法或列舉類型。通常，分類別變數的每個值成為一個level。其機率分布稱為分類分布（英語：categorical distribution）。

分類資料（Categorical data）是一種統計資料類型（英語：Statistical data type），由分類別變數及其資料組成。具體說，分類資料可從定性資料計數匯總或生成列聯表，或從定量資料按照給定的間隔分組得到。

分類別變數如果只可能有兩個取值，被稱為二值變數（英語：binary variable）（binary variable或dichotomous variable），如伯努利變數。分類別變數如果取多於2個值，成為多值變數（polytomous variables）。

分類別變數的例子

血型： A, B, AB 或 O.
一個國家的合法政黨
岩石類型：火成岩, 沉積岩, 變質岩.

表示法

為使統計處理簡便，分類別變數可以賦以數值索引值，如從1到K，對於K值分類別變數。這種表示可以用於相等比較、作為集合的元素做集合運算。

分類別變數的集合的集中趨勢可用眾數表示，但不能定義均值或中位數。

可能值的數量

分類的隨機變數用統計學的分類分布（英語：categorical distribution），允許任意K值分類別變數用每個值的單獨的機率來表示（即K值的離散機率分布）。這種多值分類別變數常用多項分布來分析。分類結果的迴歸分析是通過多項邏輯迴歸、multinomial probit（英語：multinomial probit）或相關的discrete choice（英語：discrete choice）模型。

分類別變數也可以只有兩種可能結果，稱為二值變數或伯努利變數。由於重要性，這種情形常被視作獨立分布（伯努利分布）、獨立的迴歸模型（邏輯迴歸、probit regression（英語：probit regression）等）。反之，分類別變數常被用於指大於等於3種結果，或稱「多值變數」（multi-way variable）。

參考文獻

^ Yates, Daniel S.; Moore, David S; Starnes, Daren S. The Practice of Statistics 2nd. New York: Freeman. 2003 [2014-09-28]. ISBN 978-0-7167-4773-4. （原始內容存檔於2005-02-09）.

拓展閱讀

Andersen, Erling B. 1980. Discrete Statistical Models with Social Science Applications. North Holland, 1980.
Bishop, Y. M. M.; Fienberg, S. E.; Holland, P. W. Discrete Multivariate Analysis: Theory and Practice . MIT Press. 1975. ISBN 978-0-262-02113-5. MR 0381130.
Christensen, Ronald. Log-linear models and logistic regression. Springer Texts in Statistics Second. New York: Springer-Verlag. 1997: xvi+483. ISBN 0-387-98247-7. MR 1633357.
Friendly, Michael. Visualizing categorical data （頁面存檔備份，存於網際網路檔案館）. SAS Institute, 2000.
Lauritzen, Steffen L. Lectures on Contingency Tables (PDF) updated electronic version of the (University of Aalborg) 3rd (1989). 2002 [1979] [2020-11-20]. （原始內容存檔 (PDF)於2020-04-30）.
NIST/SEMATEK (2008) Handbook of Statistical Methods （頁面存檔備份，存於網際網路檔案館）

[yates-1] Yates, Daniel S.; Moore, David S; Starnes, Daren S. The Practice of Statistics 2nd. New York: Freeman. 2003 [2014-09-28]. ISBN 978-0-7167-4773-4. （原始內容存檔於2005-02-09）.

[1]