量化 (訊號處理)

量化在數碼訊號處理領域是指將訊號的連續取值（或者大量可能的離散取值）近似為有限多個（或較少的）離散值的過程。量化主要應用於從連續訊號到數碼訊號的轉換中。連續訊號經過採樣成為離散訊號，離散訊號經過量化即成為數碼訊號。注意離散訊號並不需要經過採樣的過程。訊號的採樣和量化通常都是由ADC實現的。

例如CD音訊訊號就是按照44100Hz的頻率採樣，按16位元量化為有着65536（= $2^{16}$ ）個可能取值的數碼訊號。

量化就是將模擬聲音的波形轉換為數碼，表示採樣值的位元數決定了量化的精度。量化的過程是先將整個振幅劃分成有限個小振幅（量化階距）的集合，把落入某個階距內的樣值歸為一類，並賦予相同的量化值。

數學描述

最簡單最易懂的量化是純量（有別於多維向量）量化，開始純量量化之前先要給出輸入數據。通常，一個純量量化操作可以給出下面的描述

Q(x)=g(\lfloor f(x)\rfloor )

其中

$x$ 是實數，
$\lfloor x\rfloor$ 是下取整函數，生成整數 $i=\lfloor f(x)\rfloor$
$f(x)$ 和 $g(i)$ 是任意的實值函數。

整數 $i$ 是表示的數值，它通常被儲存或者傳輸，然後在後來需要解釋的時候使用 $g(i)$ 進行最終的解釋重建。整數 $i$ 有時也稱作量化指數。

在電腦或者其它應用，一個已知的量化方法均勻量化。在均勻量化方法裏共有兩個變數，叫mid-rise和mid-tread。

如果 $x$ 是一個－1到1之間的數，一個mid-rise uniform量化操作，可以用"M"bit來表示量化的精度。

Q(x)={\frac {\left\lfloor 2^{M-1}x\right\rfloor +0.5}{2^{M-1}}}

.

在這個例子中 $f(x)$ 和 $g(i)$ 運算子都是乘以比例因子（其中一個是另外一個的逆），並且在g（i）中帶有一個偏移量以使得每個量化表示都位於輸入區域的中間位置。 $2^{-(M-1)}$ 經常稱為量化步長。按照這個量化定律，假定在整個量化步長上量化雜訊大致是均勻分佈的，並且假定量化的輸入訊號 $x$ 在整個-1到1的區間大致均勻分佈，量化的訊號雜訊比（SNR）可以用下面的公式計算，

{\frac {S}{N_{q}}}\approx 20\log _{10}(2^{M})=6.0206M\ \operatorname {dB}

.

根據這個等式，人們常說SNR大約是每位6 dB。

在mid-tread一致量化中，偏移0.5將加在下取整函數內部而不是外部。

有時候，mid-rise量化使用時不加偏移0.5。這將訊號與雜訊比減小了大約6.02 dB，但是當步距小的時候為了簡化這是可接受的。

在數碼電話系統中，兩個流行的量化機制是'A-law'（在歐洲佔據主導地位）和'μ-law'（在北美和日本佔據主導地位）。這些機制將離散的模擬數值對映到8位元尺度，在小值的時候近似線性隨着振幅增長按照對數增加。由於人耳對於音量的感知近似對數曲線，這就使用一定的位數在可聽見的聲音強度範圍提供了更高的訊號雜訊比。

忽略熵約束：Lloyd–Max量化

在上面的陳述中，若令 $\lambda$ 等於 0，從而忽略掉位元速率約束，或等價地假設要用定長碼（FLC）而非用變長碼（英語：variable-length code）（或其他熵編碼法，如算術編碼在率失真上就比定長碼好）來表示量化數據，這個最佳化問題就簡化為了只需最小化失真 $D$ 的問題了。

$M$ 級量化器產生的索引可以用 $R=\lceil \log _{2}M\rceil$ 位元/符號的定長碼。例如當 $M=$ 256 階時，定長碼的位元速率 $R$ 為 8 位元/符號。由於這個原因，這樣的量化器有時稱作8位元量化器。不過使用定長碼消除了壓縮改進，但可以通過更好的熵編碼來改善。

假設 $M$ 階定長碼，率失真最小化問題可以簡化為失真最小化問題。簡化的問題可以陳述為：給定一個概率密度函數為 $f(x)$ 的信源 $X$ ，並約束量化器必須僅使用 $M$ 個分類區域，求得決策邊界 $\{b_{k}\}_{k=1}^{M-1}$ 與重建層級 $\{y_{k}\}_{k=1}^{M}$ 來最小化得到的失真

D=E[(x-Q(x))^{2}]=\int _{-\infty }^{\infty }(x-Q(x))^{2}f(x)dx=\sum _{k=1}^{M}\int _{b_{k-1}}^{b_{k}}(x-y_{k})^{2}f(x)dx=\sum _{k=1}^{M}d_{k}

.

對上述問題求最佳解得到的量化器有時叫做MMSQE（最小均方量化誤差）解，而得到的概率密度函數最佳化的（非均勻）量化器叫做Lloyd–Max量化器，是用獨立發現迭代方法^[1]^[2]^[3]從 ${\partial D/\partial b_{k}}=0$ 和 ${\partial D/\partial y_{k}}=0$ 求解兩組聯立方程的兩個人來命名的，如下：

{\partial D \over \partial b_{k}}=0\Rightarrow b_{k}={y_{k}+y_{k+1} \over 2}

,

會將閾值置於每對重建值的中點，而

{\partial D \over \partial y_{k}}=0\Rightarrow y_{k}={\int _{b_{k-1}}^{b_{k}}xf(x)dx \over \int _{b_{k-1}}^{b_{k}}f(x)dx}={\frac {1}{p_{k}}}\int _{b_{k-1}}^{b_{k}}xf(x)dx

會讓重建值位於其相關分類區間的質心（條件期望值）。

Lloyd方法I演算法（英語：Lloyd's algorithm），最初於1957提出，並可以直接推廣到用於向量數據。這個推廣會得到Linde–Buzo–Gray（LBG）（英語：Linde–Buzo–Gray algorithm）或K-平均分類器最佳化方法。此外，此方法還可以進一步推廣到對向量數據包含一個熵約束。^[4]

量化與數據壓縮

量化在有損數據壓縮中起着相當重要的作用。很多情況下，量化可以被當作將有損數據壓縮同無失真數據壓縮相區別的標誌之一。量化的目的通常是為了減少數據量。一些壓縮演算法，例如MP3和Vorbis，以有選擇地丟棄部分數據作為壓縮的一種方法，這種手段可以被認為是量化的過程也可以被看作是一種失真壓縮的形式。

JPEG是一種利用了量化的圖像失真壓縮。JPEG的編碼過程對原始的圖像數據作離散餘弦轉換，然後對轉換結果進行量化並作熵編碼。通過量化可以降低轉換值的精度，從而減少圖像的數據量。當然，精度的損失意味着圖像質素的下降。然而圖像的質素可以通過量化位數的選擇加以控制。例如，JPEG在每像素3位元的精度下得到的圖像質素還讓人可以接受的，相對於PCM抽樣得到的每個像素24位元的原始圖像來說，數據量大大下降了。

現代壓縮技術通常以量化輸出的資訊熵，而不是輸出值集合的大小度量資訊量的多少。

自然界中的量子化

從最基本的意義上來說，所有的物理量都是量子化的，這是量子力學的結論。為了數學上的明晰性，在宏觀的尺度上可以將量子的性質忽略，因此訊號可以表示為連續的形式。

在實際應用中，這種內在的量子或量化的性質並不需要考慮。首先，量子效應會被訊號的雜訊淹沒，因為任何觀察物件在實際系統中總會伴隨有其他物理現象。其次，測量儀器不可能絕對精確，被測的訊號必然會被測量雜訊污染。

量化誤差

量化誤差是指在量化過程引起的誤差，表現為量化結果和被量化模擬量之間存在差值。這種差值在輸出端體現為引入了量化雜訊。

參考文獻

^ Robert M. Gray and David L. Neuhoff, "Quantization", IEEE Transactions on Information Theory, Vol. IT-44, No. 6, pp. 2325–2383, Oct. 1998. doi:10.1109/18.720541
^ Stuart P. Lloyd, "Least Squares Quantization in PCM", IEEE Transactions on Information Theory（英語：IEEE Transactions on Information Theory）, Vol. IT-28, pp. 129–137, No. 2, March 1982 doi:10.1109/TIT.1982.1056489 (work documented in a manuscript circulated for comments at Bell Laboratories with a department log date of 31 July 1957 and also presented at the 1957 meeting of the Institute of Mathematical Statistics, although not formally published until 1982).
^ Joel Max, "Quantizing for Minimum Distortion", IRE Transactions on Information Theory（英語：IEEE Transactions on Information Theory）, Vol. IT-6, pp. 7–12, March 1960. doi:10.1109/TIT.1960.1057548
^ Philip A. Chou, Tom Lookabaugh, and Robert M. Gray（英語：Robert M. Gray）, "Entropy-Constrained Vector Quantization", IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-37, No. 1, Jan. 1989. doi:10.1109/29.17498

外部連結

Paper on mathematical theory and analysis of quantization （頁面存檔備份，存於互聯網檔案館）
Quantization threads in Comp.DSP （頁面存檔備份，存於互聯網檔案館）

[GrayNeuhoff-1] Robert M. Gray and David L. Neuhoff, "Quantization", IEEE Transactions on Information Theory, Vol. IT-44, No. 6, pp. 2325–2383, Oct. 1998. doi:10.1109/18.720541

[2] Stuart P. Lloyd, "Least Squares Quantization in PCM", IEEE Transactions on Information Theory（英語：IEEE Transactions on Information Theory）, Vol. IT-28, pp. 129–137, No. 2, March 1982 doi:10.1109/TIT.1982.1056489 (work documented in a manuscript circulated for comments at Bell Laboratories with a department log date of 31 July 1957 and also presented at the 1957 meeting of the Institute of Mathematical Statistics, although not formally published until 1982).

[3] Joel Max, "Quantizing for Minimum Distortion", IRE Transactions on Information Theory（英語：IEEE Transactions on Information Theory）, Vol. IT-6, pp. 7–12, March 1960. doi:10.1109/TIT.1960.1057548

[ChouLookabaughGray-4] Philip A. Chou, Tom Lookabaugh, and Robert M. Gray（英語：Robert M. Gray）, "Entropy-Constrained Vector Quantization", IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. ASSP-37, No. 1, Jan. 1989. doi:10.1109/29.17498

[1]

[2]

[3]

[4]