在數學分析 及應用中,「多維度變換」是用來分析訊號的二維或是多維的頻率成分。
其中一個常用的多維度變換就是傅立葉變換 ,是將一個訊號的表示式從時域/空域轉換到頻域。[ 1] 離散域的多維度傅立葉變換可表示成下列式子:
F
(
w
1
,
w
2
,
…
,
w
m
)
=
∑
n
1
=
−
∞
∞
∑
n
2
=
−
∞
∞
⋯
∑
n
m
=
−
∞
∞
f
(
n
1
,
n
2
,
…
,
n
m
)
e
−
j
w
1
n
1
−
j
w
2
n
2
⋯
−
j
w
m
n
m
{\displaystyle F(w_{1},w_{2},\dots ,w_{m})=\sum _{n_{1}=-\infty }^{\infty }\sum _{n_{2}=-\infty }^{\infty }\cdots \sum _{n_{m}=-\infty }^{\infty }f(n_{1},n_{2},\dots ,n_{m})e^{-jw_{1}n_{1}-jw_{2}n_{2}\cdots -jw_{m}n_{m}}}
其中F 代表多維度傅立葉變換,m 代表維度。將f 定義成多維度的離散域訊號,則逆多維度傅立葉變換為:
f
(
n
1
,
n
2
,
…
,
n
m
)
=
(
1
2
π
)
m
∫
−
π
π
⋯
∫
−
π
π
F
(
w
1
,
w
2
,
…
,
w
m
)
e
j
w
1
n
1
+
j
w
2
n
2
+
⋯
+
j
w
m
n
m
d
w
1
⋯
d
w
m
{\displaystyle f(n_{1},n_{2},\dots ,n_{m})=\left({\frac {1}{2\pi }}\right)^{m}\int _{-\pi }^{\pi }\cdots \int _{-\pi }^{\pi }F(w_{1},w_{2},\ldots ,w_{m})e^{jw_{1}n_{1}+jw_{2}n_{2}+\cdots +jw_{m}n_{m}}\,dw_{1}\cdots \,dw_{m}}
連續域的多維度傅立葉變換可表示成下列式子:[ 1]
F
(
Ω
1
,
Ω
2
,
…
,
Ω
m
)
=
∫
−
∞
∞
⋯
∫
−
∞
∞
f
(
t
1
,
t
2
,
…
,
t
m
)
e
−
j
Ω
1
t
1
−
j
Ω
2
t
2
⋯
−
j
Ω
m
t
m
d
t
1
⋯
d
t
m
{\displaystyle F(\Omega _{1},\Omega _{2},\ldots ,\Omega _{m})=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f(t_{1},t_{2},\ldots ,t_{m})e^{-j\Omega _{1}t_{1}-j\Omega _{2}t_{2}\cdots -j\Omega _{m}t_{m}}\,dt_{1}\cdots \,dt_{m}}
快速傅立葉變換 (FFT)是一種用來計算離散傅立葉變換(DFT)和其逆變換的快速演算法,快速傅立葉變換所得到的結果跟按照定義去算離散傅立葉變換的結果是一樣的,但唯一的差別是快速傅立葉變換的速度快很多。(在捨入誤差的存在下,很多快速傅立葉變換還比直接照定義算還更精準。)有很多種快速傅立葉變換,他們包含很廣泛的數學運算,從簡單的複數運算到數論和群論,詳情可以看快速傅立葉變換 。
多維度的離散傅立葉變換 是離散域傅立葉變換的簡單版本,其方法是在均勻間隔下的樣本頻率去估計其值。[ 2] N 1 × N 2 × ... N M 離散傅立葉變換如下式:
F
x
(
K
1
,
K
2
,
…
,
K
n
)
=
∑
n
1
=
0
N
1
−
1
⋯
∑
n
m
N
m
−
1
f
x
(
n
1
,
n
2
,
…
,
n
N
)
e
−
j
2
π
N
1
n
1
K
1
−
j
2
π
N
2
n
2
K
2
⋯
−
j
2
π
N
m
n
m
K
m
{\displaystyle Fx(K_{1},K_{2},\ldots ,K_{n})=\sum _{n_{1}=0}^{N_{1}-1}\cdots \sum _{n_{m}}^{N_{m}-1}fx(n_{1},n_{2},\ldots ,n_{N})e^{-j{\frac {2\pi }{N_{1}}}n_{1}K_{1}-j{\frac {2\pi }{N_{2}}}n_{2}K_{2}\cdots -j{\frac {2\pi }{N_{m}}}n_{m}K_{m}}}
其中0 ≤ Ki ≤ Ni − 1 , i = 1, 2, ..., m 。
多維度離散傅里葉變換對應的逆變換是:
f
x
(
n
1
,
n
2
,
…
,
n
m
)
=
1
N
1
⋯
N
m
∑
K
1
=
0
N
1
−
1
⋯
∑
K
m
N
m
−
1
F
x
(
K
1
,
K
2
,
…
,
K
m
)
e
j
2
π
N
1
n
1
K
1
+
j
2
π
N
2
n
2
K
2
⋯
+
j
2
π
N
m
n
m
K
m
{\displaystyle fx(n_{1},n_{2},\ldots ,n_{m})={\frac {1}{N_{1}\cdots N_{m}}}\sum _{K_{1}=0}^{N_{1}-1}\cdots \sum _{K_{m}}^{N_{m}-1}Fx(K_{1},K_{2},\ldots ,K_{m})e^{j{\frac {2\pi }{N_{1}}}n_{1}K_{1}+j{\frac {2\pi }{N_{2}}}n_{2}K_{2}\cdots +j{\frac {2\pi }{N_{m}}}n_{m}K_{m}}}
其中0 ≤ n 1 , n 2 , ... , n m ≤ N (1, 2, ... , m ) – 1 。
離散餘弦變換被廣泛的應用,像是資料壓縮 、特徵萃取、影像重建等等。多維度離散餘弦變換為:
F
x
(
K
1
,
K
2
,
…
,
K
r
)
=
∑
n
1
=
0
N
1
−
1
∑
n
2
=
0
N
2
−
1
⋯
∑
n
r
=
0
N
r
−
1
f
x
(
n
1
,
n
2
,
…
,
n
r
)
cos
π
(
2
n
1
+
1
)
K
1
2
N
1
⋯
cos
π
(
2
n
r
+
1
)
K
r
2
N
r
{\displaystyle Fx(K_{1},K_{2},\ldots ,K_{r})=\sum _{n_{1}=0}^{N_{1}-1}\sum _{n_{2}=0}^{N_{2}-1}\cdots \sum _{n_{r}=0}^{N_{r}-1}fx(n_{1},n_{2},\ldots ,n_{r})\cos {\frac {\pi (2n_{1}+1)K_{1}}{2N_{1}}}\cdots \cos {\frac {\pi (2n_{r}+1)K_{r}}{2N_{r}}}}
其中 ki = 0, 1, ..., Ni − 1 , i = 1, 2, ..., r .
多維度拉普拉斯變換在邊值問題的求解中具有重要作用。由偏微分方程描述的二元或多元邊值問題直接使用拉普拉斯變換求解[ 3] 。 M維的拉普拉斯變換定義為:
F
(
s
1
,
s
2
,
…
,
s
n
)
=
∫
0
∞
⋯
∫
0
∞
f
(
t
1
,
t
2
,
…
,
t
n
)
e
−
s
n
t
n
−
s
n
−
1
t
n
−
1
⋯
⋯
s
1
t
1
d
t
1
⋯
d
t
n
{\displaystyle F(s_{1},s_{2},\ldots ,s_{n})=\int _{0}^{\infty }\cdots \int _{0}^{\infty }f(t_{1},t_{2},\ldots ,t_{n})e^{-s_{n}t_{n}-s_{n-1}t_{n-1}\cdots \cdots s_{1}t_{1}}\,dt_{1}\cdots \,dt_{n}}
其中,
F
{\displaystyle F}
代表信號
f
(
t
1
,
t
2
,
⋯
,
t
n
)
{\displaystyle f(t_{1},t_{2},\cdots ,t_{n})}
在 s-域的表示。
對於二維情況,函數
f
(
x
,
y
)
{\displaystyle f(x,y)}
的拉普拉斯變換定義為:
F
(
s
1
,
s
2
)
=
∫
0
∞
∫
0
∞
f
(
x
,
y
)
e
−
s
1
x
−
s
2
y
d
x
d
y
{\displaystyle F(s_{1},s_{2})=\int \limits _{0}^{\infty }\int \limits _{0}^{\infty }\ f(x,y)e^{-s_{1}x-s_{2}y}\,dxdy}
多維度 Z 變換將離散時間域中的高維信號映射到 Z 域,這在濾波器穩定性分析中非常有用。多維度 Z 變換定義為:
F
(
z
1
,
z
2
,
…
,
z
m
)
=
∑
n
1
=
−
∞
∞
⋯
∑
n
m
=
−
∞
∞
f
(
n
1
,
n
2
,
…
,
n
m
)
z
1
−
n
1
z
2
−
n
2
…
z
m
−
n
m
{\displaystyle F(z_{1},z_{2},\ldots ,z_{m})=\sum _{n_{1}=-\infty }^{\infty }\cdots \sum _{n_{m}=-\infty }^{\infty }f(n_{1},n_{2},\ldots ,n_{m})z_{1}^{-n_{1}}z_{2}^{-n_{2}}\ldots z_{m}^{-n_{m}}}
其中,
F
{\displaystyle F}
代表信號
f
(
n
1
,
n
2
,
⋯
,
n
m
)
{\displaystyle f(n_{1},n_{2},\cdots ,n_{m})}
在 Z-域的表示。
對於二維情況,Z 變換定義為:
F
(
z
1
,
z
2
)
=
∑
n
1
=
−
∞
∞
∑
n
2
=
−
∞
∞
f
(
n
1
,
n
2
)
z
1
−
n
1
z
2
−
n
2
{\displaystyle F(z_{1},z_{2})=\sum _{n_{1}=-\infty }^{\infty }\sum _{n_{2}=-\infty }^{\infty }f(n_{1},n_{2})z_{1}^{-n_{1}}z_{2}^{-n_{2}}}
傅里葉變換是 Z 變換的特例,在單位圓(一維)和單位雙圓(二維)上得到。即取:
z
=
e
i
w
{\textstyle z=e^{iw}}
其中
z
{\textstyle z}
和
w
{\textstyle w}
是向量。
當滿足
F
(
z
1
,
z
2
)
=
∑
n
1
=
−
∞
∞
∑
n
2
=
−
∞
∞
|
f
(
n
1
,
n
2
)
|
|
z
1
|
−
n
1
|
z
2
|
−
n
2
<
∞
{\displaystyle F(z_{1},z_{2})=\sum _{n_{1}=-\infty }^{\infty }\sum _{n_{2}=-\infty }^{\infty }|f(n_{1},n_{2})||z_{1}|^{-n_{1}}|z_{2}|^{-n_{2}}<\infty }
時,點
(
z
1
,
z
2
)
{\displaystyle (z_{1},z_{2})}
位於收斂域內。
離散傅立葉變換和離散餘弦變換常常被使用在訊號處理[ 5] 和影像處理,也常被用來當作解偏微分方程式時更有效率的方法。離散傅立葉變換也可用在運算摺積或是乘上很大的整數。下列只列出一些例子。
在JPEG DCT 中的二維度離散餘弦變換頻率
離散餘弦變換被用在 JPEG 影像壓縮、MJPEG 、MPEG 、DV 和 Theora 影片壓縮上。壓縮時使用N xN'格的二維的離散餘弦變換(DCT-II)然後再被量化 且用熵編碼法 編碼,通常 N為8,而DCT-II的運算就用在該格的每一行和每一排,結果會生成8x8的變換系數矩陣,其中(0,0)(左上角)的值是直流分量(頻率為0),隨着水平或垂直的編號增加,代表水平或垂直的空間頻率增加,如右圖所示。
在影像處理方面,利用二維的離散餘弦變換可以分析並且描述非常規的圖形加密方法,像是在二維圖像平面中插入非可見的二進位制水印。[ 6] 利用不同的方向,DCT-DWT混雜的轉換也可以用來去除超聲波影像的雜訊。[ 7] 三維的離散餘弦變換可以被用來轉換在使用水印影像遷入的影片資料或是三維影像資料。[ 8] [ 9]
當使用離散傅立葉變換來做頻譜分析 時,{xn }的數列通常代表着從訊號 x (t )中在均勻的時間點做取樣所得到的有限集合,這樣將連續時間點經取樣離散化後,也將原本的傅立葉變換 轉變成離散時間傅立葉變換 (DTFT),通常也因此產生了混疊 的失真。為了要最小化這種失真,選擇適當的取樣頻率是重點(詳情請看取樣定理 )。同樣的,將一個非常長(或無限)的數列轉變成一個容易處理的大小,會因此造成失真(Spectral leakage),選取一個適當的子數列長度是最小化這個問題的關鍵點。當資料量大於達到理想頻率解像度所需的適量時,標準的作法是使用多個DFT,例如產生頻譜圖 的時候。如果所期望的結果是功率頻譜而且有雜訊或隨機訊號出現在資料內的話,多個DFT的振幅平均值可以用來減少頻譜的變異性,Welch方法 和Bartlett方法 就是這種技術。一般處理這種用來估計有雜訊的訊號的功率頻譜的方法就稱為頻譜估計。
其實會造成失真的主要源頭就是DFT本身,因為DFT是將DTFT這種連續性的頻域做離散取樣的結果,可以利用提高DFT的頻率解像度來減緩這問題。
這種方法有時候也被認為是零填充,這是一種被用在快速傅立葉變換 的一種特別應用。這種因為值為零的取樣點而產生的乘法與加法比原本的FFT產生偏移還要沒有效率。
如上面所言,失真(leakage)的問題對DTFT的頻率解像度造成了限制,因此會對透過提高頻率解像度的效益造成限制。
離散傅立葉變換時常被用來解偏微分方程式 ,其中DFT是被用來近似傅立葉級數 ,其優點在於將訊號延伸為複數指數函數e inx ,而這微分方程式的特徵函數為:d /dx e inx = in e inx ,因此,微分在傅立葉變換後的表示式下變得很簡單,只要乘上i n (但是因為混疊 的影響,n 的選擇不一定是唯一的,為了讓這樣的方法達到收斂,需要使用三角插值去選擇這個值)。一個線性微分方程式 且其系數為常數經由離散傅立葉變換後會變換成很容易解的代數等式,將解完等式的結果用逆離散傅立葉變換就能回到原來的時/空域表示式。
我們必須使用沒有損害的方法去得到一些關於藝術稀有的資訊(從HVS的觀點是着重於色度法以及空間資訊)。我們可以透過觀察色彩變化或是測量表面一制性的變化來了解藝術,因為整個影像是非常大的,所以我們會使用一個雙生的餘弦窗去擷取影像:[ 10]
w
(
x
,
y
)
=
1
4
(
1
+
cos
x
π
N
)
(
1
+
cos
y
π
N
)
{\displaystyle w(x,y)={\frac {1}{4}}\left(1+\cos {\frac {x\pi }{N}}\right)\left(1+\cos {\frac {y\pi }{N}}\right)}
其中N 是影像的維度, x , y 是從影像中心(0,0)所擴展的座標(從0到N /2),可將空間頻率表示成下式:[ 10]
A
m
(
f
)
2
=
[
∑
i
=
−
f
f
FFT
(
−
f
,
i
)
2
+
∑
i
=
−
f
f
FFT
(
f
,
i
)
2
+
∑
i
=
−
f
+
1
f
−
1
FFT
(
i
,
−
f
)
2
+
∑
i
=
−
f
+
1
f
−
1
FFT
(
i
,
f
)
2
]
{\displaystyle A_{m}{(f)}^{2}=\left[\sum _{i=-f}^{f}\operatorname {FFT} (-f,i)^{2}+\sum _{i=-f}^{f}\operatorname {FFT} (f,i)^{2}+\sum _{i=-f+1}^{f-1}\operatorname {FFT} (i,-f)^{2}+\sum _{i=-f+1}^{f-1}\operatorname {FFT} (i,f)^{2}\right]}
「FFT」為快速傅立葉變換, f 是空間頻率。這種基於FFT的成像方法是一種診斷技術,用以確保文化藝術的長壽及穩定。這是一種簡單、成本低且可用於博物館又不影響日常使用的方法,但這種方法沒辦法定量的量測腐蝕速率。
^ 1.0 1.1 Smith,W. Handbook of Real-Time Fast Fourier Transforms:Algorithms to Product Testing, Wiley_IEEE Press, edition 1, pages 73–80, 1995
^ Dudgeon and Mersereau, Multidimensional Digital Signal Processing,2nd edition,1995
^ Debnath, Joyati; Dahiya, R. S. Theorems on multidimensional laplace transform for solution of boundary value problems. Computers & Mathematics with Applications. 1989-01-01, 18 (12): 1033–1056. doi:10.1016/0898-1221(89)90031-X .
^ Narod Book (PDF) .
^ Tan Xiao, Shao-hai Hu, Yang Xiao. 2-D DFT-DWT Application to Multidimensional Signal Processing. ICSP2006 Proceedings, 2006 IEEE
^ Peter KULLAI, Pavol SABAKAI, JozefHUSKAI. Simple Possibilities of 2D DCT Application in Digital
Monochrome Image Cryptography. Radioelektronika, 17th International Conference, IEEE, 2007, pp. 1–6
^ Xin-ling Wen, Yang Xiao. The 2-D Directional DCT-DWT Hybrid Transform and Its Application in Denoising Ultrasound Image. Signal Processing. ICSP 2008. 9th International Conference, Page(s): 946–949
^ Jinwei Wang, Shiguo Lian, Zhongxuan Liu, Zhen Ren, Yuewei Dai, Haila Wang. Image Watermarking Scheme Based on 3-D DCT.Industrial Electronics and Applications, 2006 1ST IEEE Conference, pp. 1–6
^ Jin Li, Moncef Gabbouj, Jarmo Takala, Hexin Chen. Direct 3-D DCT-to-DCT Resizing Algorithm for Video Coding. Image and Signal Processing and Analysis, 2009. ISPA 2009. Proceedings of 6th International Symposium
pp. 105–110
^ 10.0 10.1 Angelini, E., Grassin, S. ; Piantanida, M. ; Corbellini, S. ; Ferraris, F. ; Neri, A. ; Parvis, M. FFT-based imaging processing for cultural heritage monitoring Instrumentation and Measurement Technology Conference (I2MTC), 2010 IEEE