加伯变换
数学定义
编辑将短时距傅立叶转换中的窗函数代入高斯函数,即可得下面的标准定义:
以下是几种常见的替代定义:
- 注:在文献上可能会看到不同形式的加伯变换,但本质上都是一样的。
由于实作时,不能计算无限大的积分式子,所以根据高斯函数会从两侧递减的性质,我们可以将上式进一步化简:
为何选择高斯函数作为窗函数
编辑- 其他窗函数的短时距傅立叶变换,如利用方型窗函数的短时距傅立叶变换,无法同时兼顾时间轴和频率轴的分辨率;一者分辨率提升,另一者分辨率必定下降。但高斯函数由海森堡测不准原理可得知,是最能同时让两轴兼顾分辨率的窗函数(将于下面章节详述)。
- 高斯函数为傅立叶转换的特征函数:
因此经过转换后其性质不变。因此可让加伯变换后在时间轴和频率轴的性质相互对称。
由测不准原理了解高斯函数的性质
编辑上述提到,高斯函数是最能兼顾时间与频率分辨率的窗函数。我们利用这个章节来详细讨论。
- 对于一个信号 ,当 ,若 ,则
- 其中
- 由于两者标准差相乘有下限,这个定理说明了我们没有办法同时精准量测时间和频率,其中一者标准差下降(分辨率上升),另一者标准差就上升(分辨率下降)。
- 当信号 为高斯函数时
- 套用以上函式求得变异数(其中由于高斯函数为偶对称函数,所以其 )
- 借由微积分公式可得:
- 及
- 即高斯函数满足测不准定理的最下限,所以是所有窗函数中能使时间和频率两者分辨率都达到最高的函数。
- 变形的高斯函数同样会满足测不准原理的下限,如以下例子:
- :对几率分布做位移,标准差不会改变。
- :分子与分母同乘A,可消掉。因此标准差不会改变。
- :在时域乘上 相当于在频域对频率做位移,标准差一样不会改变。
- :在时域做缩放,频域会做相反的缩放,因此标准差也不会改变。
- 以下提供一个简单的例子来做模拟,
- 右图为即加伯变换的结果,可以看出其时间和频率都维持相当程度的分辨率。
高斯窗函数与方形窗函数比较
编辑以下提供一个简单的范例来比较加伯变换以及利用方形窗函数的短时傅立叶转换:
从图中可以发现方形窗函数的短时傅立叶转换会有能量扩散的情形,而加伯变换则是清晰的时频图。
加伯变换的缩放
编辑- 由于高斯窗函数的宽度可以由一常数做调整,因此我们将这个参数加入加伯变换的数学式子中,让转换更加弹性,如下式:
- 而根据前面章节所述。实作时,不能计算无限大的积分式子,所以根据高斯函数会从两侧递减的性质,我们可以将上式进一步化简:
- 根据傅立叶转换的缩放公式,假设 ,则傅立叶转换后为 ,使其能根据需求而调整时域分辨率或频域分辨率
- 改变高斯函数的宽度,和改变方形窗函数短时距傅立叶变换的效果类似。若选取较大的 ,时域的高斯窗函数较窄,则时域有较高的分辨率,而频域的高斯窗函数较宽,所以频域的分辨率会下降(通常用于需要时域分辨率较高的应用,例如:音乐讯号);反之,若选取较小的 ,时域的高斯窗函数较宽,则时域的分辨率下降,而频域的高斯窗函数较窄,所以频域的分辨率会上升(通常运用在需要频域分辨率较高的应用,例如:气候)。虽然还是有两轴之间的分辨率的牺牲,但比起其他无法满足测不准原理下限的窗函数,加伯变换的两轴还是能相对维持较高的分辨率。
- 若应用于瞬时频率改变较剧烈的应用,则可考虑使用窗宽度随时间而变动的加伯变换数学式子,如下
- 当瞬时频率变动非常快时,使用较大的 值,使其时域分辨率能较高;当瞬时频率变动很慢时,使用较小的 值,使其频域分辨率能较高。
实现方法及注意事项
编辑Direct Implementation
编辑
- Discrete Form:
令 可将式子改写为离散形式:
, therefore,only when is nonzero 可改写为:
按照此式即可實現
限制
编辑- 避免赝频效应(aliasing effect)
(1)
时间复杂度
编辑O(TFQ) T:时间取样点数 F:频率取样点数 Q:
优缺点
编辑- 优点:简单实现,限制条件少
- 缺点:时间复杂度高
FFT-Based Method(快速傅立叶转换)
编辑由Direct Implementation可得下式
令 且离散傅立叶转换标准式 可将式子整理为:
按照此式將 以fft()算出帶入即可實現
其中 , ,
- Matlab及python 皆可呼叫fft函式完成
- 算法
假设
- step 1:计算
- step 2:
- step 3:决定
- step 4:
- step 5:转换 成
- step 6:设 and return to Step 3 until
限制
编辑- 避免赝频效应(aliasing effect)
- (1) (基本上任何实现方法都要避免赝频效应)
- (2)
- (3)
时间复杂度
编辑
优缺点
编辑- 优点:时间复杂度低
- 缺点:限制条件较直接实现法多
Chirp Z Transform
编辑可改写为: 由Direct Implementation可得下式
令 可将式子改写为:
按此式即可實現
- 算法
- Step1:
- Step2:
- Step3:
限制
编辑- 避免赝频效应(aliasing effect)
(1)
时间复杂度
编辑
优缺点
编辑- 优点:限制条件与Direct Implementation法一样基本上没有限制
- 缺点:时间复杂度与FFT-Based Method(快速傅立叶转换)一样
- 但由于加伯变换无法使用Recursive Method(递回法)所以此不能算是缺点
特性
编辑加伯变换的大部分的特性和方形窗函数短时距傅立叶转换的特性都相似,有些特性甚至更加接近傅立叶转换的特性。
- 积分特性
- 当
- 当
- 当 (还原成原始信号)
- 位移特性
- 若 ,则
- 调变特性
- 若 ,则
- 线性特性
- 若有一信号 , 分别为 做加伯变换的结果,则 。
- 功率衰减特性
- 若 时 ,则
- 能量积分特性
- 能量总和特性
- 特殊信号
- 1. 当 ,
- 2. 当 ,
- 和方形窗函数短时距傅立叶转换不同的是,加伯变换的结果对于时间和频率轴较对称,也比较没有旁波(sidelobe);也印证了上述所说的,加伯变换较能维持两个轴的分辨率。
优缺点
编辑Gabor Transform 的优点
编辑- 最佳时间-频率局部化特性
- Gabor Transform 使用高斯窗函数,与其他常见窗函数(如Rectangle、Triangle、Hanning、Hamming)相比,满足测不准定理的最小下限(Minimum Uncertainty Principle)。这意味着,高斯函数能够在时间域和频率域中同时提供最佳的分辨率,避免信号特征的模糊或失真。
- 高时间分辨率:能捕捉信号的快速变化,对于瞬态信号(如语音中的短促音位或振动信号中的瞬时变化)尤为重要。
- 高频率分辨率:能精确分辨信号中的稳态频率成分,特别适合于分析连续且平稳的周期信号。
- Gabor Transform 使用高斯窗函数,与其他常见窗函数(如Rectangle、Triangle、Hanning、Hamming)相比,满足测不准定理的最小下限(Minimum Uncertainty Principle)。这意味着,高斯函数能够在时间域和频率域中同时提供最佳的分辨率,避免信号特征的模糊或失真。
- 算法稳健且实现简单
- Gabor Transform 基于傅里叶变换的数学理论,其结构清晰、明了且实现相对简单。现代数值计算技术(如快速傅里叶变换,FFT)的发展进一步提升了 Gabor Transform 的计算效率,使其能够在高效实现的同时保持稳健性。
- 稳健性:由于其依赖于成熟的数学基础,在实施中容易检测和修正潜在错误。
- 实现便利性:现有的数学工具库(如 MATLAB、Python 的 Scipy、Octave)提供了高度封装的 Gabor Transform 函数,大幅降低了实现门槛,让开发者能更专注于应用场景设计,而非底层算法调试。
- 广泛的应用场景
- 语音去噪:利用 Gabor Transform 可以有效提取语音信号的时频特征,通过将语音信号分解为多个频带,对噪声进行有效抑制,从而提升语音的清晰度和识别准确度,特别是在低信噪比环境下[1]
- 图像处理
- 纹理分析:有效捕捉图像的方向与频率特征,用于纹理分类和图像分割。
- 边缘检测:适用于医学图像和场景理解,改善边缘检测效果。
- 机械振动信号分析
- 故障检测:由于Gabor Transform能够提供高时间和频率分辨率,它能有效捕捉非平稳信号中的瞬时频率变化。这使得它特别适合用于检测如轴承、齿轮等机械部件的故障。转换后的信号图像可以作为特征输入至卷积神经网络(CNN),进行自动化分类和故障诊断。[2]
Gabor Transform 的缺点
编辑- 计算复杂度较高
- Gabor Transform 在处理高维数据(如图像信号处理)时,计算复杂度可能大幅增加。每个窗函数的计算都需要执行一次傅立叶变换,这对于大数据集或实时应用场景来说,可能会成为系统性能的瓶颈。
- 在图像处理中,Gabor 变换通常需要对图像的不同尺度和方向应用一组 Gabor 滤波器,以提取丰富的特征信息。这意味着每个尺度和方向都需要单独进行滤波操作,随着滤波器数量的增加,计算量会线性增长。此外,对于高分辨率图像,每次滤波操作都需要处理大量像素,从而进一步增加了计算负担。
- 为了提高计算效率,基于离散傅立叶变换(DFT)的快速算法应运而生,快速算法用于二维离散 Gabor 变换。可以显著降低了计算复杂度[3]
- 分辨率折衷的不可避免性
- 根据测不准定理,Gabor Transform 的时间和频率分辨率达到了理论的最佳折衷,但这也意味着:
- 受测不凖定理约束,当需要同时对信号的快速变化与细微频率差异进行精确分析时,时间和频率的分辨率会有可能不足以同时满足所有需求。
- 相较于 Gabor Transform, Wigner Distribution Function(WDF)等方法,因是对讯号的自相关函数做傅立叶转换,可以超越测不准原理约束的下限,因此能提供更高的时频分辨率,尤其是对于结构复杂的信号。然而,WDF 的非线性特性容易引入交叉干扰项(cross-terms),而为了为了结合两者的优点,Gabor Wigner Transform应运而生
- 根据测不准定理,Gabor Transform 的时间和频率分辨率达到了理论的最佳折衷,但这也意味着:
参见
编辑参考书目、资料来源
编辑- Jian-Jiun Ding, Time frequency analysis and wavelet transform class notes, the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2024.
- Alan V. Oppenheim, Ronald W. Schafer, John R. Buck : Discrete-Time Signal Processing, Prentice Hall, ISBN 0-13-754920-2
- S. Qian and D. Chen, Joint Time-Frequency Analysis: Methods and Applications, Chap. 5, Prentice Hall, N.J., 1996.
- Jian-Jiun Ding, Time frequency analysis and wavelet transform class notes, the Department of Electrical Engineering, National Taiwan University (NTU), Taipei, Taiwan, 2020.
- S.C.Pei and S.G.Huang, STFT with adaptive window width based on the chirp rate. IEEE Transactions on Signal Processing, vol. 60,issue 8,pp. 4065-4080,2012.
- ^ Kouni, Vicky; Rauhut, Holger; Theoharis, Theoharis. Star DGT: a robust Gabor transform for speech denoising. Sampling Theory, Signal Processing, and Data Analysis. 2023-04-12, 21 (1). ISSN 2730-5716. doi:10.1007/s43670-023-00053-x.
- ^ Waziralilah, N. Fathiah; Abu, Aminudin; Lim, M. H.; Quen, Lee Kee; Elfakarany, Ahmed. Bearing fault diagnosis employing Gabor and augmented architecture of convolutional neural network. Journal of Mechanical Engineering and Sciences. 2019-09-27, 13 (3). ISSN 2231-8380. doi:10.15282/jmes.13.3.2019.29.0455.
- ^ Xian-He Gao; Xue-You Hu; Liang Tao. DFT-based fast algorithms for 2-D discrete Gabor transform. 2009 2nd International Conference on Power Electronics and Intelligent Transportation System (PEITS) (IEEE). 2009-12. doi:10.1109/peits.2009.5407020.