线谱对(LSP)或线谱频率(LSF)用于表示在信道上传输的线性预测系数(LPC)。[1]LSP具有一些特性,如对量化噪声的敏感度较小,优于LPC的直接量化。因此,LSP在语音编码中非常有用。

LSP表示法是日本电信电话的板仓文忠[2]于1975年发明的。[3]1975年到1981年,他研究了基于LSP的语音分析与合成问题。[4]1980年,他的团队开发出了基于LSP的语音合成芯片。LSP是语音合成和编码的一项重要技术,20世纪90年代的几乎所有国际语音编码标准都将其作为重要组成,为提高全球移动信道和互联网上的数字语音通信水平做出了很大贡献。[3]1985年,Bishnu S. Atal、Manfred R. Schroeder基于LSP开发了CELP算法。

数学原理

编辑

线谱多项式 可写作 ,其中:

  •  
  •  

根据构造,P回文多项式Q反回文多项式;物理上,P(z)对应声门关闭时的声道,Q(z)则对应声门打开时的声道。[5]可证明:

  • PQ零点位于复平面中的单位圆
  • 绕圆运动时,PQ的根交替出现。
  • 由于PQ系数都是实数,因此根以共轭对的形式出现。

LP多项式的线谱对表示简单地包含了P、Q根的位置(即使  )。由于根成对出现,因此只需传输一半的根(一般 )。因此,PQ的系数总数等于原LP系数数p(不计 )。 确定系数的常用算法[6]是在单位圆上间隔较近的点串上求多项式值,观察结果何时变号;变号时,根必定位于测试点之间。由于PQ的根穿插在一起,因此只要一次就能找到两个多项式的根。

LSP分析

编辑

要转回LPC,就要计算 的根。下面只考虑线性预测多项式 阶数为偶数 的情形,这时LSP多项式的  多项式。

LSP多项式的 可分别被  整除,剩余多项式用 除,在单位圆上可表为 。即, 可进行如下因式分解:

 
 

求出该式的根,便能计算线谱对 。更具体地,如下[7]</ref> [8][9]

(1) 由线性预测系数 计算 各系数

 的定义,用下式计算。多项式系数 
 
 
 
 

(2)  分别除以  

相当于从单位圆上的根上除去实根。
此多项式除法可通过系数加减来计算。将商式系数记作 
 
 
 
 

(3) 商式  置换变量

相当于剩余复共轭根在实轴上的投影。置换后的式子可用切比雪夫多项式表示[8]
 是关于  次多项式,系数可从 机械计算。

(4) 用牛顿-拉弗森法 的两个方程

在区间<math(-1,\ 1)</math>内,根 交替存在,则可交替求解两个方程。

(5) 由求得的根计算线谱 

由求得的N个根 求下式中的 
 

将线谱对变换为线性预测系数时更简单,与上述相反,从线谱对  各系数即可:

 

 各系数为 形式的二次多项式的积,进而可作为乘以 的式子的系数,可以机械计算。

 的系数有对称性,因此能从 次系数通过以下公式变换为线性预测系数[9]

 

性质

编辑

线谱对有几个有趣而有用的性质。P(z)、Q(z)的根交错排列时,只有根单调递减,滤波器的稳定性才有保证。另外,两个根越近,滤波器在相应频率上的谐振就越大。由于LSP对量化噪声不过分敏感,因此被广泛用于量化LPC滤波器。线谱频率可以内插。

另见

编辑

资料

编辑

Includes an overview in relation to LPC.

  • "Line Spectral Pairs" chapter页面存档备份,存于互联网档案馆) as an online excerpt (pdf) / "Digital Signal Processing - A Computer Science Perspective" (ISBN 0-471-29546-9) Jonathan Stein.

参考文献

编辑
  1. ^ Sahidullah, Md.; Chakroborty, Sandipan; Saha, Goutam. On the use of perceptual Line Spectral pairs Frequencies and higher-order residual moments for Speaker Identification. International Journal of Biometrics. 2010-01, 2 (4): 358–378. doi:10.1504/ijbm.2010.035450. 
  2. ^ Zheng, F.; Song, Z.; Li, L.; Yu, W. The Distance Measure for Line Spectrum Pairs Applied to Speech Recognition (PDF). Proceedings of the 5th International Conference on Spoken Language Processing (ICSLP'98). 1998, (3): 1123–6 [2023-10-21]. (原始内容存档 (PDF)于2022-10-09). 
  3. ^ 3.0 3.1 List of IEEE Milestones. IEEE. [2019-07-15]. (原始内容存档于2015-02-10). 
  4. ^ Fumitada Itakura Oral History. IEEE Global History Network. 2009-05-20 [2009-07-21]. (原始内容存档于2015-04-03). 
  5. ^ http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/node51.html#SECTION000713000000000000000页面存档备份,存于互联网档案馆) Tony Robinson: Speech Analysis
  6. ^ e.g. lsf.c in http://www.ietf.org/rfc/rfc3951.txt页面存档备份,存于互联网档案馆
  7. ^ 嵯峨山茂树. 応用音响学: 音声分析(5) LSP分析.(pdf) 东京大学 応用音响学 讲义资料.
  8. ^ 8.0 8.1 Peter Kabal, Ravi P. Ramachandran. The Computation of Line Spectral Frequencies Using Chebyshev Polynomials页面存档备份,存于互联网档案馆.(pdf) IEEE Trans. Acoustics, Speech, Signal Processing, vol.34, no. 6, pp.1419-1426, Dec. 1986.
  9. ^ 9.0 9.1 Wai C. Chu. Speech Coding Algorithms: Foundation and Evolution of Standardized Coders. pp.239-250, 2003.