正弦波合成
正弦波合成是一種用純音代替共振峰的語音合成方法。哈斯金斯實驗室的Philip Rubin於1970年代開發了第一個正弦波合成程序,用於自動創建感知實驗的刺激物。隨後,Robert Remez、Philip Rubin、David Pisoni及其他同事利用該程序證明,聽者可以在沒有傳統語音線索(音高、重音和語氣)時感知連續語音。這項研究說明,可將語音看做通過發音-聲學空間的軌跡的動態模式。[1]
書目
編輯- Rubin, P.E. Sinewave synthesis. Internal memorandum, Haskins Laboratories, New Haven, CT, 1980.[1] (頁面存檔備份,存於互聯網檔案館)
- Remez, R.E., Rubin, P.E., Pisoni, D.B., & Carrell, T.D. Speech perception without traditional speech cues. Science, 1981, 212, 947-950.
- Best, C.T., Morrongiello, B. & Robson, R. Perceptual equivalence of acoustic cues in speech and nonspeech perception. Perception & Psychophysics, 1981, 29, 191-211.
- Remez, R.E., Rubin, P.E., Berns, S.M., Pardo, J.S. & Lang, J.M. On the perceptual organization of speech. Psychological Review, 1994, 101, 129-156.
- Remez, R. E., Fellowes, J. M., & Rubin, P.E. Talker identification based on phonetic information. Journal of Experimental Psychology: Human Perception and Performance, 1997, 23, 651-666.
參考文獻
編輯- ^ Nonlinear dynamics in human behavior. Huys, Raoul., Jirsa, V. K. (Viktor K.). Berlin: Springer. 2010. ISBN 9783642162626. OCLC 700199659.
外部連結
編輯- Haskins Laboratories (頁面存檔備份,存於互聯網檔案館)
- Robert Remez (頁面存檔備份,存於互聯網檔案館)
- Philip Rubin (頁面存檔備份,存於互聯網檔案館)
- David Pisoni (頁面存檔備份,存於互聯網檔案館)
- SineWave Synthesis (頁面存檔備份,存於互聯網檔案館)
- Smithsonian Speech Synthesis History Project (SSSHP) 1986-2002 (頁面存檔備份,存於互聯網檔案館)
- A Python tool to convert WAV files to sinewave speech using linear predictive coding (頁面存檔備份,存於互聯網檔案館).
- SinSyn - Sinusoidal Synthesizer (頁面存檔備份,存於互聯網檔案館) A browser-based tool for creating individual sounds with sinewave synthesis