言語知覺的運動理論

言語知覺的運動理論(Motor theory of speech perception),是一種認為人們通過辨認發音的聲道姿勢而非語言的發音習慣來理解話語的假說[1][2][3][4][5]。它最初聲稱言語知覺是通過一個人類天生特有的特殊模塊完成的。雖然這個模塊在近幾年的理論中得到認證,[5]但人們還是認為言語運動系統的角色不僅是產生發音,還有檢測它們。

當我們聽到口語時,會感覺到它們由聽覺聲音構成。言語知覺的運動理論認為,我們聽到聲音的背後機制是來自聲帶的預期運動。

相比於言語知覺這個領域,該假設在領域外獲得的關注更多。而鏡像神經元的發現使得其關注度更加高。鏡像神經元將運動的產生與認知聯繫起來,其中包括了由聲道產生的運動[5]

該理論最初由阿爾文·利伯曼富蘭克林·庫珀於20世紀50年代在哈斯金斯實驗室提出。並由唐納德·尚克韋勒麥可·斯塔德特·甘迺迪伊格內修斯·馬丁利卡羅爾·福勒以及道格拉斯·惠倫進一步發展。

起源和發展

編輯

該假說起源於運用模式播放為盲人創造取代拼寫字母的聲音的閱讀機的研究[6]。這導致了一次有關講話聲音如何與其聲譜圖的聽音序列相對應的仔細檢查。這才發現,連續輔音元音彼此同時重疊(這種現象被稱為協同發音)[7][8][9]。這表明,言語不是聽覺的「字母表」或「密碼」,而是重疊的語言姿勢的「代碼」。

連結論者的方法

編輯

最初,該理論由連結論者提出:嬰兒模仿他們聽到的語言,這導致了發音與其感官後果行為上的關聯。然後,這種明顯的模仿會被繞過[8],並成為言語知覺。然而,隨著研究發現語言前的嬰兒已經能夠檢測出大部分用來分隔不同的語音的語音對比,這方面的理論被放棄了[1]

認知主義的方法

編輯

行為主義的方法是被有語言模塊[1]的認知主義取代的。這個模塊通過隱藏的遠端對象來檢測言語,而不是在它們的近端或直接輸入處。這方面的證據是,研究發現,語言處理是很特殊的,例如雙工認知[10]

改變遠端對象

編輯

言語知覺最初的假設是與以下的發音對象關聯的:

  • 語音發音器官的不變運動[8]
  • 傳達到肌肉導致聲道發聲運動的不變運動指令[11]

後來這被修改為包括語音姿勢,而不是運動指令;而語音姿勢是說話人聲前和語言的層面控制的,而不是實際的運動[12]

近代的修改

編輯

由於研究發現,言語知覺可能發生於非語言的聲音(例如,摔門為雙工感知[13]),「言語是特殊的」的這一主張已經被放棄[5]

鏡像神經元

編輯

鏡像神經元的發現已經引起了在言語知覺的運動理論方面新的興趣,而這一理論也仍舊有其擁護者[8],雖然也有批評[14]

支持

編輯

非聽覺姿勢信息

編輯

如果說語言是通過它的物理產生來識別的,那麼非聽覺信息則應納入言語知覺,即使這仍然是主觀聽到的「聲音」。但事實正是如此。

麥格克效應表明眼睛看到的口語音節的產生不同於與其同步的聽覺提示,這會影響聽覺的認知。換句話說,如果有人聽到「ba」,但看到視頻的人發音「ga」,他們所聽到是與之不同的——有些人會認為,他們聽到的是「da」。

  • 人們發現在噪音中,如果他們能看到說話者,會更容易聽到講話內容。[15]
  • 當音節的產生能夠憑觸覺感知到時,人們能更好地聽到它們。[16]

類別知覺

編輯

使用言語合成器時,語音可以沿著一個連續的發音位置變化,從/ba/到/da/到/ga/,或語音發生時間的連續(例如/da/到/ta/)。當聽者被要求區分兩個不同的聲音時,他們認為這屬於非連續的聲音,雖然聲音是連續變化的。換句話說,十種聲音(從一個聲音的極端/da/到另一個極端/ta/,以及中間按比例變化的聲音)可以全部是聲學上彼此不同的,但聽者將把這些聲音全部聽成/da/或/ta/。同樣,英語輔音/ d /在不同的語音語境中可能會有聽覺細節上的不同(例如,/du/和/di/中的/d/嚴格來說發音並不相同),但所有/d/』 聽者都會歸為同一類(濁齒齦塞音),這是因為「語言表述是抽象和規範的語音部分或其背後的發音姿勢。[17]」 這表明,人類通過類別知覺識別語音。因此,像言語知覺的運動理論所提出的專門模塊,有可能是正確的[18]

言語模仿

編輯

如果人們能聽到講話的姿勢,那麼言語的模仿應該是非常快的,這種語音投影如同在耳機中聽到的重複單詞一樣[19]。人們能夠以比正常發聲更快的速度重複聽到的音節[20]

言語產生

編輯
  • 聽音能夠刺激聲道肌肉[21],運動皮層[22]和前運動皮層[23]。言語知覺的聽覺和視覺輸入整合也涉及這些區域[24]
  • 擾亂前運動皮層也會破壞語音單位的認知,如爆破音[25]
  • 同產生語音姿勢的聲道發聲器官有關的音位特徵會激活運動區[26]
  • 講話聲音的感知是藉助於先發制人地刺激發聲器官的運動表達[27]
  • 聽覺和運動皮層的耦合被限制在特定的神經元放電頻率範圍內[28]

知覺行動嚙合

編輯

有證據表明,知覺和產生一般在運動系統中是相聯繫的。這由鏡像神經元的存在佐證。當看到(或聽到)動作,或動作開展時鏡像神經元都會被激活[29]。另一個證據來源是用於感知和行動之間表達的共同編碼理論[30]

批評

編輯

雖然在其他領域,例如理論語言學,更加受歡迎;言知覺的運動理論並沒有在言語知覺領域被廣泛接納。如其三個倡導者所指出的,「在言語知覺領域裡,它的支持者很少。許多作者引用它主要是為了提出批評性的評論[5]」,對此有幾種批評意見。[31][32]

多個來源

編輯

言語知覺受非產生性的信息來源的影響,例如語境。單詞單獨出現時很難理解,但在句子語境中卻很容易聽到。因此,似乎言語知覺以最佳的方式整合多個來源的信息。[31]

產生

編輯

言語知覺的運動理論預測,嬰幼兒的言語運動能力預示他們的言語知覺能力,但實際上是相反的[33]。該理論也預測言語產生中的缺陷將削弱言語知覺,但實際上不會[34]。然而,這只會影響最初的已經被取代的行為主義的理論版本,其中認為嬰幼兒應該通過兒童早期的模仿來學習所有的產生-知覺模式。而這已不再是運動-言語理論家的主流意見了。

語言模塊

編輯
  • 多方的證據都沒能支持專門的語言模塊這一想法。
  • 雙工感知可以通過摔門觀察到[13]
  • 麥格克效應也可以通過非語言刺激實現,如播放一段籃球彈動視頻,但是播放桌球彈動的聲音[來源請求]
  • 至於類別知覺,聽者對單一語音類別的聲音差異也可能很敏感。

因此,這部分的理論已經被一些研究者放棄了[5]

次詞彙任務

編輯

為言語知覺的運動理論提供的證據僅限於例如使用不充分的言詞或口語句子這類言語單位來辨別音節。因此,「言語知覺有時被理解成是次詞彙層面的言語的感知。然而,這些研究的最終目標大概是為了理解支持生態有效的條件下處理語言能力的神經過程,即語音的成功處理最終引起與心理詞彙和聽覺理解的聯繫[35]。但這裡有一個問題:「與其隱含的研究目的,語音識別之間的牽強聯繫」[36]

模仿

編輯

言語知覺的運動理論面臨一個問題:研究言語知覺與言語產生的聯繫,與大腦處理模仿說出的話也是一致的。只要語言存在,大腦就必須有方法做到這一點。因為孩子詞彙量的擴展需要通過學習新穎的口語詞彙的方法完成,就像成年人學會新的名字。模仿要由所有的發聲法開始,因為只有聽到一個生詞,以及需要用於識別它的發音姿勢和運動目標消失之後,才能知道它的新穎。因此,聲音模仿需要從把每一個聽到的發音法默認到短期記憶開始。如果言語知覺使用多個來源的信息,這個默認的模仿過程會為詞語認知提供輔助幫助。模仿主要的需求在於非固有詞語的發聲法,這也許能夠解釋為什麼次詞彙任務沒有將固有詞彙與運動姿勢處理緊密結合。

鳥類

編輯

有人提出鳥類也能聽到彼此鳴唱的聲音姿勢。[37]

參見

編輯

參考文獻

編輯
  1. ^ 1.0 1.1 1.2 Liberman, A. M.; Cooper, F. S.; Shankweiler, D. P.; Studdert-Kennedy, M. Perception of the speech code. Psychological Review. 1967, 74 (6): 431–461. PMID 4170865. doi:10.1037/h0020279. 
  2. ^ Liberman, A. M.; Mattingly, I. G. The motor theory of speech perception revised. Cognition. 1985, 21 (1): 1–36. CiteSeerX 10.1.1.330.220 . PMID 4075760. doi:10.1016/0010-0277(85)90021-6. 
  3. ^ Liberman, A. M.; Mattingly, I. G. A specialization for speech perception. Science. 1989, 243 (4890): 489–494. PMID 2643163. doi:10.1126/science.2643163. 
  4. ^ Liberman, A. M.; Whalen, D. H. On the relation of speech to language. Trends in Cognitive Sciences. 2000, 4 (5): 187–196. PMID 10782105. doi:10.1016/S1364-6613(00)01471-6. 
  5. ^ 5.0 5.1 5.2 5.3 5.4 5.5 Galantucci, B.; Fowler, C. A.; Turvey, M. T. The motor theory of speech perception reviewed. Psychonomic Bulletin & Review. 2006, 13 (3): 361–377. PMC 2746041 . PMID 17048719. doi:10.3758/bf03193857. 
  6. ^ Liberman, A. M. (1996). Speech: A special code. Cambridge, MA: MIT Press. ISBN 978-0-262-12192-7
  7. ^ Liberman, A. M.; Delattre, P.; Cooper, F. S. The role of selected stimulus-variables in the perception of the unvoiced stop consonants. The American Journal of Psychology. 1952, 65 (4): 497–516. JSTOR 1418032. PMID 12996688. doi:10.2307/1418032. 
  8. ^ 8.0 8.1 8.2 8.3 Liberman, A. M.; Delattre, P. C.; Cooper, F. S.; Gerstman, L. J. The role of consonant-vowel transitions in the perception of the stop and nasal consonants. Psychological Monographs: General and Applied. 1954, 68 (8): 1–13. doi:10.1037/h0093673.  PDF頁面存檔備份,存於網際網路檔案館
  9. ^ Fowler, C. A.; Saltzman, E. Coordination and coarticulation in speech production. Language and Speech. 1993,. 36 ( Pt 2-3) (2–3): 171–195. PMID 8277807. doi:10.1177/002383099303600304.  PDF頁面存檔備份,存於網際網路檔案館
  10. ^ Liberman, A. M.; Isenberg, D.; Rakerd, B. Duplex perception of cues for stop consonants: Evidence for a phonetic mode. Perception & Psychophysics. 1981, 30 (2): 133–143. PMID 7301513. doi:10.3758/bf03204471. 
  11. ^ Liberman, A. M. The grammars of speech and language (PDF). Cognitive Psychology. 1970, 1 (4): 301–323 [2019-09-24]. doi:10.1016/0010-0285(70)90018-6. (原始內容存檔 (PDF)於2015-12-31). 
  12. ^ Liberman, A. M.; Mattingly, I. G. The motor theory of speech perception revised (PDF). Cognition. 1985, 21 (1): 1–36 [2019-09-24]. CiteSeerX 10.1.1.330.220 . PMID 4075760. doi:10.1016/0010-0277(85)90021-6. (原始內容存檔 (PDF)於2021-04-15). 
  13. ^ 13.0 13.1 Fowler, C. A.; Rosenblum, L. D. Duplex perception: A comparison of monosyllables and slamming doors. Journal of Experimental Psychology. Human Perception and Performance. 1990, 16 (4): 742–754. PMID 2148589. doi:10.1037/0096-1523.16.4.742. 
  14. ^ Massaro, D. W.; Chen, T. H. The motor theory of speech perception revisited. Psychonomic Bulletin & Review. 2008, 15 (2): 453–457; discussion 457–62. PMID 18488668. doi:10.3758/pbr.15.2.453. 
  15. ^ MacLeod, A.; Summerfield, Q. Quantifying the contribution of vision to speech perception in noise. British Journal of Audiology. 1987, 21 (2): 131–141. PMID 3594015. doi:10.3109/03005368709077786. 
  16. ^ Fowler, C. A.; Dekle, D. J. Listening with eye and hand: Cross-modal contributions to speech perception. Journal of Experimental Psychology. Human Perception and Performance. 1991, 17 (3): 816–828. PMID 1834793. doi:10.1037/0096-1523.17.3.816. 
  17. ^ Nygaard LC, Pisoni DB. Speech Perception: New Directions in Research and Theory. J.L. Miller, P.D. Eimas (編). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press. 1995. ISBN 978-0-12-497770-9. 
  18. ^ Liberman, A. M.; Harris, K. S.; Hoffman, H. S.; Griffith, B. C. The discrimination of speech sounds within and across phoneme boundaries. Journal of Experimental Psychology. 1957, 54 (5): 358–368. PMID 13481283. doi:10.1037/h0044417. 
  19. ^ Marslen-Wilson, W. Linguistic structure and speech shadowing at very short latencies. Nature. 1973, 244 (5417): 522–523. PMID 4621131. doi:10.1038/244522a0. 
  20. ^ Porter Jr, R. J.; Lubker, J. F. Rapid reproduction of vowel-vowel sequences: Evidence for a fast and direct acoustic-motoric linkage in speech. Journal of Speech and Hearing Research. 1980, 23 (3): 593–602. PMID 7421161. doi:10.1044/jshr.2303.593. 
  21. ^ Fadiga, L.; Craighero, L.; Buccino, G.; Rizzolatti, G. Speech listening specifically modulates the excitability of tongue muscles: A TMS study. The European Journal of Neuroscience. 2002, 15 (2): 399–402. CiteSeerX 10.1.1.169.4261 . PMID 11849307. doi:10.1046/j.0953-816x.2001.01874.x. 
  22. ^ Watkins, K. E.; Strafella, A. P.; Paus, T. Seeing and hearing speech excites the motor system involved in speech production. Neuropsychologia. 2003, 41 (8): 989–994. PMID 12667534. doi:10.1016/s0028-3932(02)00316-0. 
  23. ^ Wilson, S. M.; Saygin, A. E. P.; Sereno, M. I.; Iacoboni, M. Listening to speech activates motor areas involved in speech production. Nature Neuroscience. 2004, 7 (7): 701–702. PMID 15184903. doi:10.1038/nn1263. 
  24. ^ Skipper, J. I.; Van Wassenhove, V.; Nusbaum, H. C.; Small, S. L. Hearing Lips and Seeing Voices: How Cortical Areas Supporting Speech Production Mediate Audiovisual Speech Perception. Cerebral Cortex. 2006, 17 (10): 2387–2399. PMC 2896890 . PMID 17218482. doi:10.1093/cercor/bhl147. 
  25. ^ Meister, I. G.; Wilson, S. M.; Deblieck, C.; Wu, A. D.; Iacoboni, M. The Essential Role of Premotor Cortex in Speech Perception. Current Biology. 2007, 17 (19): 1692–1696. PMC 5536895 . PMID 17900904. doi:10.1016/j.cub.2007.08.064. 
  26. ^ Pulvermuller, F.; Huss, M.; Kherif, F.; Moscoso del Prado Martin F; Hauk, O.; Shtyrov, Y. Motor cortex maps articulatory features of speech sounds. Proceedings of the National Academy of Sciences. 2006, 103 (20): 7865–7870. PMC 1472536 . PMID 16682637. doi:10.1073/pnas.0509989103. 
  27. ^ d'Ausilio, A.; Pulvermüller, F.; Salmas, P.; Bufalari, I.; Begliomini, C.; Fadiga, L. The Motor Somatotopy of Speech Perception. Current Biology. 2009, 19 (5): 381–385. PMID 19217297. doi:10.1016/j.cub.2009.01.017. 
  28. ^ Assaneo, M. Florencia; Poeppel, David. The coupling between auditory and motor cortices is rate-restricted: Evidence for an intrinsic speech-motor rhythm. Science Advances. 2018, 4 (2): eaao3842. PMC 5810610 . PMID 29441362. doi:10.1126/sciadv.aao3842. 
  29. ^ Rizzolatti, G.; Craighero, L. The Mirror-Neuron System. Annual Review of Neuroscience. 2004, 27: 169–192. PMID 15217330. doi:10.1146/annurev.neuro.27.070203.144230.  PDF頁面存檔備份,存於網際網路檔案館
  30. ^ Hommel, B.; Müsseler, J.; Aschersleben, G.; Prinz, W. The Theory of Event Coding (TEC): A framework for perception and action planning. The Behavioral and Brain Sciences. 2001, 24 (5): 849–878; discussion 878–937. PMID 12239891. doi:10.1017/s0140525x01000103. 
  31. ^ 31.0 31.1 Massaro, D. W. Perceiving talking faces: From speech perception to a behavioral principle. Cambridge, MA: MIT Press. 1997. ISBN 978-0-262-13337-1. 
  32. ^ Lane, H. The Motor Theory of Speech Perception: A Critical Review. Psychological Review. 1965, 72 (4): 275–309. PMID 14348425. doi:10.1037/h0021986. 
  33. ^ Tsao, F. M.; Liu, H. M.; Kuhl, P. K. Speech perception in infancy predicts language development in the second year of life: A longitudinal study. Child Development. 2004, 75 (4): 1067–84. PMID 15260865. doi:10.1111/j.1467-8624.2004.00726.x. 
  34. ^ MacNeilage, P. F.; Rootes, T. P.; Chase, R. A. Speech production and perception in a patient with severe impairment of somesthetic perception and motor control. Journal of Speech and Hearing Research. 1967, 10 (3): 449–67. PMID 6081929. doi:10.1044/jshr.1003.449. 
  35. ^ Hickok, G.; Poeppel, D. The cortical organization of speech processing. Nature Reviews Neuroscience. 2007, 8 (5): 393–402. PMID 17431404. doi:10.1038/nrn2113.  See page 394
  36. ^ Hickok, G.; Poeppel, D. The cortical organization of speech processing. Nature Reviews Neuroscience. 2007, 8 (5): 393–402. PMID 17431404. doi:10.1038/nrn2113.  See page 394
  37. ^ Williams, H.; Nottebohm, F. Auditory responses in avian vocal motor neurons: A motor theory for song perception in birds. Science. 1985, 229 (4710): 279–282. PMID 4012321. doi:10.1126/science.4012321.