言语知觉的运动理论

言语知觉的运动理论(Motor theory of speech perception),是一种认为人们通过辨认发音的声道姿势而非语言的发音习惯来理解话语的假说[1][2][3][4][5]。它最初声称言语知觉是通过一个人类天生特有的特殊模块完成的。虽然这个模块在近几年的理论中得到认证,[5]但人们还是认为言语运动系统的角色不仅是产生发音,还有检测它们。

当我们听到口语时,会感觉到它们由听觉声音构成。言语知觉的运动理论认为,我们听到声音的背后机制是来自声带的预期运动。

相比于言语知觉这个领域,该假设在领域外获得的关注更多。而镜像神经元的发现使得其关注度更加高。镜像神经元将运动的产生与认知联系起来,其中包括了由声道产生的运动[5]

该理论最初由阿尔文·利伯曼富兰克林·库珀于20世纪50年代在哈斯金斯实验室提出。并由唐纳德·尚克韦勒迈克尔·斯塔德特·肯尼迪伊格内修斯·马丁利卡罗尔·福勒以及道格拉斯·惠伦进一步发展。

起源和发展

编辑

该假说起源于运用模式播放为盲人创造取代拼写字母的声音的阅读机的研究[6]。这导致了一次有关讲话声音如何与其声谱图的听音序列相对应的仔细检查。这才发现,连续辅音元音彼此同时重叠(这种现象被称为协同发音)[7][8][9]。这表明,言语不是听觉的“字母表”或“密码”,而是重叠的语言姿势的“代码”。

连结论者的方法

编辑

最初,该理论由连结论者提出:婴儿模仿他们听到的语言,这导致了发音与其感官后果行为上的关联。然后,这种明显的模仿会被绕过[8],并成为言语知觉。然而,随着研究发现语言前的婴儿已经能够检测出大部分用来分隔不同的语音的语音对比,这方面的理论被放弃了[1]

认知主义的方法

编辑

行为主义的方法是被有语言模块[1]的认知主义取代的。这个模块通过隐藏的远端对象来检测言语,而不是在它们的近端或直接输入处。这方面的证据是,研究发现,语言处理是很特殊的,例如双工认知[10]

改变远端对象

编辑

言语知觉最初的假设是与以下的发音对象关联的:

  • 语音发音器官的不变运动[8]
  • 传达到肌肉导致声道发声运动的不变运动指令[11]

后来这被修改为包括语音姿势,而不是运动指令;而语音姿势是说话人声前和语言的层面控制的,而不是实际的运动[12]

近代的修改

编辑

由于研究发现,言语知觉可能发生于非语言的声音(例如,摔门为双工感知[13]),“言语是特殊的”的这一主张已经被放弃[5]

镜像神经元

编辑

镜像神经元的发现已经引起了在言语知觉的运动理论方面新的兴趣,而这一理论也仍旧有其拥护者[8],虽然也有批评[14]

支持

编辑

非听觉姿势信息

编辑

如果说语言是通过它的物理产生来识别的,那么非听觉信息则应纳入言语知觉,即使这仍然是主观听到的“声音”。但事实正是如此。

麦格克效应表明眼睛看到的口语音节的产生不同于与其同步的听觉提示,这会影响听觉的认知。换句话说,如果有人听到“ba”,但看到视频的人发音“ga”,他们所听到是与之不同的——有些人会认为,他们听到的是“da”。

  • 人们发现在噪音中,如果他们能看到说话者,会更容易听到讲话内容。[15]
  • 当音节的产生能够凭触觉感知到时,人们能更好地听到它们。[16]

类别知觉

编辑

使用言语合成器时,语音可以沿着一个连续的发音位置变化,从/ba/到/da/到/ga/,或语音发生时间的连续(例如/da/到/ta/)。当听者被要求区分两个不同的声音时,他们认为这属于非连续的声音,虽然声音是连续变化的。换句话说,十种声音(从一个声音的极端/da/到另一个极端/ta/,以及中间按比例变化的声音)可以全部是声学上彼此不同的,但听者将把这些声音全部听成/da/或/ta/。同样,英语辅音/ d /在不同的语音语境中可能会有听觉细节上的不同(例如,/du/和/di/中的/d/严格来说发音并不相同),但所有/d/’ 听者都会归为同一类(浊齿龈塞音),这是因为“语言表述是抽象和规范的语音部分或其背后的发音姿势。[17]” 这表明,人类通过类别知觉识别语音。因此,像言语知觉的运动理论所提出的专门模块,有可能是正确的[18]

言语模仿

编辑

如果人们能听到讲话的姿势,那么言语的模仿应该是非常快的,这种语音投影如同在耳机中听到的重复单词一样[19]。人们能够以比正常发声更快的速度重复听到的音节[20]

言语产生

编辑
  • 听音能够刺激声道肌肉[21],运动皮层[22]和前运动皮层[23]。言语知觉的听觉和视觉输入整合也涉及这些区域[24]
  • 扰乱前运动皮层也会破坏语音单位的认知,如爆破音[25]
  • 同产生语音姿势的声道发声器官有关的音位特征会激活运动区[26]
  • 讲话声音的感知是借助于先发制人地刺激发声器官的运动表达[27]
  • 听觉和运动皮层的耦合被限制在特定的神经元放电频率范围内[28]

知觉行动啮合

编辑

有证据表明,知觉和产生一般在运动系统中是相联系的。这由镜像神经元的存在佐证。当看到(或听到)动作,或动作开展时镜像神经元都会被激活[29]。另一个证据来源是用于感知和行动之间表达的共同编码理论[30]

批评

编辑

虽然在其他领域,例如理论语言学,更加受欢迎;言知觉的运动理论并没有在言语知觉领域被广泛接纳。如其三个倡导者所指出的,“在言语知觉领域里,它的支持者很少。许多作者引用它主要是为了提出批评性的评论[5]”,对此有几种批评意见。[31][32]

多个来源

编辑

言语知觉受非产生性的信息来源的影响,例如语境。单词单独出现时很难理解,但在句子语境中却很容易听到。因此,似乎言语知觉以最佳的方式整合多个来源的信息。[31]

产生

编辑

言语知觉的运动理论预测,婴幼儿的言语运动能力预示他们的言语知觉能力,但实际上是相反的[33]。该理论也预测言语产生中的缺陷将削弱言语知觉,但实际上不会[34]。然而,这只会影响最初的已经被取代的行为主义的理论版本,其中认为婴幼儿应该通过儿童早期的模仿来学习所有的产生-知觉模式。而这已不再是运动-言语理论家的主流意见了。

语言模块

编辑
  • 多方的证据都没能支持专门的语言模块这一想法。
  • 双工感知可以通过摔门观察到[13]
  • 麦格克效应也可以通过非语言刺激实现,如播放一段篮球弹动视频,但是播放乒乓球弹动的声音[来源请求]
  • 至于类别知觉,听者对单一语音类别的声音差异也可能很敏感。

因此,这部分的理论已经被一些研究者放弃了[5]

次词汇任务

编辑

为言语知觉的运动理论提供的证据仅限于例如使用不充分的言词或口语句子这类言语单位来辨别音节。因此,“言语知觉有时被理解成是次词汇层面的言语的感知。然而,这些研究的最终目标大概是为了理解支持生态有效的条件下处理语言能力的神经过程,即语音的成功处理最终引起与心理词汇和听觉理解的联系[35]。但这里有一个问题:“与其隐含的研究目的,语音识别之间的牵强联系”[36]

模仿

编辑

言语知觉的运动理论面临一个问题:研究言语知觉与言语产生的联系,与大脑处理模仿说出的话也是一致的。只要语言存在,大脑就必须有方法做到这一点。因为孩子词汇量的扩展需要通过学习新颖的口语词汇的方法完成,就像成年人学会新的名字。模仿要由所有的发声法开始,因为只有听到一个生词,以及需要用于识别它的发音姿势和运动目标消失之后,才能知道它的新颖。因此,声音模仿需要从把每一个听到的发音法默认到短期记忆开始。如果言语知觉使用多个来源的信息,这个默认的模仿过程会为词语认知提供辅助帮助。模仿主要的需求在于非固有词语的发声法,这也许能够解释为什么次词汇任务没有将固有词汇与运动姿势处理紧密结合。

鸟类

编辑

有人提出鸟类也能听到彼此鸣唱的声音姿势。[37]

参见

编辑

参考文献

编辑
  1. ^ 1.0 1.1 1.2 Liberman, A. M.; Cooper, F. S.; Shankweiler, D. P.; Studdert-Kennedy, M. Perception of the speech code. Psychological Review. 1967, 74 (6): 431–461. PMID 4170865. doi:10.1037/h0020279. 
  2. ^ Liberman, A. M.; Mattingly, I. G. The motor theory of speech perception revised. Cognition. 1985, 21 (1): 1–36. CiteSeerX 10.1.1.330.220 . PMID 4075760. doi:10.1016/0010-0277(85)90021-6. 
  3. ^ Liberman, A. M.; Mattingly, I. G. A specialization for speech perception. Science. 1989, 243 (4890): 489–494. PMID 2643163. doi:10.1126/science.2643163. 
  4. ^ Liberman, A. M.; Whalen, D. H. On the relation of speech to language. Trends in Cognitive Sciences. 2000, 4 (5): 187–196. PMID 10782105. doi:10.1016/S1364-6613(00)01471-6. 
  5. ^ 5.0 5.1 5.2 5.3 5.4 5.5 Galantucci, B.; Fowler, C. A.; Turvey, M. T. The motor theory of speech perception reviewed. Psychonomic Bulletin & Review. 2006, 13 (3): 361–377. PMC 2746041 . PMID 17048719. doi:10.3758/bf03193857. 
  6. ^ Liberman, A. M. (1996). Speech: A special code. Cambridge, MA: MIT Press. ISBN 978-0-262-12192-7
  7. ^ Liberman, A. M.; Delattre, P.; Cooper, F. S. The role of selected stimulus-variables in the perception of the unvoiced stop consonants. The American Journal of Psychology. 1952, 65 (4): 497–516. JSTOR 1418032. PMID 12996688. doi:10.2307/1418032. 
  8. ^ 8.0 8.1 8.2 8.3 Liberman, A. M.; Delattre, P. C.; Cooper, F. S.; Gerstman, L. J. The role of consonant-vowel transitions in the perception of the stop and nasal consonants. Psychological Monographs: General and Applied. 1954, 68 (8): 1–13. doi:10.1037/h0093673.  PDF页面存档备份,存于互联网档案馆
  9. ^ Fowler, C. A.; Saltzman, E. Coordination and coarticulation in speech production. Language and Speech. 1993,. 36 ( Pt 2-3) (2–3): 171–195. PMID 8277807. doi:10.1177/002383099303600304.  PDF页面存档备份,存于互联网档案馆
  10. ^ Liberman, A. M.; Isenberg, D.; Rakerd, B. Duplex perception of cues for stop consonants: Evidence for a phonetic mode. Perception & Psychophysics. 1981, 30 (2): 133–143. PMID 7301513. doi:10.3758/bf03204471. 
  11. ^ Liberman, A. M. The grammars of speech and language (PDF). Cognitive Psychology. 1970, 1 (4): 301–323 [2019-09-24]. doi:10.1016/0010-0285(70)90018-6. (原始内容存档 (PDF)于2015-12-31). 
  12. ^ Liberman, A. M.; Mattingly, I. G. The motor theory of speech perception revised (PDF). Cognition. 1985, 21 (1): 1–36 [2019-09-24]. CiteSeerX 10.1.1.330.220 . PMID 4075760. doi:10.1016/0010-0277(85)90021-6. (原始内容存档 (PDF)于2021-04-15). 
  13. ^ 13.0 13.1 Fowler, C. A.; Rosenblum, L. D. Duplex perception: A comparison of monosyllables and slamming doors. Journal of Experimental Psychology. Human Perception and Performance. 1990, 16 (4): 742–754. PMID 2148589. doi:10.1037/0096-1523.16.4.742. 
  14. ^ Massaro, D. W.; Chen, T. H. The motor theory of speech perception revisited. Psychonomic Bulletin & Review. 2008, 15 (2): 453–457; discussion 457–62. PMID 18488668. doi:10.3758/pbr.15.2.453. 
  15. ^ MacLeod, A.; Summerfield, Q. Quantifying the contribution of vision to speech perception in noise. British Journal of Audiology. 1987, 21 (2): 131–141. PMID 3594015. doi:10.3109/03005368709077786. 
  16. ^ Fowler, C. A.; Dekle, D. J. Listening with eye and hand: Cross-modal contributions to speech perception. Journal of Experimental Psychology. Human Perception and Performance. 1991, 17 (3): 816–828. PMID 1834793. doi:10.1037/0096-1523.17.3.816. 
  17. ^ Nygaard LC, Pisoni DB. Speech Perception: New Directions in Research and Theory. J.L. Miller, P.D. Eimas (编). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press. 1995. ISBN 978-0-12-497770-9. 
  18. ^ Liberman, A. M.; Harris, K. S.; Hoffman, H. S.; Griffith, B. C. The discrimination of speech sounds within and across phoneme boundaries. Journal of Experimental Psychology. 1957, 54 (5): 358–368. PMID 13481283. doi:10.1037/h0044417. 
  19. ^ Marslen-Wilson, W. Linguistic structure and speech shadowing at very short latencies. Nature. 1973, 244 (5417): 522–523. PMID 4621131. doi:10.1038/244522a0. 
  20. ^ Porter Jr, R. J.; Lubker, J. F. Rapid reproduction of vowel-vowel sequences: Evidence for a fast and direct acoustic-motoric linkage in speech. Journal of Speech and Hearing Research. 1980, 23 (3): 593–602. PMID 7421161. doi:10.1044/jshr.2303.593. 
  21. ^ Fadiga, L.; Craighero, L.; Buccino, G.; Rizzolatti, G. Speech listening specifically modulates the excitability of tongue muscles: A TMS study. The European Journal of Neuroscience. 2002, 15 (2): 399–402. CiteSeerX 10.1.1.169.4261 . PMID 11849307. doi:10.1046/j.0953-816x.2001.01874.x. 
  22. ^ Watkins, K. E.; Strafella, A. P.; Paus, T. Seeing and hearing speech excites the motor system involved in speech production. Neuropsychologia. 2003, 41 (8): 989–994. PMID 12667534. doi:10.1016/s0028-3932(02)00316-0. 
  23. ^ Wilson, S. M.; Saygin, A. E. P.; Sereno, M. I.; Iacoboni, M. Listening to speech activates motor areas involved in speech production. Nature Neuroscience. 2004, 7 (7): 701–702. PMID 15184903. doi:10.1038/nn1263. 
  24. ^ Skipper, J. I.; Van Wassenhove, V.; Nusbaum, H. C.; Small, S. L. Hearing Lips and Seeing Voices: How Cortical Areas Supporting Speech Production Mediate Audiovisual Speech Perception. Cerebral Cortex. 2006, 17 (10): 2387–2399. PMC 2896890 . PMID 17218482. doi:10.1093/cercor/bhl147. 
  25. ^ Meister, I. G.; Wilson, S. M.; Deblieck, C.; Wu, A. D.; Iacoboni, M. The Essential Role of Premotor Cortex in Speech Perception. Current Biology. 2007, 17 (19): 1692–1696. PMC 5536895 . PMID 17900904. doi:10.1016/j.cub.2007.08.064. 
  26. ^ Pulvermuller, F.; Huss, M.; Kherif, F.; Moscoso del Prado Martin F; Hauk, O.; Shtyrov, Y. Motor cortex maps articulatory features of speech sounds. Proceedings of the National Academy of Sciences. 2006, 103 (20): 7865–7870. PMC 1472536 . PMID 16682637. doi:10.1073/pnas.0509989103. 
  27. ^ d'Ausilio, A.; Pulvermüller, F.; Salmas, P.; Bufalari, I.; Begliomini, C.; Fadiga, L. The Motor Somatotopy of Speech Perception. Current Biology. 2009, 19 (5): 381–385. PMID 19217297. doi:10.1016/j.cub.2009.01.017. 
  28. ^ Assaneo, M. Florencia; Poeppel, David. The coupling between auditory and motor cortices is rate-restricted: Evidence for an intrinsic speech-motor rhythm. Science Advances. 2018, 4 (2): eaao3842. PMC 5810610 . PMID 29441362. doi:10.1126/sciadv.aao3842. 
  29. ^ Rizzolatti, G.; Craighero, L. The Mirror-Neuron System. Annual Review of Neuroscience. 2004, 27: 169–192. PMID 15217330. doi:10.1146/annurev.neuro.27.070203.144230.  PDF页面存档备份,存于互联网档案馆
  30. ^ Hommel, B.; Müsseler, J.; Aschersleben, G.; Prinz, W. The Theory of Event Coding (TEC): A framework for perception and action planning. The Behavioral and Brain Sciences. 2001, 24 (5): 849–878; discussion 878–937. PMID 12239891. doi:10.1017/s0140525x01000103. 
  31. ^ 31.0 31.1 Massaro, D. W. Perceiving talking faces: From speech perception to a behavioral principle. Cambridge, MA: MIT Press. 1997. ISBN 978-0-262-13337-1. 
  32. ^ Lane, H. The Motor Theory of Speech Perception: A Critical Review. Psychological Review. 1965, 72 (4): 275–309. PMID 14348425. doi:10.1037/h0021986. 
  33. ^ Tsao, F. M.; Liu, H. M.; Kuhl, P. K. Speech perception in infancy predicts language development in the second year of life: A longitudinal study. Child Development. 2004, 75 (4): 1067–84. PMID 15260865. doi:10.1111/j.1467-8624.2004.00726.x. 
  34. ^ MacNeilage, P. F.; Rootes, T. P.; Chase, R. A. Speech production and perception in a patient with severe impairment of somesthetic perception and motor control. Journal of Speech and Hearing Research. 1967, 10 (3): 449–67. PMID 6081929. doi:10.1044/jshr.1003.449. 
  35. ^ Hickok, G.; Poeppel, D. The cortical organization of speech processing. Nature Reviews Neuroscience. 2007, 8 (5): 393–402. PMID 17431404. doi:10.1038/nrn2113.  See page 394
  36. ^ Hickok, G.; Poeppel, D. The cortical organization of speech processing. Nature Reviews Neuroscience. 2007, 8 (5): 393–402. PMID 17431404. doi:10.1038/nrn2113.  See page 394
  37. ^ Williams, H.; Nottebohm, F. Auditory responses in avian vocal motor neurons: A motor theory for song perception in birds. Science. 1985, 229 (4710): 279–282. PMID 4012321. doi:10.1126/science.4012321.