预测编码 (神经科学)

预测编码（英语：Predictive coding ）也称为预测处理，是一种大脑功能理论，该理论认为大脑会不断地产生并更新环境的心理模型，预测感觉输入，并与实际感觉输入比较，产生预测误差，进而将这种误差用于更新和修正心理模型。

起源

预测编码理论最早可追溯至1860年亥姆霍兹提出的无意识推论（英语：Unconscious inference）。无意识推论的想法指的是，人脑会对收到的视觉资讯作出解释，让场景变得得以理解。举例来说，如果在视野中的某个事物比另一个对象来得小，那么大脑就会利用这些资讯作为物体深度的线索，这样一来，感知者就会不由自主地体验到深度。杰罗姆·布鲁纳持续地证实知觉是感觉刺激（自下而上）与概念知识（自上而下）之间的相互作用，他从1940年代开始研究需求、动机和期望影响知觉的方式，这项研究后来被称为“新风貌”心理学（ 'New Look' psychology）。 1981年，McClelland和Rumelhart在他们的开创性论文中^[1]，对处理特征（线条和轮廓）之间的相互作用进行了研究，这些处理特征被用于形成字母，又接着形成了单词。尽管这些特征能够让人联想到单词，但他们发现，当字母位于单词中时，比起位于没有语义脉络的非单词中，人们能够更快地辨识这些字母。 McClelland和Rumelhart的平行处理模型将知觉描述为自上而下（概念）元素和自下而上（感觉）元素的结合。

在1990年代后期，Rao和Ballard ^[2]（1999）将自上而下处理和自下而上处理的思想转化为视觉计算模型。他们的论文表明，可能存在一个场景的生成模型（自上而下处理），透过误差讯号（视觉输入与预测值相差多少），该模型将接收回馈进而更新预测。该计算模型能够重新仿制成熟的感受野效应，以及较不被理解的超经典感受野效应，如最终停止效应（英语：Hypercomplex cell）。现今，计算机科学和认知科学领域将整合这些类似概念，创造出作为机器学习和神经网络基础的多层生成模型。^[3]。

通用框架

大多数该领域的研究文献都与知觉相关，其中尤其是视觉，更加容易概念化。然而，预测编码框架也可以应用于不同的神经系统。以感觉系统为例，对感觉输入的末梢原因建模看似困难，但大脑透过某版本的贝叶斯推理解决了此问题。解决方案是通过来自大脑皮层层次中相对较高层次的反向连接，对较低层次的感觉输入进行预测建模来实现^[4]。受外部世界的统计规律性（和某些在演化上准备好的预测）的限制，大脑会在不同时序和空间的尺度上，对自上而下的生成模型进行编码，从而预测和有效地抑制从较低层次向上传送的感觉输入。预测（先验几率)和感觉输入（似然度）之间的比较会产生一个差异度量（如预测误差、自由能或意外），如果这个差异度量足够大，超过了预期的统计噪声基准值，就会更新生成模型，以致于未来能够更好地预测感觉输入。

相反，如果模型准确地预测了驱动的感觉讯号，那么，高层次的激活就会消除低层次的激活，模型的后验几率就会增加。因此，预测编码颠覆了知觉主要是自下而上过程的传统观点，说明了知觉在很大程度上受制于先前的预测，而来自外部世界的讯号只能在某种程度上塑造知觉，使它们以预测误差的形式在皮层中传播。

精度加权

人们所接收到的感觉，其输入精度（或反向变异数）的期望值对于有效减少预测误差而言至关重要，因为给定预测误差的精度期望值可以告知对该误差的置信度，这影响了在更新预测时误差加权的程度。 ^[5] 鉴于我们所生活的世界充满了统计噪声，因此必须将精度期望值表示为大脑生成模型的一部分，而且它们应该要能够灵活地适应变化的环境。例如，视觉预测误差的精度期望值可能会在黎明和黄昏之间发生变化，因此，跟黄昏时的预测误差相比，大白天的误差会被赋予更大的条件置信度。^[6] 近期有人提出，与估计精度成正比的预测误差之加权值，实质上就是注意力^[7] ，另外，投入注意力的过程可能是借由上行网状活化系统（ARAS）来优化预测误差单位的“增益”，进而在神经学上完成该过程。

主动推理

减少预测误差的原理已用于解释某种行为，即运动动作不是命令，而是本体感受的下行预测。在这种主动推理（英语：Free energy principle）方案中，经典的反射弧是协调的，以便有选择地对感觉输入进行采样，从而更好地实现预测，借此最小化本体感受的预测误差。^[7] 事实上，Adams等人（2013）在回顾了一些证据后表明，这种运动系统的阶层式预测编码的观点为解释运动皮层的无颗粒性组织提供了一个原则性的、神经上可信的框架。^[8]这种观点认为：“不应将知觉系统和运动系统视为独立的系统，而应将其视为单一的主动推理机器，它会设法预测所有领域的感觉输入：视觉、听觉、体觉（somatosensory）、内感受性（interoceptive），以及在运动系统情况下的本体感觉（proprioceptive）。”

预测编码中的神经理论

预测编码的经验证据在神经学上是否合理，这样的评估任务是广泛且多样的。首先，根据该模型，预测编码会发生在每个感知过程和认知过程的迭代步骤之中。因此，包括遗传、特定细胞结构、神经元的系统网络和全脑分析，都是预测编码在大脑中的表现形式。由于这种范围的特殊性，已经采用了各种可行的方法来研究预测编码的神经机制。然而，更一般而言，至少在与人类相关的情况下，这些潜在证据的研究以及许多其它工作都是基于对大脑中微电路的计算建模，方法上存在着明显的局限性。尽管如此，大量的理论工作已被应用于理解大脑中的预测编码机制。本节将关注涉及到预测编码现象的具体证据，而不是其它类似的东西，像是恒定状态（homeostasis）（尽管如此，这对于全面了解贝叶斯推断是不可或缺的一部分，已经得到了大量支持；请参阅Clark的评论^[4] ）。

早期将预测编码框架应用于神经机制的工作，大多是感觉神经元，尤其是在视觉皮层。 ^[2] ^[9]

然而，更一般地说，该理论似乎需要（至少）两种类型的神经元（在感知层次的每一个层次上）：一组神经元称作前馈投射，负责编码传入的感觉输入，另一组神经元称作回馈投射，负责向下传出预测。值得注意的是，这些神经元还必须带有误差检测的特性，这类具有这些特性的神经元仍有争议。 ^[10] ^[11] 这类神经元已在表面锥体神经元和非表面锥体神经元中找到证据。

在更全面的大脑层面上，有证据表明不同的皮层（ laminae）可以跨层次地整合前馈投影和回馈投影，这些皮层可分为颗粒状（granular）、无颗粒状（agranular）和异颗粒状（dysgranular），容纳了前面提到的神经元亚群，而皮层又可分为6个主要层。层内有相同的细胞结构，在不同层间却有所不同。例如，颗粒皮层的第4层含有兴奋性的颗粒细胞，并且会将丘脑皮层的输入分配给其它的皮层。根据其中一种模型：

......预测神经元......在无颗粒皮层的深层，通过投射将感觉预测......发送到异颗粒感觉皮层和颗粒感觉皮层的粒上皮层，从而驱动主动推理。预测-误差神经元......在颗粒皮层的粒上皮层那，计算感觉的预测讯号与接收讯号之间的误差，并通过投射......将预测-误差讯号送回无颗粒皮层区域的深层。精度细胞......会动态地调整预测和预测误差上的增益，从而使这些“取决于下行预测讯号的相对置信度或传入感觉讯号的可靠性”的讯号的权重降低(或是在某些情况下增加)。 ^[12]

总而言之，神经证据尚处于初期阶段。

预测编码的应用

知觉

预测编码在知觉处理方面的经验证据最为健全。早在1999年，Rao和Ballard就提出了一种阶层式的视觉处理（英语：Visual_processing）模型，在该模型中，高阶的视觉皮层区域会传送下行预测，而前馈联结会携带预测与实际低阶激活之间的残差误差。^[2] 在这个阶层式模型网络中，每一层(除最底层代表图像外)都试图通过回馈联结来预测下一个底层的响应，同时利用误差讯号对每一层输入讯号的估计值进行校正。^[2] Emberson等人利用跨模态的视听遗漏范式，建立了婴儿自上而下的调制方式，确定了即使是婴儿大脑也会对未来的感觉输入有所预期，而这种预期是从视觉皮层向下传送，并且能够进行基于预期的回馈。^[13] 功能性近红外光谱（fNIRS）的数据显示，婴儿枕叶皮层区对预期外的视觉遗漏做出反应（无视觉资讯输入），但是对预期内的视觉遗漏则无反应。这些结果表明，在阶层式组织的知觉系统中，高阶神经元会将预测向下传递给低阶神经元，而低阶神经元又将预测误差讯号向上发送回去。

内感受性

对于预测编码在内感受性（英语：Interoception）中的作用，已经有了几种模型在彼此竞争。

在2013年，亚尼·塞斯（Anil Seth）提出，我们的主观感觉状态（也就是所谓的情感）是由预测模型所生成的，而该预测模型又是由因果关系的内感受性评价所主动建立。^[11] 关于我们如何对他人的内部状态的进行归因，Sasha Ondobaka、James Kilner和Karl Friston（2015）提出，自由能原理要求大脑产生一系列连续的预测，目的在于减少作为 "自由能 "的预测误差。^[14] 这些误差接着会被用于对“外面的世界将会是什么样子”以及“对该世界状态的因果归因(包括对他人行为原因的理解)”的预期资讯进行建模。这一点尤其必要，为了产生这些归因，我们的多模态感觉系统需要内感受性预测来组织它们。因此，Ondobaka假定预测编码是理解他人内心状态的关键。

巴瑞特（Lisa Feldman Barrett）和西蒙斯（W. Kyle Simmons）（2015）在2015年提出了“体现的内感受性预测编码模型”，这是一种将贝叶斯主动推断原则与皮层联结的生理学框架相结合的框架。他们使用这种模型假设，无颗粒的内脏运动皮层（visceromotor cortices ）会负责产生有关内感受性的预测，从而定义了内感受性的经验。

2017年，巴瑞特（2017）提出了情感建构理论，这与“情感类别在生物学上有所不同”的归纳概念相反，生物情感类别是在概念类别的基础上建立起来的，也就是从有着共同目标的实例累积而来。 ^[15] ^[16] 在预测编码模型中，巴瑞特假设，在产生内感受性时，大脑会通过激活“体现模拟”（感觉体验的全身性表征）来调整我们的身体，从而预见“大脑会预测到什么感觉事物，是外部世界将要抛掷给我们的”以及“我们将如何采取行动应对”。如果根据我们大脑的预测，这些模拟能让我们为接下来发生在外部世界的事情做好准备，那么这些模拟就能保存下来；如果外部世界的实际情况与我们对它的准备程度不相称，那么这些模拟和我们的预测就会被调整，用来补偿这些误差。然后，在试错-调整的过程中，我们的身体会在某些成功的预期模拟中找到目标的相似性，并将其归入概念类别。每当一个新的经验出现时，我们的大脑就会利用过去的试错-调整历史，在累积至今的修正模拟中，找到一个最相似的类别，将其与新的经验匹配。然后，他们将该类别的修正模拟应用于新的经验，希望能让我们的身体为接下来的体验做好准备。如果找不到相似类别，则预测、模拟或甚至概念类别的边界都会被修改，以期望下次能有更高的准确度，然后这个过程会继续下去。巴瑞特假设，当对“与x类似的经验”进行模拟，某一类模拟的预测误差达到最小化时，会产生一种通告修正的模拟，身体会对每一次“与x类似的经验”进行重演，从而产生一种通告修正的全身性感觉经验表征——情感。在这个意义上，巴瑞特提出，我们之所以会建构情感，是因为我们的大脑用概念类别框架来比较新经验，以及挑选合适的预测性感觉模拟来激活，情感是在过程中建立起来的。

挑战

作为一种机械论的理论，预测编码尚未在神经元层次上进行生理学对映。该理论面临的最大挑战之一是最小化预测误差的具体工作方式不够确切。^[17]在一些研究中，BOLD讯号的增加被解释为误差讯号，而在另一些研究中，它则表明了输入表征发生改变。需要解决的一个关键问题是，误差信号到底是由什么构成，以及它是如何在资讯处理的每一个层次上计算。^[18]另一个挑战是预测编码的计算可解性。根据Kwisthout和van Rooij的说法，预测编码框架每一层的子计算都潜藏了一个计算的难解问题，这相当于计算建模者还需要克服的“棘手的障碍”。^[19]Ransom和Fazelpour（2015）则指出“注意力预测编码理论的三个问题”。^[20]

未来对预测编码的研究，可能会集中在阐明其神经生理机制和计算模型上。

参见

蓝脑计划
认知生物学（英语：Cognitive biology）
认知语言学
认知神经心理学（英语：Cognitive neuropsychology）
认知神经科学
认知科学
概念混成理论
概念隐喻
体化双语（英语：Embodied bilingual language）
体化认知科学（英语：Embodied cognitive science）
体化嵌入式认知（英语：Embodied Embedded Cognition）
体化音乐认知（英语：Embodied music cognition）
生成主义（英语：Enactivism）
外延认知（英语：Extended cognition）
外延心灵论（英语：Extended mind thesis）
外在主义（英语：Externalism）
图像基模（英语：Image schema）
记忆预测框架（英语：Memory-prediction framework）
莫拉维克悖论
神经建构主义（英语：Neuroconstructivism）
神经心理学
神经现象学
心灵哲学
植物认知（英语：Plant cognition）
情境认知（英语：Situated cognition）
《数学从何而来》（英语：Where Mathematics Comes From）

参考文献

^ McClelland, J. L. & Rumelhart, D. E. An interactive activation model of context effects in letter perception: I. An account of basic findings. Psychological Review. 1981, 88 (5): 375–407. doi:10.1037/0033-295X.88.5.375.
^ ^2.0 ^2.1 ^2.2 ^2.3 Rajesh P. N. Rao & Dana H. Ballard. (1999).
^ Hinton, G. E. (2007).
^ ^4.0 ^4.1 Clark, A. (2013).
^ Feldman, H., & Friston, K. (2010).
^ Hohwy, J. (2012).
^ ^7.0 ^7.1 Friston, K. (2009).
^ Adams, R. A., Shipp, S., & Friston, K. J. (2013).
^ Bolz, J., & Gilbert, C. D. (1986).
^ Koster-Hale, Jorie; Saxe, Rebecca. Theory of Mind: A Neural Prediction Problem. Neuron. 2013-09-04, 79 (5): 836–848 [2020-07-04]. ISSN 0896-6273. doi:10.1016/j.neuron.2013.08.020. （原始内容存档于2021-05-04）（英语）.
^ ^11.0 ^11.1 Seth, A. K. (2013).
^ Barrett, L. F., & Simmons, W. K. (2015).
^ Emberson, L. L., Richards, J. E., & Aslin, R. N. (2015).
^ Ondobaka, S., Kilner, J., & Friston, K. (2017).
^ Barrett, L. F. (2017).
^ Barrett, L.F. (2017).
^ Kogo, N., & Trengove, C. (2015).
^ Bastos, A. M., Usrey, W. M., Adams, R. A., Mangun, G. R., Fries, P., & Friston, K. J. (2012).
^ Kwisthout, J., van Rooij, I. (2019).
^ Ransom M. & Fazelpour S (2015).

[1] McClelland, J. L. & Rumelhart, D. E. An interactive activation model of context effects in letter perception: I. An account of basic findings. Psychological Review. 1981, 88 (5): 375–407. doi:10.1037/0033-295X.88.5.375.

[rb2-2] 2.0 ^2.1 ^2.2 ^2.3 Rajesh P. N. Rao & Dana H. Ballard. (1999).

[3] Hinton, G. E. (2007).

[:02-4] 4.0 ^4.1 Clark, A. (2013).

[5] Feldman, H., & Friston, K. (2010).

[6] Hohwy, J. (2012).

[kf-7] 7.0 ^7.1 Friston, K. (2009).

[:1-8] Adams, R. A., Shipp, S., & Friston, K. J. (2013).

[9] Bolz, J., & Gilbert, C. D. (1986).

[10] Koster-Hale, Jorie; Saxe, Rebecca. Theory of Mind: A Neural Prediction Problem. Neuron. 2013-09-04, 79 (5): 836–848 [2020-07-04]. ISSN 0896-6273. doi:10.1016/j.neuron.2013.08.020. （原始内容存档于2021-05-04）（英语）.

[as-11] 11.0 ^11.1 Seth, A. K. (2013).

[12] Barrett, L. F., & Simmons, W. K. (2015).

[13] Emberson, L. L., Richards, J. E., & Aslin, R. N. (2015).

[14] Ondobaka, S., Kilner, J., & Friston, K. (2017).

[15] Barrett, L. F. (2017).

[16] Barrett, L.F. (2017).

[kt-17] Kogo, N., & Trengove, C. (2015).

[18] Bastos, A. M., Usrey, W. M., Adams, R. A., Mangun, G. R., Fries, P., & Friston, K. J. (2012).

[19] Kwisthout, J., van Rooij, I. (2019).

[20] Ransom M. & Fazelpour S (2015).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]