APP下载

预测性编码在视听觉神经活动中的典型表征*

2023-07-19孟佳圆姚旺孟强帆李小语王昊许敏鹏明东

生物化学与生物物理进展 2023年7期
关键词:预测性层级预期

孟佳圆 姚旺 孟强帆 李小语 王昊 许敏鹏* 明东*

(1)天津大学医学工程与转化医学研究院,天津 300072;2)天津大学精密仪器与光电子工程学院,天津 300072)

大脑怎样感知外部世界并与其进行高效交互,一直是认知及计算神经科学关注的重要问题之一[1]。传统理论将大脑看作外部世界的“反应器”,认为其主要运行模式为刺激驱动,即大脑被动等待感觉输入并机械地进行处理。但是,上述理论无法解释许多神经生理现象,如感知觉的形成与表达受先验知识的调制[2],再如,即使无外界刺激神经元仍可在很长一段时间内维持活跃[3]。对此,越来越多研究表明,大脑是外部世界的“预测器”,它能主动地推测外部世界并与其进行高效交互[1]。

大脑具有预期功能的观点可追溯至1860年,亥姆霍兹提出大脑对世界的感知是基于概率、知识驱动的推测过程[4],并逐渐演化为贝叶斯大脑理论。该理论认为大脑能基于先验知识计算可能性最大的情况以预测外部世界,再结合当前输入,对即将到来的感觉信息做出合理解释,采取适当对应措施[5],即,过去的经验和当前的体验,共同影响大脑对某事件发生概率的判断,这革新了神经科学对大脑工作方式的理解。然而,该理论尚未明确其如何通过神经回路实现。为此,预测性编码(predictive coding)应运而生,这种生成模型为大脑如何进行贝叶斯推断提供了具体的神经实现[6]。

预测性编码已成为神经感知理论的重要组成部分[1],其发展与神经生理研究相互促进:模型为阐释传统观点难以理解的现象提供新视角;对相关神经活动的深入研究则为完善模型提供新证据。目前,预测性编码的神经生理研究主要包括预期与感觉输入的相互作用、预期独立于外界刺激的内源性神经表征、预期的层级式神经信息处理架构等,本文主要围绕以上三个方面展开。

1 神经系统中的预测性编码

预测性编码的概念源自通信领域,是一种仅对相邻数据间的差异进行编解码的信息压缩技术[4]。1999年,Rao和Ballard[7]将预测编码概念引入神经生理研究,成功解释了非典型视觉感受野“末端停止(end-stopping)”现象。此后,研究者们在多种神经结构及环路中发现了支持该理论的神经证据[2-6],预测性编码的神经生理研究就此进入快速发展阶段。

预测性编码描述了在大脑层级式信息处理框架中预期和感觉输入相互作用的过程[7]。层级式处理是大脑的基本工作原则之一,在不同脑区之间或同一脑区内均存在分级的信息处理架构。在分级结构中,处在越低层级的神经元集群所处理的特征越简单,随着层级升高,神经元集群所处理的特征渐趋复杂[7-8]。以视觉皮层为例(图1a),底层神经元(初级视觉皮层)主要编码特定方位或运动方向的线段,次底层编码二维图形,更高层的神经元负责处理三维信息,以此类推。在相邻层级间,较低层级的输出将作为相邻的高一层级神经元的输入来参与其神经活动。这种环环相扣、各层级同步处理的架构极大地提升了神经信息处理的灵活性及效率[8]。

Fig. 1 The illustrations of the predictive coding model[7]图1 预测性编码的结构示意图[7]

图1b简述了预期与感觉输入的双向信息流在不同层级间的相互作用,即预期信号(rtd)以预期模板的形式存储在各层级的预测估计模块(predictive estimator,PE)中,自上而下地调制下一级的神经活动,预期与感觉输入间的预测误差自下而上地传递至邻近的上一级。预测性编码假设,预期与感觉输入在层级内的相互作用过程中,预期信号和预测误差的编码分别由表示神经单元R单元(representational unit,R unit)和误差神经单元E单元(error unit,E unit)执行,其中,R单元负责编码对感觉信息的估计(rtd),并传递至邻近的下一级,E单元主要负责检测、编码预测误差(rtd-r),并将其传递至邻近的上一级,两类功能单元在层级内不断地迭代交互,每个层级都在不同特征范围上进行类似的活动。此外,近年的研究将E单元的功能进一步细化,用以解释在预期与感觉输入的相互作用过程中,有预期却无刺激出现时的特异性神经活动[4]。图1c描述了层级内的神经活动:当感觉信息到来时,各信息处理层级中均进行着当前信号(r)与预期模板的比较(特征匹配,rtd-r),该匹配过程产生的预测误差(r-rtd)将被自下而上地传递至邻近的上一级,以此不断调整预测估计模块中的预期状态。

预测性编码与传统神经感知理论最主要的区别在于:传统观点中自下而上的信息流编码和传递的是刺激特征本身;而预测性编码中自下而上的信息流编码和传递的是当前特征与初始预期之间的差异,大脑将预测误差作为反馈用来完善自行建好的“预期模板”[4]。预测性编码可为生物的适应性行为提供基础神经保障,具体体现在:a. 降低能耗,预测性编码有效避免对可预测信息的重复编码,使大脑不会因长期、持续进行大规模编码而产生疲劳及过度消耗[4]。b. 加快反应速度且维持内在稳态,Ashby等[9]控制论学者指出施动者对环境扰动的最佳反应是预先行动,即施动者在环境变化前已准备好比应对环境扰动所需更多的状态总数、且知道用怎样的状态应对环境变化,预测性编码能根据先验信息对即将到来的感觉输入做出多种具有不同可能性的推断,这既增加了大脑对应各种情况的能力,也使其能“及时”对环境做出反应。

2 视听觉神经活动中预期与感觉输入相互作用的典型表征

2.1 常用的预期诱发范式

预期与感觉输入相互作用的神经特征及机制研究的基本方法是:比较刺激与预期匹配和失匹时的神经活动差异。因此,有效建立预期并调制其匹配状态至关重要。Oddball序列、双刺激匹配任务、关联学习、上下文语/环境提示等都是建立预期的常用范式。

Oddball序列通过反复呈现相同或相似的视/听觉刺激(概率通常>75%),使受试者基于大概率事件形成对即将到来感觉信息的估计。若实际刺激与大概率刺激相同,则预期匹配;若出现偏差(rare deviants)或新异(novel)刺激,则预期失匹[10-16]。图2列举了典型oddball序列,图2a为等间隔音调oddball序列,若新异刺激为不同的音调,可用于研究内容预期[10,13-14],若新异刺激为不同时间间隔,可研究时间预期[15]。视觉oddball范式同理[16]。图2b为基于模糊刺激的oddball序列,重复出现的图片/音频的清晰度周期性变化,重点研究低清晰度处,实际刺激与预期相同、相异时的神经特征[11]。近年来,为研究预测性编码相关的状态更新,“流动标准”(roving standard)oddball序列被提出(图2c),某一序列重复出现一段时间后将变换成其他序列,通过观测新序列中前几个试次的神经响应变化规律探究预期的信息更新机制[17-19]。还有研究者设计了局部偏差递进式“流动标准”重复序列(图2d)[12-13],用于研究不同层级预期的信息处理。

Fig. 2 Typical oddball sequence of stimuli图2 常见的oddball刺激序列

双刺激匹配、关联学习任务也能有效建立预期并调制匹配状态,且在单模态、跨模态研究中均适用[20]。双刺激任务通常要求受试者比较第二个刺激与第一个是否相同[21],或两刺激之间的间隔是否为预期时长[22]。关联学习多借助大概率事件建立提示与某种刺激特征的关联来形成预期,例如提示分别为高、低音时,随后光栅的方向分别大概率为45°和135°[23]。与oddball范式相比,上述任务通过减少重复性刺激的呈现次数降低了外部刺激对内源性神经表征的干扰,为研究自上而下的神经过程提供了便利。此外,预期还可通过上下文/环境提示形成,这种预期建立方法场景更复杂、预期更抽象。如,轨迹、方向估计任务[23-25];再如,情绪提示词为“快乐”,后续场景为抚摸宠物则预期匹配,场景为被宠物咬了则预期失匹[26]。

音调、光栅、人脸和房子等均是视听觉预期研究的常用素材。使用光栅是因为特定方向的线是最基本的视觉信息且已有较系统的研究[16-17];使用人脸和房子是由于其有经过系统研究的专属脑区:梭形面部区域(fusiform facial area,FFA)和海马旁区(parahippocampal area,PPA),便于预期研究的空间定位[21,27]。还需说明的是,此处列举的皆为经典范式,随着预测性编码研究的深入,研究者们多根据自己的研究目的,在经典范式的基础上进行改进,从而完成更复杂、多层级的预期研究。

2.2 预测误差与“预期抑制”现象

预测误差(prediction error)的编码与表达是预测性编码的核心内容之一,它可分为正向和负向两种。正向预测误差可理解为冗余压缩机制,主要出现在刺激与预期匹配的情况下,即在相邻的信息处理层级之间,自上而下的预期抑制了(explain away)对临近下一级可预测的自下而上感觉输入的神经编码。其中,“可预测”既可通过先验知识或重复性刺激构建,也可基于自发运动形成。负向预测误差主要出现在刺激违背预期时,其编码和传递促进了内在预期模型的更新,并诱发更大的神经响应[28]。上述两种预测误差宏观上均表现为“预期抑制”,即相比于违背预期,符合预期的刺激所诱发的神经响应反而更小。如表1所示,多项功能性磁共振成像(fMRI)研究报告了匹配小于失匹响应的现象,事件相关电位(event-related potential,ERP)研究亦报告了N1、P1、N2、P3等成分在特定任务中的预期抑制现象,灵长类动物细胞水平研究亦证实了上述现象。失匹配负波(mismatch negativity,MMN)、重复性抑制(repetition suppression,RS)、错误相关负波(error-related negativity,ERN)等典型神经活动与预期抑制均有一定关系。

Table 1 The phenomena of “expectation suppression” in visual and auditory sensory processing表1 视、听觉神经活动中的“预期抑制”现象

2.2.1 失匹配负波与重复性抑制

失匹配负波(MMN)多由oddball序列中的偏差或新异刺激诱发,宏观上表现为刺激后100~200 ms前额及中央脑区的负向脑电波形,其幅度、潜伏期等特征的特异性变化有望成为精神分裂症[33-34]、自闭症[35]、痴呆[36]、现实感缺失[37]等神经或精神疾病的神经标记。关于MMN与预测性编码的关系,Wacongne等[38]将神经建模与实验数据结合,证明听觉MMN来自主动皮层预测,而非被动突触习惯;Stefanics等[39]在视觉模态证明了MMN是精度加权后预测误差的神经表征,这些研究认为MMN表征了当前刺激与基于先验信息的预期之间的差异,且先验信息是从刺激序列中提取出的更复杂或抽象的规律。预期的分级研究多将MMN作为低层级预测误差的主要表征[10]。但是,到底是神经适应、还是预测性编码、或是两者共同作用的结果产生了MMN及RS现象,仍有待进一步探究。

RS常出现在oddball范式和双刺激匹配过程中。对于RS与预测性编码的关系,Summerfield等[40]通过设计重复概率调制的人脸匹配任务首次证明RS现象并非简单的神经适应,而是有自上而下预期参与的信息处理,而Gotts等[41]则认为神经适应才是RS形成的主要原因。现有RS与预期抑制区别与联系的主要结果包括:RS对简单刺激的响应更强,反映的是低层级的预测误差处理;预期抑制主要应对复杂或抽象刺激,表征高层级的预测误差编码[10];在脑区分布上,RS多出现在初级感觉皮层,预期抑制分布更广泛,且在更高层级的前额处更明显;时间进程上,RS多出现在视觉100~250 ms或听觉40~60 ms,预期抑制则在视觉300 ms后或听觉100~200 ms最明显,符合信息从初级感觉皮层向更高层级传输所需时间进程[42-43]。可见,探索RS与预期抑制的区别与联系,仍是今后预测性编码理论研究的热点问题之一。

2.2.2 错误/反馈相关负波

错误相关负波(ERN)的主要部位是前扣带皮层及其与额叶、边缘脑区的丰富联结,脑电表现为错误出现后100 ms、位于前额及中央脑区的负向波形,这是表征错误检测、冲突监控及强化学习的主要脑电成分。作为反映实际结果与预期(目标意图)之间差异的内源性信号,基于视听觉刺激的ERN神经特征研究已较为系统,由于其能被稳定诱发及解码,在优化脑-机接口性能上亦得到广泛应用。较常见的是将ERN作为纠错信号与传统脑-机接口集成,及时阻止或纠正错误指令的输出,提升系统准确率及可信度[44]。Zander等[25]则进一步提出基于预期的神经自适应技术,借助ERN编解码实现了机器对人意图的适应。如图3a所示,实验目的是受试者控制随机移动的光标从6×6棋盘格A点移动到B点;每次移动前受试者会预期一个最佳移动方向,在光标移动后对比预期与实际方向,预期与实际方向偏差越大(图3b颜色从绿到红),前额ERN(图3c阴影)负向化程度越大;计算机根据检测到的ERN调整光标行进方向,使其移动方向趋于控制者预期。结果显示:无预期参与时,光标随机移动,从A到B平均需90步;增加预期干预且建模良好,平均只需14步;即便无训练,在线完成上述操作也只需23步,均显著优于随机控制。

Fig. 3 The illustrations of neural adaptive technique based on ERP[25]图3 基于错误相关电位的神经自适应技术示意图[25]

与ERN类似,反馈相关负性(FRN)也是表征实际结果与预期之间差异的神经活动,主要由与奖励-损失相关的反馈诱发,时域表现为负向反馈出现后约250 ms主要分布在前额及顶区的负向波形,频域表现为theta频段(4~7 Hz)相位同步性及能量的增强。FRN侧重反映基于预测误差的状态更新,是强化学习理论涉及的主要成分[45]。正是由于预测误差在驱动信息更新、促进知觉学习中的重要作用[46],英国神经学家、控制论学者W. Ross Ashby甚至提出“大脑的全部功能可总结为:误差更正”[4]。

2.2.3 “预期抑制”形成机制的争议

目前,预期抑制现象的形成机制仍存在“衰减”与“锐化”的神经效应争议,其核心在于预期到底抑制了哪部分神经元的活动。“衰减”效应认为负责编码与预期一致特征的神经元活动受到来自上一级预期的抑制;“锐化”效应则认为预期的作用是通过抑制不一致特征编码活动来突显一致特征的编码效果;由于活跃状态神经元总数量减少,因此产生抑制[31]。Kok等[31]在用fMRI研究人对视觉刺激朝向、运动结果的预期时发现,与预期方向一致的刺激在初级感觉V1/运动皮层引起的神经响应更小,但对其进行多元模式分析解码,却能得到更高的朝向判断准确率,且相较于其他像素,预期抑制在负责编码匹配特征的立体像素中现象最微弱,即刺激偏好与抑制程度负相关。针对猕猴颞下回神经元放电活动的解码研究、运动影响感觉神经表征的研究均得到相似的结论[47-48]。

对于上述争议,Clark[4]认为预期抑制是一种宏观表征,局部位置或特定神经元集群可能一些表现出衰减效应,另一些显示锐化效应,预期并非仅抑制神经响应,是通过不同R和E功能神经单元的协同作用,在预期增强与抑制之间寻找到微妙平衡,进而高效完成信息处理。Heeger[49]进一步指出提升研究的时间分辨率,探索预测性编码动态响应的重要性。2020年,Press等[50]提出了“对立过程理论”,它的核心思想可概括为:大脑的信息感知是一个从预期特征匹配到预测误差处理的动态过程,并利用数学模拟说明,预期分别在特征匹配和误差更新阶段呈现出“锐化”和“衰减”效应,该理论已得到神经生理学证据的支持。

2.3 预期与注意对神经活动的协同调制

在解释预期抑制形成争议时,有学者指出部分实验混杂了注意因素,注意甚至能翻转预期的作用效果[30],可见,研究预期与注意这两种调制感觉信息加工的高级认知功能的区别与联系,也是深入理解预测性编码不可或缺的环节。

预期与注意在诱发方法、神经响应、作用机制上均存在一定差异。预期倾向于根据特征出现的可能性建立预测模板,并根据模板与感觉信息的匹配情况灵活对应符合或违背预期的外界输入;注意多根据感觉输入与当前目标的相关性进行优先排序,通过合理分配认知资源促进知觉加工[51]。通常情况下,受到注意的特征所诱发响应比无注意的大,符合预期特征所诱发的神经响应比违背预期的小。作用机制方面,预期主要决定了感觉信息先验分布(即预测模板)的精确度,而注意则会根据输入特征与当前目标的相关程度对其进行加权,并利用这种感觉信息增益调制与信息更新相关的误差信号活动。当然,也有理论认为,两者均是通过增强大脑对感觉信息的敏感度来调制认知过程,只不过预期主要在处理微弱或模糊输入的早期起作用,注意在处理清晰感觉输入并进行决策时效果更显著[52]。

预期与注意的协同作用研究表明:预期与注意的相互作用多发生在信息处理后期[53],且与信息处理的层级有关,高层级的预期更易受注意影响[54]。目前,预期与注意研究中的一个热点问题是:注意主要影响了预期的哪个信息处理环节[55]。一方面,注意提高了预期信号的神经增益,其通过将认知资源从违背预期的特征处转移开,来帮助人忽略掉无关或不想处理的感觉输入,由此,与预期一致的神经表征会显得更加突出[52]。Spratling[55]通过数学模拟证实了上述观点,并将描述预期作用机制的预测性编码与描述注意作用机制的偏置竞争理论整合到统一的神经计算框架中。另一方面,注意可通过强化预测误差的编码活动来促进认知的[16,51]。例如,Smout等[51]对脑电信号建立前向编码模型,发现新异刺激诱发的神经活动是根据预期与刺激特征间的差异编码的,且注意提升了上述神经响应;上述研究在单一和复合刺激模式下均存在[16]。目前,研究者们正在通过不断细化预期和注意的类型,进一步探索预期和注意的协同作用机制。

3 预期独立于外界刺激的内源性表征

3.1 有预期无刺激时的特异性神经活动

根据预测性编码,预期是大脑对外部世界的主动估计,应存在独立于外界刺激的内源性神经活动模式,但由于信号微弱、定位困难,上述内源性特征迟迟未得证实。甚至有人认为,预期的神经效应仅体现在其对感觉信息处理的调制上,只有在与外部刺激相互作用时才能被观测到。直到近几年,实验设计的创新、高性能采集及分析方法的涌现才使得预期的内源性表征研究迎来转机。

遗漏刺激(omission)是目前常用的内源性神经表征研究范式。所谓遗漏,是指大脑产生了对即将到来刺激的预期,但刺激并未出现的情况[56]。由于无自下而上的感觉输入,该范式为较全面地观测预期相关内源性神经活动特异性变化提供了窗口。遗漏性N1是该范式诱发的典型成分之一,图4a为一典型实验,它通过操控按键后出现听觉刺激的概率形成有/无预期的情况,并将其与有/无刺激的情况正交。初级听觉皮层所在的额颞区ERP显示:灰线代表的无预期-无刺激情况几乎不会诱发N1, 黑线和红线分别代表的无预期-有刺激、有预期-无刺激情况则会产生幅度相似的N1成分[56]。近年的研究验证了上述现象,还报告了预期相关的遗漏N2和P3成分[57]。猕猴颅内脑电则发现遗漏刺激时从颞叶到前额的低beta相位同步性增强[58]。此外,无刺激时的偏好性激活也是预期的内源性表征。“刺激偏好”是指初级视觉皮层的某些体素对45°朝向刺激响应更强,另一些对135°更强。若按传统观点,无刺激时不同刺激偏好的体素响应相同,但只要存在预期,相应体素即表现出偏好性激活[23]。

Fig. 4 Typical experimental paradigm and neural responses of predictive template[56](a)and preplay phenomenon[59](b)图4 预期模板神经表征典型实验范式及结果示意图[56](a)和预测性重演现象[59](b)

数据采集及分析方法的发展亦推动了预期内源性神经表征研究。如图4b所示,高分辨率fMRI的引入帮助研究者发现了初级视觉皮层部分体素的“预测性重演”现象。在受试者熟悉空间位置序列(即建立空间预期)后,仅向其呈现起始位置,部分体素即可对后续空间位置产生类似于预测性重演的顺序激活(中);但若只呈现结束位置(无预期),则仅有结束位置激活,其他位置无激活(右);且上述现象无需注意参与(图上下两行)[59]。再如,多变量解码技术为高时间分辨率地揭示预期相关神经活动的动态演进提供了新途径,基于脑磁信号(magnetoencephalogram,MEG)的多变量解码研究报告了刺激出现前、与行为表现提升显著相关的自发神经活动,再次印证大脑能够进行主动预测,并触发特定模式的虚拟神经活动[60]。

3.2 预期相关神经振荡理论

神经振荡模式的特异性变化亦是预测性编码重要的内源性表征。早期预期相关神经振荡研究多集中于单一频率的特异性变化,结果显示,时间和内容预期具有不同的振荡模式,时间预期多引起低频相位同步性变化,而内容预期则多依托betagamma高频神经振荡工作[61]。

较经典的时间预期相关神经振荡是刺激出现前delta-theta频段的相位夹带(entrainment),该现象在节律性刺激中最明显,低频振荡会在预期时刻出现前进行相位重置,并努力将其校准至最佳相位以加快反应速度,若刺激和delta振荡的理想相位对齐,行为学表现提升,若无相位重置,或刺激出现在非理想相位阶段,行为反应就会被抑制或减慢[62]。然而由于相位重置多出现在节律性刺激中,它到底是预期内源性调制神经活动的结果,还是节律性刺激诱发的外源性响应,一直存在争议。2021年,Daume等[63]借助脑磁图发现在非节律性刺激中,预期时刻前delta频段试次间相位同步性增强仍然稳定存在,证明了低频相位对齐是时间预期的重要神经机制,且可在跨模态感觉信息处理中发挥作用。此外,时间预期还可引起刺激出现前alpha能量或相位的变化。基于风险率、节律或序列的时间预期研究报告了预期时刻前alpha的能量衰减现象;另一些研究则在基于单间隔的时间预期中发现,alpha相位在刺激出现前会自上而下地重置至最佳相位[64]。尽管由于诱发范式、分析方法等差异,到底是能量还是相位受到自上而下时间预期调制仍有争议,但alpha频段神经振荡在时间预期中的作用得到了一致认可。

内容预期及其预测误差通常被认为与beta、gamma振荡活动关系密切。神经解剖及生理学的证据表明,预期信号主要是由大脑皮层深处层的锥体细胞编码,该位置的神经元集群主要以beta频率进行神经振荡活动[61];Betti等[65]更是认为自发beta振荡在长期先验知识的形成中发挥重要作用。Gamma振荡可能是内容预测误差的神经表征。有研究指出gamma活动取决于预期与感觉输入间的匹配状态,无论刺激是单模态还是跨模态,MMN及其他违反预期的刺激均会引起gamma活动增强及脑地形图变化,而当预期匹配时gamma幅度则显著减小,gamma增强现象在遗漏范式中同样存在[61]。癫痫病人颅内脑电研究比较了可预测与不可预测偏差出现前外侧前额皮质的活动差异,发现80~150 Hz高gamma幅度降低现象[66]。此外,诸多研究报告了预期相关beta-gamma振荡。例如:错误相关认知活动中beta能量先降低再增强现象(beta-rebound),该现象可能归因于beta振荡提前同步编码预期特征的神经元集群活动,若预测准确,仅已被同步的神经元集群产生gamma振荡增强即可,以此完成beta-gamma振荡的协调配合[67];猕猴自然场景识别研究表明,可预测的场景结构特征能增强初级视觉皮层V1 30~80 Hz gamma同步性,不可预测特征引起刺激出现500 ms后的beta节律[68];Chao等[69]借助定量模型区分了层级式的预期信号与预测误差信号,发现高、低beta活动分别与低层级、高层级预期信号有关,随后出现与预测误差相关的gamma活动,证明beta-gamma时间演进。

近年来,研究者们对神经振荡的研究不再局限于单一频段,而是更多关注了不同频段相位、能量之间的交叉耦合现象。例如:时间预期中枕顶区delta相位与beta能量的耦合[15];运动环路与相应初级感觉皮层之间通过delta相位与beta能量的神经耦合机制进行信息交流[70];视觉搜索任务中、对预期模板数量敏感的theta-gamma跨频带相位同步等[71]。可见,在不同认知任务中,全面探索多频段、多神经结构间的振荡耦合模式,有望成为预期相关神经振荡研究的热点。

4 预测性编码中分级结构的神经生理研究

4.1 预期信息分级处理的神经生理证据

分级结构是预测性编码依托的基本架构,研究者们已在微观及宏观尺度上发现了预期过程中分级结构的神经生理证据。微观尺度上,Parras等[72]利用oddball范式和升/降序听觉刺激序列,沿听觉通路记录不同听觉中心的皮层下及皮层神经元活动,在麻醉大鼠及清醒小鼠的单神经元记录中均发现预测误差随听觉处理层级升高而增大的现象,并证明单个听觉神经元的预测活动是皮层下水平自动偏差检测(MMN)的基础。视觉预期研究中,Schwiedrzi等[73]选取成年猕猴面孔处理专用神经结构中的ML(低层级)、AL(中层级),AM(高层级)位置,以上位置对人脸朝向(低层级特征)的敏感程度依次降低,对身份信息(高层级特征)的敏感度依次升高。他们假设,若自上而下的预期信息详细到可区分身份信息且能层级式反馈,那么处于低层级的ML神经元会更多表现出高层级神经元(AL/AM)的特征,即对身份信息更敏感,但对朝向的敏感性降低。比较ML神经元在处理身份误差、朝向误差及身份-朝向双重误差时的神经响应发现,成功建立预期后,相比于朝向误差,身份误差、身份-朝向误差会诱发更大的ML错误相关活动,证实了面孔处理的预测性分级处理。此外,Issa等[74]向猕猴分别呈现正常、异常结构的猴脸,记录其颞下回PL、ML、AM/AL(层级由低到高)位置神经元响应,发现高层级神经元一直对正常猴脸响应更强,中层级神经元先对正常猴脸响应更强,但从初始响应后约30 ms开始减弱,反而对异常猴脸响应变大,上述特异性动态响应可用层级之间预测误差的循环处理解释。

人脑较宏观的分级结构研究多使用局部-整体(local-global)范式并取得了一系列进展。局部-整体范式通过调整基本序列的刺激组成,形成局部(低层级)、整体(高层级)预期,并借助遗漏效应进一步研究高、低层级预期相关神经特征。如图5a,范式包含两种大概率序列xxxxx和xxxxY,用于形成两类整体(高层级)预期,根据第五个刺激与前四个是否相同,形成局部(低层级)预期。图5a中绿实线、紫虚线、绿虚线、紫实线依次代表xxxxx匹配-局部匹配、xxxxx匹配-局部失匹、xxxxY匹配-局部失匹、xxxxY失匹-局部匹配。结果表明,局部和整体预期分别增大了MMN和P3b成分(图5b~d),对于相同的局部偏差,整体预期的存在减小了局部偏差的神经响应(绿虚线vs紫虚线),说明高层级预期能抑制低层级神经活动。分析不同整体预期下的遗漏效应,根据层级式预测性编码理论,由于局部偏差在xxxxY整体预期下是可预期的,若相应刺激未出现,则会产生两种预测误差:对该音调的局部预期叠加上拟处理该音调的更高层级预期,因此相比于xxxxx,xxxxY整体预期下的遗漏响应更大(图5e)。脑电图(EEG)、MEG研究均可发现相似现象,且空间特征分析显示高层级预测在额叶及联合皮质等多个区域产生[10]。

Fig. 5 An improved hierarchical oddball auditory paradigm[10]图5 整体-局部层级式oddball听觉范式[10]

局部-整体及其改进范式已成为研究宏观尺度层级式预测性编码神经活动的主要方法。2015年,Strauss等[75]利用该范式检测了大脑睡眠各阶段EEG-MEG响应发现,睡眠中与整体预期相关的P300成分消失。由局部偏差刺激引起的MMN在各睡眠阶段仍存在,但与清醒状态相比,一个反映预测误差的特定峰成分消失。说明睡眠完整保留了基本的听觉处理和被动感觉适应,但扰乱了短期和长期的听觉预测性编码。2018年,Nourski等[76]记录了核心听觉皮质、非核心听觉皮质、听觉相关皮质及前额皮质四个位置的颅内脑电,比较了异丙酚全身麻醉过程中清醒、镇静、失去意识三种状态下分级结构相关神经活动,结果显示,清醒时各脑区均存在整体与局部预期偏差的特异性响应,镇静阶段,除前额皮质外的脑区存在局部偏差效应,各脑区的整体偏差效应受到抑制,失去意识后,仅听觉皮质显示出局部偏差效应,整体偏差效应完全消失。该研究说明,由局部偏差诱发的脑电响应随麻醉加深明显减小,有望成为麻醉深度的神经标记。2019年,Rohe等[77]针对视-听刺激,将贝叶斯模型和脑电图表征相似性分析相结合,证明视觉和听觉信息的分离及整合同样符合预期编码及分级处理。2021年,Hsu等[78]探究了大脑老化对预测性编码的影响,发现老化主要影响整体(高层级)预测误差的表征;2022年,狨猴的时间预期fMRI及颅内脑电研究发现,中脑和感觉区表征局部、较短时间尺度预期,前颞叶和前额区表征全局、较长时间尺度的信息处理,不同层级间存在beta-gamma振荡[79]。

4.2 预期过程普遍涉及的神经结构

预期广泛存在于大脑各信息处理过程,在不同实验任务、感觉模态等情况下,各神经结构不同程度地参与预测性编码。其中,前额皮质作为参与较高层级信息处理的主要结构,广泛参与了多种预期过程,在预期形成、更新、信息整合等方面发挥重要作用。早在2006年,Summerfield等[80]便在《科学》(Science)上报告前额叶是预测信息编码并保持的重要脑区,内侧额叶皮质响应强度主要取决于预期目标任务,而非其具体属性。同年,前额叶被报告具有优先编码能力,在利用场景信息帮助识别物体时,眶额皮质会先于梭状回和枕骨外侧皮质(负责识别物体的脑区)约50 ms改变激活水平,以使其能率先利用周围场景的概略信息进行编码并对可能出现在其中的物体进行预期推测,并将预测信号传至外纹状视觉皮层,协助指导其对与预期一致的感觉输入进行偏置性处理[81]。同时,前额皮质能通过从眶额皮质中部到初级视觉皮层的单向信息流[80]、增强前额与视觉任务中枕区的相位同步性正比于可预期性的前额与听觉皮层间的低频相位耦合等方式调控其他脑区神经活动[81]。前额皮质还参与了后续的信息整合和预期状态更新等过程,在增强预期相关决策自信、有效整合内源性预期与外源性输入并形成认知决策、多维度信息处理过程中均发挥着重要作用[82],额中皮质theta频段的特异性响应更被认为是反映预测误差处理及认知控制的典型神经表征[45]。前额在视听觉预测性编码活动中的部分研究如表2所示。

Table 2 The functional involvement of frontal cortex in visual and auditory predictive coding neural activities表2 前额在视、听觉预测性编码神经活动中的作用

此外,海马也是参与预期形成、加工的重要神经结构[90]。众所周知,无论是长期积累的经验还是快速习得的事物规律或关联,都离不开记忆的参与。而海马正是快速编码、存储、检索记忆的枢纽。它不仅能够快速提取刺激规律、形成同模态或跨模态的事物关联,还能利用局部线索从记忆中迅速检索到信息更为完整的相关内容。一些结果直接体现了海马参与预期过程,例如,事件相关功能性磁共振研究发现前海马体活动强度与外部刺激的可预测性相关,在编码刺激可预测性时,检索海马内相关记忆能有效简化所预期刺激的特征、提高认知效率[91-92]。

5 预测性编码的发展展望

预测性编码在视听觉感知过程中的神经表征及作用机制研究已取得一定进展,亦存在争议。如何进一步完善理论模型,如何将预测性编码的特异性神经表征应用于临床诊疗,如何利用相关神经特征促进脑-机接口等新兴技术发展,均是需进一步研究的问题。

在预测性编码理论模型的完善上,一方面需深化、系统化神经表征研究,另一方面需促进神经系统中预测性编码与新型人工智能算法的深度融合。深化神经表征研究具体包括:第一,现有研究在区分适应性响应与预期抑制现象上仍存在争议,有必要通过创新实验范式及分析方法有效区分两个现象,进而明确预测性编码在解释感知觉神经活动中的适用范围;第二,感知觉的形成与表达是多种神经活动综合作用的结果,有必要研究预期与记忆、注意、情绪、负荷等多种高级认知功能的协同作用,明确预测性编码与其他认知模型的区别与联系,进而形成更全面的感知觉神经活动建模;第三,现有研究所用的刺激多为简单特征,有必要研究自然场景下、复杂思维过程的预测性编码神经活动,揭示内源与外源性预期的整合机制。在神经计算模型与智能算法相互促进上,英国著名神经计算学家卡尔·弗里斯顿(Karl Friston)指出“把大脑预期的神经机制与深度学习的思维相结合,将会使机器更接近人的智能”。对此,Deepmind已借鉴了大脑的预期机制[93],赋予了计算机“脑补”空间信息的能力。相应地,如何通过引入深度学习等新型人工神经网络,挖掘更多有助于深入理解预测性编码的神经生理新原理、新现象,是重要发展方向之一。

将预测性编码相关的特异性神经表征用于辅助临床诊断,是拓展预测性编码研究的重要途径之一。现有研究已报告了预期机制受损与自闭症、精神分裂、痴呆等密切关联,若能从预测性编码角度揭示疾病形成机理、确定其特异生物标记,则能更准确地锁定病灶,进而提高治疗方案的针对性和灵活性。目前仅通过失匹配负波(MMN)、P3波形等相关成分作为疾病的生物标记,仍存在特异性低、稳定性差、个体差异大等局限,寻找更稳健、特异性更强生物标记是需要深入探究的课题。

在脑-机接口应用方面,预期的特异性神经表征有望成为新型脑-机接口控制信号。作为新兴的人机交互技术,传统脑-机接口(brain-computer interface,BCI)系统主要针对大脑的初级运动或(视、听、体)感觉皮层活动进行特定意图的编解码。该类系统无法读取大脑的高级认知活动,只能通过识别被(内或外部)调制的初级运动或感觉信息来间接推测大脑的真实意图。这种间接解码大脑意图的控制方式难以贴近大脑意图的自然表达并增加了BCI信息处理的复杂性,限制了BCI的应用场景。预测性编码理论指出,大脑认知活动的形成是其内部预期状态层级式整合外部摄入信息的过程。大脑在产生新的认知状态之前会从记忆中提取相关的先验知识,并在特定脑区形成预测模板。因此,预测模板是形成认知的最初始状态,也是大脑目标意图的最直接体现。深入研究预测性编码的内源性神经表征,能为合理设计范式、建立基于预测模板的认知型BCI系统提供理论和技术基础,从而实现最直接、最贴近大脑意图表达的对外控制。

综上,深入理解预测性编码在视、听觉神经活动中的计算模型及神经表征,有望为揭示大脑感知觉神经活动工作模式开辟新途径,是理解脑、认识脑、乃至开发脑的重要探索。

猜你喜欢

预测性层级预期
军工企业不同层级知识管理研究实践
基于军事力量层级划分的军力对比评估
职务职级并行后,科员可以努力到哪个层级
分析师一致预期
分析师一致预期
分析师一致预期
任务期内多层级不完全修复件的可用度评估
网络舆情诱因信息及预测性研判探析
析师一致预期
词汇量测试对语言水平的预测性的实证研究