APP下载

基于二维层状材料的神经形态器件研究进展*

2022-11-14李策杨栋梁孙林锋

物理学报 2022年21期
关键词:异质器件神经元

李策 杨栋梁 孙林锋

(北京理工大学物理学院,先进光电量子结构设计与测量教育部重点实验室,北京 100081)

近年来,人工智能的发展对计算和存储的需求不断提升.但是,摩尔定律的放缓以及传统冯·诺依曼架构中计算与存储单元的分离,导致了大量数据在搬运过程中功耗增加和时间延迟,致使集成电路以及芯片设计面临越来越多的挑战.这迫切需要开发新型计算范式来应对这种挑战.而基于存算一体架构的神经形态器件,可利用欧姆定律和基尔霍夫定律实现原位计算,从而有望克服传统冯·诺依曼架构瓶颈.通过调节具有“记忆”功能的忆阻器阻值,实现类似生物大脑的人工神经网络,并对复杂网络信号进行处理,例如图像识别、模式分类和决策执行等.二维材料由于其层状超薄特性和新奇的物理效应,为进一步缩小器件尺寸并实现感存算一体提供了方案.本文综述了基于二维材料的神经形态器件中的物理效应和忆阻特性,并详细阐述了神经形态器件对LIF(leaky integrate and fire)模型、Hodgkin-Huxley 模型等神经元模型以及长期可塑性、短期可塑性、放电时间依赖可塑性和尖峰频率依赖可塑性的模拟.在此基础上,进一步介绍了基于二维材料的神经形态器件在视觉、听觉以及触觉等领域的探索性应用.最后本文总结了当前研究领域面临的问题以及对未来应用前景的展望.

1 引言

随着人工智能的发展以及大数据时代的到来,社会发展对计算机的运算速度以及处理能效的要求越来越高.而目前的计算机都是基于传统的冯·诺依曼架构,这种物理上计算单元和存储单元的分离,会导致数据在搬运过程中功耗增加和时间延迟[1,2].在著名的人机大战中,代表着传统冯·诺依曼架构的人工智能产物AlphGo 击败了世界冠军柯洁,这显示了AlphGo 优越的算法架构和运算处理能力.但值得注意的是,AlphGo 的功耗是我们生物大脑(约20 W)的数千倍[3,4].因此,制造出像人脑一样,具有存算一体、高效、精准和连续信号处理等优势的类脑芯片成为近年来学术界和产业界越来越关注的方向,各个国家也出台了相应的脑计划,并且中国在“十四五”规划和2035 年远景目标中将“脑科学”列为国家重点前沿科技项目[5].

受人脑中神经元和突触计算模式的启发,神经形态计算网络具有实现大规模并行计算、自适应以及自学习等功能,并可通过欧姆定律和基尔霍夫电流定律实现原位计算,这样构成的神经形态器件被认为是最有潜力克服传统冯·诺依曼架构的电子元件之一[6-11].在众多用于实现神经形态计算的电子元器件中,忆阻器凭借其高集成密度、超低功耗、可实现存储与计算相融合以及模拟突触可塑性等特点成为当前最具优势的选择.在1971 年,Chua[12]从电路的完备性关系出发,首次提出了忆阻器的概念.根据忆阻器完成存内计算的方式不同,可以把忆阻器分为数字型(突变型)忆阻器和模拟型(渐变型)忆阻器[13-17].其中,数字型忆阻器的高阻态(HRS)以及低阻态(LRS)可以分别对应逻辑存储单元中的“0”和“1”,从而根据HRS 和LRS 之间的转变实现数据的存储,该类型忆阻器通常用于实现非易失性存储[18].而模拟型忆阻器的阻值可随电压扫描呈现连续变化特征,通常用于对信号进行传输、变换和放大等处理[19,20],并可进行编程模拟电路设计以及仿真模拟类脑神经突触的权重调节[21].此外,利用模拟型忆阻器的交叉阵列可以一步完成乘法-加法的矩阵运算,这比传统的计算过程更加节时、节能.

忆阻器发展至今,国内外研究者发现了许多具有忆阻特性的材料.传统阻变材料主要包括二元金属氧化物[22,23]、多元金属氧化物[24-26]、固态电解质[27]和有机介质材料[28,29]等.由传统阻变材料制备的忆阻器已被广泛研究,器件性能稳定,制备工艺成熟,但由于材料本身的限制,使得忆阻器尺寸很难继续缩小.而二维(2D)材料由于其层状超薄特性和丰富的物理效应受到了国内外众多研究人员的关注[30-38].

本文首先从经典理论和量子理论角度出发,介绍了基于2D 材料的神经形态器件的物理机制和忆阻特性,并详细阐述了其对神经元模型和突触可塑性的模拟.另外,本文列举了基于2D 材料神经形态器件在生物感知、声音定位以及触控模拟等领域的应用.最后,总结了当前2D 材料神经形态器件在高密度、大规模阵列集成等方面存在的问题,并对如何构建低能耗、存算一体的神经形态计算系统进行了展望.

2 2D 材料忆阻器件中的物理效应

推动神经形态器件发展的关键在于理解和掌握器件的物理效应,而忆阻器作为实现神经形态计算的理想器件之一,研究其背后的物理机制变得尤为重要.忆阻器一般是基于HRS 和LRS 的相互转化从而实现SET 和RESET,其开关机制与器件结构、忆阻材料、电极材料以及工艺流程有关.而对于2D 材料制备而成的忆阻器来说,在纳米尺度下材料自身会伴随产生新奇的物理效应,这势必也会给器件带来一些奇异的微观特性.随着研究的进展,2D 材料忆阻器的物理效应可以分为: 经典物理效应以及量子物理效应.经典物理效应主要为:相变效应[39-41]以及铁电效应[42-44].量子物理效应可以分为: 导电细丝效应[45-48]、氧空位效应[49,50]、隧穿效应[51,52]、电荷捕获与释放[53,54]以及范德瓦耳斯(vdWs)效应[55-58],如图1 所示.尽管在忆阻器实际工作时,往往会伴随多种效应协同进行,为了便于阐述,接下来将分类单独介绍各个效应的物理机理.

图1 基于2D 材料的忆阻器工作机制示意图,其中包括经典效应,如相变效应、铁电效应,以及量子效应,如导电细丝效应、氧空位效应、电荷捕获效应、隧穿效应、vdWs效应等Fig.1.Schematic diagram of physical working mechanisms of memristor based on 2D materials,including classical effects,such as phase change effect,ferroelectric effect,and quantum effect,like conductive filament effect,oxygen vacancy effect,charge trapping effect,tunneling effect,vdWs effect,etc.

2.1 经典物理效应

2.1.1 相变效应

相变效应主要是依托相变材料在不同相态之间的可逆变换来调节忆阻器开和关.当相变材料受到焦耳热[59]、激光[60]、电子束辐照[61]以及离子掺杂[62]等因素影响时,材料的晶态就会发生可逆改变,这种结构变化往往能在几纳秒内就可以完成[63].在相变材料发生结构可逆变换的同时,电导率也会显著变化,电导率的强大反差可以作为数据存储的“0”态和“1”态.

由于Li+具有较小的离子半径,可以在2D 材料中进行层间运动,这使其可以通过离子掺杂实现2D 材料的相变.Zhu 等[40]通过电场控制Li+迁移,实现忆阻器中MoS2薄膜从2H相到1T相的可逆转变,且器件具有良好的突触可塑性,并在输入信号诱导下可产生突触竞争或突触合作等相互作用.图2(a)展示了由金电极和机械剥离的MoS2组成的器件结构示意图,当在A 电极施加正向电压的时候,Li+在电场驱动下会向B 电极运动并积累,这会导致LixMoS2转换为1T相,电导率大大增加,实现SET 过程.反之,当在A 电极施加负向电压时,Li+在电场驱动下会向A 极运动并积累,导致LixMoS2转换为2H相,实现RESET 过程,如图2(b)所示.在实现开关特性的基础上,通过施加脉冲电压,器件表现出了稳定的电导可调行为,如图2(c)所示,这凸显了离子插层在实现2D 材料可逆相变以及模拟人工突触功能方面的潜力.此外,Zhang 等[41]利用MoTe2和Mo1-xWxTe2作为相变记忆层,制作了垂直结构忆阻器.较为独特的是,此工作通过横截面高角度环形暗场扫描透射电子显微镜(HAADF-STEM)扫描,发现一种介于2H与1T相态的2Hd相态,如图2(d)所示.为进一步探究其电学特性,在-3 V→3 V→-3 V 的扫描电压下,可在10 ns 内实现HRS 和LRS 之间的重复切换,展现了良好的开关特性(图2(e)).该工作证明2D 材料中的过渡金属二硫化物(TMD)只在电场调控下也可实现可逆相变过程,使得具有高开关比、超快开关速度的2D 材料相变忆阻器件的实现成为可能.

图2 相变效应(a)Au/MoS2/Au 器件结构示意图以及在电场作用下Li+调控MoS2 发生可逆相变过程的示意图[40];(b)Au/MoS2/Au 器件的I-V 特性曲线[40];(c)通过脉冲编程电压改变电导增量[40];(d)MoTe2 在电场作用下的相变过程以及MoTe2 在2H (左下)和2Hd (右下)态下的STEM 图像[41];(e)电形成过程前后的I-V 扫描曲线[41]Fig.2.Phase change effect:(a)Schematic diagram of Au/MoS2/Au device structure and Li+ regulating the reversible phase change process of MoS2 under the applied electric field[40];(b)typical I-V curve of Au/MoS2/Au device[40];(c)conductance changing with continuous pulse programming voltage[40];(d)phase change process of MoTe2 with electric field applied and the STEM images of 2H(bottom left)and 2Hd(bottom right)states of MoTe2[41];(e) I-V curves of devices before and after forming processes[41].

2.1.2 铁电效应

铁电忆阻材料在近些年来得到了广泛的研究[42,64-67].在没有外加电场时,铁电材料具有稳定的自发极化性质,但极化取向并不规则,总体表现为无极化.当施加外电场的时候,自发极化的方向可以由外加电场进行调控[68,69],进而实现LRS 和HRS 之间的阻态转换.

目前,对铁电场效应管(FeFET)[70,71]以及铁电隧道结(FTJ)[15]的研究较为成熟.然而传统的FeFET 由金属-铁电-绝缘体-半导体组成,这种组合存在栅极漏电流等问题,严重阻碍了实际应用.基于此,Wang 等[43]利用α-In2Se3的铁电性和半导体特性制备了铁电半导体场效应晶体管(FeSFET),如图3(a)所示.由于该器件极化转换过程发生在α-In2Se3层而不是栅极介质内,它可以潜在地解决传统FeFET 器件结构中漏电流问题.为了探究其忆阻机制,图3(b)从铁电效应以及能带结构角度出发进行了研究,当背栅(BG)施加负向电压时,其极化方向受电场影响在α-In2Se3与Al2O3的界面附近产生向下的极化.而在α-In2Se3的下表面产生一些正极化电荷,导致能带向下弯曲,进而使得在沟道底表面出现电荷积累,载流子密度和沟道电流大幅度增加,从而实现SET 过程.反之,当在BG 处施加正向电压时,实现RESET.研究还发现,栅极电压(Vg)能够很好地调控忆阻窗口的大小,如图3(c)所示,随着Vg的增加,滞回曲线窗口变大,这表明可以通过调整电场来精确控制极化过程.同时,该器件表现出稳定的增强和抑制行为,可实现100 个可区分的电导状态,如图3(d)所示.这为基于α-In2Se3的FeSFET 在类脑智能系统中开发神经形态器件提供了可能性.

图3 铁电效应(a)基于α-In2Se3 的FeSFET 器件示意图[43];(b)α-In2Se3 沟道材料向上和向下极化时的状态图示,以及相应的能带图[43];(c)不同Vg 扫描下器件传输特性曲线[43];(d)器件在5 个连续的周期脉冲电压下稳定突触后电流(PSC)的增强、抑制效果图[43]Fig.3.Ferroelectric effect:(a)Schematic of the α-In2Se3 based FeSFET[43];(b)illustrations of the upward and downward polarized states of α-In2Se3 channel material and the corresponding energy band diagram[44];(c)device transfer characteristic curves under different scanning ranges of Vg[43];(d)the potentiation and depression process of the post-synaptic-current(PSC)under 5 continuous periodic voltage pulses[43].

此外,有研究表明在模拟生物突触功能上,二阶忆阻器具有更大的优越性,有望进一步实现小型化、高密度、低功耗的神经形态计算.Wang 等[44],基于2D 材料的SnSe 铁电薄膜实现了二阶忆阻器.通过逐渐改变SnSe 铁电层的极化程度,实现了Au/SnSe/NSTO(0.7%Nb 掺杂的SrTiO3)器件结构电导的连续可调,展现了超低的功耗(66 fJ).尽管FeFET 器件在实现特定的突触功能方面已经十分成熟,但基于2D 材料的FeFET 在单个器件中同时实现逻辑计算和突触功能模拟却十分罕见.基于此,Lou 等[72]利用MoS2和MoTe2制备了双栅FeFET.由于铁电耦合效应的存在,使得器件表现出静电多样化行为,从而成功实现了非易失性逻辑门和人工突触等功能,同时也解决了数字和模拟空间中的存内计算的问题.

2.2 量子物理效应

2.2.1 导电细丝

导电细丝效应是在原子尺度下,通过外电场调控原子或离子的运动,从而形成纳米尺寸的导电细丝,并会伴随量子效应,通常表现为器件会产生以G0=2e2/h为单位的量子电导行为[73].一般而言,基于导电细丝效应工作的神经形态器件的电极材料,一端为化学性质活泼的金属材料(Ag,Cu,Ru),另一端为惰性金属材料(Pt,Pd,Ta,W)[74,75].在电场控制下,活性金属原子发生氧化还原反应在介质层中形成导电细丝,通过改变电压的偏置来调控细丝的形成与断裂,进而实现电阻开关.然而,随着器件尺寸的不断缩小,虽然实现了更高的功能密度、更低的编程电压,但可靠的电阻开关功能的维持变得越来越困难[76,77].

基于上述困难,Guo 等[78]采用vdWs 与金属电极集成的方法,利用2D SnSe 构建了结构为Ag/SnOx/SnSe 的忆阻器,实现了超低工作电压(0.4 V)、高开关比(>103),并具有优良的保持性和耐久性等优势.其中,传统的热蒸镀和电子束蒸镀通常涉及高能热原子团的轰击,可能导致电极和2D 材料之间的界面发生较大损坏,从而使忆阻器开关性能恶化[79,80].而vdWs 金属集成法,通过弱vdWs 力集成金属电极,可以实现电极和2D 材料之间最小的界面损伤,确保忆阻器具有可靠的电阻开关行为[81,82].器件结构以及界面的横截面TEM 图像,如图4(a)所示.为了进一步了解Ag/SnSe 界面的化学性质,Guo 等[78]研究了界面的能量色散光谱(EDS).结果显示,在没有转移Ag 之前,SnSe 表面有Se,Sn和少部分O 元素.其中O 元素的存在,是由于SnSe表面发生氧化形成了SnOx.但当转移Ag 电极后,SnSe 表面存在了Ag 元素,这是由于Ag 被SnSe表面氧化物诱导形成Ag+导致的.此外,器件在连续4000 个周期的开关循环中保持103的开关比,显示其具有一定的耐久性.并且在105s 后仍然保持较高的开关比,如图4(b)所示.其工作机制如图4(c)所示,当Ag 电极接地,在SnSe 施加正/负向电压的时候,调控导电细丝的形成/断裂,实现SET/RESET 过程.此外,低开关电压不仅适用于低功耗神经形态计算器件,而且电压范围更加接近生物动作电位,也为与人脑神经网络的直接连接开辟了途径[46].

图4 导电细丝效应(a)Ag/SnOx/SnSe 器件示意图以及器件的横截面TEM 图像[78];(b)忆阻器的保持性超过105 s[78];(c)Ag/SnOx/SnSe 器件初始状态、导电细丝形成和断裂的示意图[78];在CDG(d)和DDG(e)器件中导电细丝形成和断裂示意图[83]Fig.4.Conductive filament effect:(a)Schematic of Ag/SnOx/SnSe device and the cross-sectional TEM image of the interface[78];(b)the retention of the device over 105 s[78];(c)schematic of Ag/SnOx/SnSe device at initial state,conductive filament formation process and fracture state[78];schematic of conductive filament formation and rupture in CDG(d)and DDG(e)device[83].

但是,导电细丝的形成过程存在随机性和不稳定性.特别是在低工作电流下,忆阻器很难形成稳定的细丝,但高工作电流下又会引起较大的功耗.因此,Zhao 等[83]利用石墨烯(Gr)缺陷工程,通过在Ag/SiO2/Pt 忆阻器中插入不同孔洞大小的石墨烯(DG)层来集中或离散调控导线细丝的形成和大小,从而使得在器件中形成稳定的导电细丝.图4(d)和图4(e)展示了可控性细丝的形成机制,在插入集中DG 的Ag/DG/SiO2/Pt 器件(CDG)中,由于集中的DG 会诱导限制在缺陷区域的阳离子迁移,这使得即使很小的限流也会形成稳定的导线细丝,并表现出非易失性特征.相反,插入离散DG 的Ag/DG/SiO2/Pt 器件(DDG)由于离散DG的存在,使得即使很大的限流下形成的导电细丝也不稳定,从而表现出易失性.上述缺陷工程为解决导电细丝形成过程中的随机性以及稳定性问题,提供了可行性方案.

2.2.2 氧空位

在一些过渡金属氧化物材料中,由于自身存在与氧有关的缺陷空位,在电场作用下可以发生氧化还原反应,形成氧空位导电通道来改变材料的阻态.尽管基于氧空位效应的忆阻器在性能改善方面取得了显著进展,但最常见的过渡金属氧化物(TMOs,HfOx,TaOx等)功能层器件仍然无法满足节能内存和计算任务的需求[84].这是因为大多数基于氧空位机制的忆阻器在较低的工作电流时,很难提高数据保持性[85].

而2D 材料能够很好地解决上述由传统氧化物引起的问题.Liu 等[50]利用氧等离子体技术调控HfSe2表面氧化过程,通过引入HfSexOy氧化层提高电阻,进而降低了工作电流,这避免了HfSe2高电导导致的高功耗和低开关比问题.并且,器件的HRS 和LRS 可以保持1.5×104s 以上,在40 个直流开关周期下仍具有较大的开关比(103).器件的SET 和RESET 电压,分别以2.32 V 和-0.7 V为中心呈现正态分布特征,显示出较好的稳定性.器件结构如图5(a)所示,其中机械剥离的2D 层状HfSe2纳米片的氧化层充当了阻变介质层,夹在顶部活性电极Ti 和底部惰性电极Au 之间.在扫描电压下,器件表现出可重复的双极特性并且可在超低电流下工作(100 nA),如图5(b)所示.这是由于活性电极Ti 可以从HfSexOy中吸收一些氧形成TiOx,界面附近产生丰富的氧空位,从而使得器件表现出了优异的性能.和无定形HfSexOy相比,HfSe2具有更大的空位形成能,从而充当“壁”的作用以防止氧空位在阴极处累积.当Ti 电极施加正向偏压时,带有正电的氧空位向底部电极移动,但被2D HfSe2层所阻挡,在界面处开始形成氧空位通道,而由于Ti 电极附近的O 空位数量远高于HfSe2附近的氧空位数量,因此形成稳定的“锥形”导电通道[86].相反,当施加负电压时,导电细丝会因从圆锥体顶端回收氧空位而断裂,这个过程仅需要非常低的能量,使得该器件工作电流可降低到(100 pA),能耗可以降低至0.1 pJ 甚至0.1 fJ,这在计算储存中能很好地实现节能效应,如图5(c)所示.

图5 氧空位效应(a)Ti/HfSexOy/HfSe2/Au 忆阻器示意图[50];(b)器件的电学特性: 在低工作电流(100 nA)下,器件的I-V 曲线[50];(c)锥形氧空位通道在电压调控下形成和断裂的过程[50];(d)Pd/WS2/Pt 器件结构示意图[49];(e)文献中报道的不同的编程或SET电流的比较[49]Fig.5.Oxygen vacancy effect:(a)Schematic of Ti/HfSexOy/HfSe2/Au memristor;(b)electrical characteristics of the device: I-V curves of the device at low operating current(100 nA)[50];(c)the formation and rupture of conical oxygen vacancy channels under voltage regulation[50];(d)schematic of the Pd/WS2/Pt device[49];(e)comparison of various programs or SET currents reported in the literatures[49].

与通过外界处理方式引入空位相比,利用材料自身的空位不仅简化了工艺流程,也避免了引入空位的不确定性和不可控性.由于WS2薄膜中的具有较多的W 和S 空位,并且在声子限制下电子迁移率非常高,这使得其在实现低功率中很有应用前景[87].Yan 等[49]基于2D WS2设计了Pd/WS2/Pt结构的忆阻器,如图5(d)所示.WS2中W 和S 空位的移动以及电子在空位间的迁移是该器件实现忆阻行为的物理机制.该器件与其他基于2D 材料的器件进行了比较,显示出了最低能耗(如图5(e)所示),凸显了其在低功耗的神经形态计算中的优势.Yan 等[49]对有空位的WS2的电子结构进行了研究,通过密度泛函理论(DFT)计算出态密度分布情况,并与无空位的WS2的态密度进行了比较.结果证实钨空位和硫空位形成的缺陷态处于较深能级.因此,空位处电荷不容易发生泄漏,从而导致器件表现出较低功耗.

为了在电调控基础上引入光调控,使得基于氧空位的器件具有良好的光响应机制.与上述利用沟道材料本身存在的或其表面氧化层产生的氧空位方式不同的是,Chen 等[88]通过沟道材料与富含氧空位的材料进行vdWs 异质结设计的方式引入氧空位,设计了MoS2/BiFeO3/SrTiO3固态离子存储器.其中BiFeO3中的氧空位不仅显著增强了MoS2的光响应,而且还很好地实现了光电存储特性.

2.2.3 隧穿效应

隧穿效应也是常见的一种量子效应,利用不同材料电子亲和能以及功函数之间的差别,在外电场作用下,通过调节材料的能带结构以及势垒高度使得电子隧穿,从而实现阻态变换.浮栅器件就是基于隧穿效应设计而成的,其中浮栅层与导电沟道之间的电荷隧穿使得信息存储成为可能,这使得浮栅在互补金属氧化物半导体(CMOS)体系结构中得到了广泛的应用[51,52].然而大部分传统浮栅器件却存在较大的栅极电压,在实际的神经形态计算的应用中有较高的能耗,这使得浮栅器件在应用方面有很大的限制.

根据器件的隧穿机理,电子的隧穿概率与隧穿势垒的高度和宽度有关.降低工作电压的一种可能性的方法是降低隧穿层的厚度.然而,薄的隧穿层会造成电子在浮栅泄漏,影响器件的稳定性.基于此,He 等[55]使用2D MoS2作为导电沟道层,制作了一种基于隧穿效应调制的多端器件,通过优化隧穿层(h-BN)的厚度(15 nm),降低了工作电压,从而提高了器件的可靠性,如图6(a)所示.其中,Au 的功函数为5.1 eV,而h-BN 具有较大的带隙(5.2-5.9 eV)和较小的电子亲和能(2-2.3 eV)[89,90].当在漏极施加正向电压时,漏极和浮栅之间就会有较大的电场存在,这使得原来平整的能带向漏极弯曲,并使电子可以从浮栅隧穿到漏极.由于浮栅和源极之间的电位差可以忽略,这可以防止它们之间的电子泄漏.电子从浮栅隧穿到漏极之后,浮栅带有正电,而大部分电子在MoS2沟道中积累,进入LRS.相反,当在漏极施加负电位时候,电子则从漏极隧穿到浮栅,进入HRS,如图6(b)所示.图6(c)和图6(d)展示了基于MoS2的多端器件在Vg以及Vds调节下的开关特性,与传统的由栅极电压调控的浮栅存储器不同的是,浮栅中的充电和放电过程也可以由Vds调节实现.这种多端结构还可以用来模拟突触可塑性,在不同Vg下,器件电导变化具有良好的可重复性和可调性,如图6(e)和图6(f)所示.并且在12 V,50 µs 的脉冲下实现了高速开关(50 ns)、低能耗(7.3 fJ)突触的可调模拟性权重更新,这为浮栅器件在低工作电压下实现低功耗神经形态计算器件提供了指导.此外,降低工作电压的另一种可能方法是设计浮栅的位置和形状,Wang等[91]利用MoS2作为导电沟道以及h-BN 作为介电层,通过特定的vdWs 堆叠设计了双栅极结构的浮栅器件,并在较低工作电压下(约5 V)表现出优异的性能,具有较长的保持时间(105s)和超低关断漏电流(10-13A).与传统的浮栅存储器中控制栅和浮栅相对位置不同的是,该器件的控制栅和浮栅并不在器件的同一侧,而是在器件导电沟道层的两侧.这样的结构会导致顶部浮栅和底部控制栅之间存在电容耦合效应,这也是该器件能够降低工作电压和实现良好非易失性存储的原因.

图6 隧穿效应(a)基于MoS2 的多端器件的示意图[55];(b)浮栅/h-BN/漏极的能带图[55];(c)基于MoS2 的多端器件在Vds=1 V 的传输特性[55];(d)在不同Vds 下的开关行为[55];(e)基于三端器件的突触示意图[55];(f)不同Vg 下多端突触器件重复性增强和抑制行为的对数图[55]Fig.6.Tunneling effect:(a)Schematic diagram of the MoS2-based multi-terminal device[55];(b)band diagram of floating-gate/h-BN/drain[55];(c)transmission characteristics of multi-terminal device based MoS2 at Vds=1 V[55];(d)switching behavior at different Vds[55];(e)schematic diagram of a synapse based on a three-terminal device[55];(f)logarithmic plots of repetitive potentiation and inhibitory behavior of multiterminal synaptic apparatus under different Vg[55].

但是,对于浮栅器件来说,其读写需要的时间比较长,一般在ms 级别[92-94].为进一步缩短器件读写时间,Wu 等[95]利用2D vdWs 异质结设计了InSe/h-BN/Gr 结构的浮栅存储器件.利用原子级锐利的界面和增强的界面耦合特性,首次构筑了超快、非易失性浮栅存储器,实现了纳秒级(约20 ns)的读写操作以及极长的存储时间(10 年以上).

从改变调控方式角度出发,Lai 等[96]利用2D Ruddlesden-Popper(2D-RPP)钙钛矿材料中优异的电荷存储能力和敏感的光响应机制,设计了基于MoS2/h-BN/2D-RPP vdWs 异质结的光电存储器.与传统浮栅器件中通过电刺激进行编程和擦除操作不同,光不仅可以做到非接触式调控,还可以避免重复的电压驱动增加的功耗,从而增加器件的可靠性和稳定性.这为光电融合神经形态器件的发展提供了有力的支持.

2.2.4 电荷的捕获与释放

电荷捕获效应的本质是,微观形态下基于电荷量子化,通过电场调控电荷的捕获与释放,进而引起宏观上阻态的改变.与基于导电细丝、氧空位效应的器件相比,通过对电荷的捕获与释放对阻态进行调节,不会引起微观结构的变化[97].这也使得基于电荷捕获与释放的器件具有更稳定的性能以及更广泛的应用价值[98-102].随着2D 材料研究的深入,人们基于2D 材料中电荷捕获效应的神经形态器件的成果展开了广泛的研究[58,103-105].

但是,目前基于2D 材料的电荷捕获效应的人工突触仅限于在单个或数量较少的器件上实现.为此,Xiang 等[53]研究了基于富硅氮化硅(sr-SiNx)衬底的多层MoTe2器件,并成功设计出基于2D MoTe2的突触阵列,如图7(a)所示.图7(b)显示了器件具有典型的以n 型为主的双极性行为,这是由于富含Si-Si 键的SiNx介电层具有优越的电荷捕获能力[106,107].当栅极加正电压时候,空穴被注入到sr-SiNx介电层中,并被介电层中自身固有的空穴捕获中心所捕获.这样介电层中带有正电的大量空穴会使得MoTe2导电沟道中电子浓度和电流显著增强,即使当栅极电压去除时,空穴仍然被存储,器件处于LRS,完成写入存储过程.在擦除过程时,通过在栅极施加负电压将捕获的空穴驱回Si中,从而去除有效存储电荷,如图7(c)所示.图7(d)和图7(e)展示了器件在人工神经网络应用中的能力,研究了器件的基本突触功能,电导的聚集分布在每个状态下都有很小的变化,循环稳定性很高,展现出良好的增强和抑制效果.

图7 电荷的捕获与释放(a)基于2D MoTe2 的忆阻器结构示意图[53];(b)在Vg(-40 V→40 V→-40 V)扫描电压下器件的传输特性曲线(插图为在对数坐标下的I-V 曲线)[53];(c)2D MoTe2 的忆阻器工作机制示意图[53];(d)生物突触和基于sr-SiNx 的人工突触器件的示意图;(e)100 个周期内增强(左)和抑制(右)周期性电导的变化[53]Fig.7.Charge trapping and de-trapping effects:(a)Schematic diagram of the memristor structure based on 2D MoTe2[53];(b)the transfer characteristic curve of the device under the scanning voltage of Vg(-40 V→40 V→-40 V)(the illustration is the same curve shown in logarithmic coordinates)[53];(c)the working mechanism of the device[53];(d)schematic illustration of biological synapses and sr-SiNx-based artificial synaptic device[53];(e)the conductance periodic changes in excitation(left)and inhibition(right)over 100 cycles[53].

对于基于电荷捕获效应的神经形态器件来说,其电荷捕获能力主要取决于表面官能团和电子杂化态,因此引入具有丰富杂化态的材料是提高器件性能的关键[108].Wen 等[109]利用2D 石墨炔(GDY)中丰富的电子杂化态和不同的化学基团性质,设计了基于GDY/MoS2vdWs 异质结中的电荷捕获存储器.该器件可以在光电两种模式下工作,并展现出良好的数据存储能力,很好地显示了GDY 作为富态电荷捕获中心在光学存储器和人工突触等方面的应用潜力.

2.2.5 vdWs

由于2D vdWs 异质结在场效应管[110]、光电探测器[111,112]、太阳能电池[113]以及神经形态器件[114]等领域表现出新奇的物理特性,受到研究人员越来越多的关注与研究.其中,2D 异质结在生长过程中存在晶格对称性、晶格常数等晶格结构匹配的限制,很难生长出任意需求的异质结[115].但是,2D vdWs 异质结可以通过转移方式进行搭建,在此过程中它不受晶格匹配的限制,可以将具有不同晶格结构的2D 材料集成在一起[116].所以仅需考虑不同2D 材料的能带结构匹配等因素,进行特定的异质结构设计,为新型神经形态器件提供特定的功能[117-122].并且,2D vdWs 异质结被认为是非易失性光学存储器的良好选择,这是因为异质结的存在使其具有多个光敏层,可以辅助宽光谱吸收,并且它们具有强烈的光-物质相互作用[123-125].此外,2D vdWs 在结界面处建立了有效的势垒,阻碍了随机载流子的输运,并抑制了器件中的随机噪声[126].

2D vdWs 异质结一般有两种结构,横向结构和垂直结构.其中,2D 材料的横向异质结构由于高质量的原子精度异质接口,为多功能高性能电子器件的异质结构设计创造了新的范例[127,128].但是,在2D 材料的横向异质结构中,同时实现具有鲁棒性的电阻开关性能和多栅调制的人工突触尚未得到深入研究.基于此,He 等[129]设计了基于2D WSe2-WO3横向异质结构的多门栅控神经突触器件,成功模拟了两种基于神经元的突触功能,并可通过四端配置的栅极电压和可见光进行有效调制,如图8(a)所示.He 等发现改变栅极电压能有效调节开关特性,当Vg电压从0 更改为-20 V 时候,HRS 的电流从15 pA 增加到122 pA(Vds=0.1 V),但LRS的电流几乎保持不变,如图8(b)所示.当进一步降低Vg时,HRS 的电流增加到820 pA,而LRS 的电流仍然保持不变,这可以由WSe2中的多子空穴来解释.图8(c)显示了WSe2-WO3异质结构的光学图像.为了揭示WSe2-WO3异质结构中电阻开关的物理本质,He 等测量了具有不同电极结构的器件的电学特性,如图8(d)所示,只有WSe2-WO3异质结构(电极3 和4)构成的器件在I-V曲线中呈现出典型的电阻开关迟滞回线.这些结果清楚地表明,中间过渡层WSe2-x和WO3-x在电阻开关中起着关键作用.图8(e)和图8(f)展示了WSe2-WO3异质结构引起阻变的原理,这是由于WSe2有很好的催化析氢能力,能很好地吸收氢并与WO3反应.在施加不同类型电压下,驱动质子的移动,使得HxWO3-y与WO3-y发生可逆转变,进而实现HRS与LRS 之间的相互转换.

图8 横向vdWs 异质结(a)基于2D WSe2-WO3 横向异质结构的器件示意图[129];(b)由Gate 1 调节的电阻开关特性[129];(c)WSe2-WO3 横向异质结构的光学图像[129];(d)Pd-WSe2-Pd(电极4 和5)、Pd-WO3-Pd(电极1 和2)和Pd-WSe2-WO3-Pd(电极3 和4)的I-V特性曲线[129];(e),(f)开关原理的示意图,其中红色圆圈代表质子[129]Fig.8.Lateral vdWs heterostructure:(a)Schematic diagram of the device based on the 2D WSe2-WO3 lateral heterostructure[129];(b)resistive switching characteristics regulated by Gate 1 voltage[129];(c)optical image of WSe2-WO3 lateral heterostructure[129];(d) I-V characteristic curves of Pd-WSe2-Pd(electrodes 4 and 5),Pd-WO3-Pd(electrodes 1 and 2)and Pd-WSe2-WO3-Pd(electrodes 3 and 4)[129];(e),(f)schematic of the switching principle,where the red circles represent protons[129].

对于垂直vdWs 异质结,Wang 等[130]选取了MoS2和Gr 分别用作忆阻器的沟道层和电极材料,制备了垂直vdWs 异质结构,如图9(a)所示.并发现该器件具有优良稳定的开关性能,其中可擦写次数超过千万次,即使在340 ℃的高温下仍然可以实现稳定工作并且保持优良的开关性能,如图9(b)和图9(c)所示.为了进一步探究器件热稳定性的本质原因,Wang 等[131]采用透射电子显微镜(TEM)观察,发现热稳定性来源于MoS2-xOx以及Gr 层尖锐的原子界面,并揭示了器件的开关机制是由于氧离子的迁移.对于现阶段大部分忆阻器件来说,在200 ℃以上的温度环境下,器件可靠性将受到严重的损害,而此工作实现了在高温环境下忆阻器件依旧保持稳定的开关性能,为未来使用vdW 异质结构的器件在恶劣环境下稳定工作的电子设备提供了一条途径.

图9 垂直vdWs 异质结(a)基于MoS2-xOx/Gr 异质结的器件示意图[130];(b)器件在不同温度下的开关曲线[130];(c)器件在340 和160 ℃下的保持时间[130]Fig.9.Vertical vdWs heterojunction:(a)Schematic diagram of the device based on MoS2-xOx/Gr heterojunction[130];(b)switching curves of the device at different temperatures[130];(c)retention time of device at 340 and 160 ℃ [130].

3 神经形态器件的基本特征

3.1 神经元模型

在生物神经网络中,神经元通过离子的移动来接收、处理和传输信号.在神经元的脂质双层膜中,离子通道调节细胞外液和细胞内液之间离子(Na+,K+,Ca2+)的浓度.随着突触信号的输入,膜电位会随着两种细胞液之间离子浓度的变化而变化.一旦膜电位达到阈值,离子开始流过离子传导通道来传输信号.之后,膜电位返回平衡状态.为了解释神经元工作时电位的动态特性,神经生理学家建立了许多模型,主要有5 种神经元模型: Hodgkin-Huxley(H-H)模型[132,133],Izhikevich 模型[134],LIF(leaky integrate and fire)模型[135,136],SRM(spike response model)模型[137]和ANN(artificial neural network)模型[138].神经元通常在时域或频域表现出丰富的动态和瞬态转换行为,这引起了越来越多的研究人员的关注.在过去的几年中,人们在2D材料的光电突触器件方面开展了相当多的研究工作.尽管2D 材料有望为结构紧凑、高密度集成、可扩展和节能的人工神经元突触器件提供可行性条件,但目前的实验探索仍处于起步阶段.在此将重点介绍基于2D 材料的神经形态器件实现对LIF以及H-H 神经元模型的模拟.

3.1.1 LIF 神经元模型

LIF 神经元模型可以利用阈值开关忆阻器、电容器、易失性无阈值忆阻器件和比较器组成的混合电路来实现.Hao 等[139]通过引入离子迁移和电化学反应,在基于2D MoS2的平面器件中成功模拟了基于LIF 模型的人工神经元,Ag+离子在电场中的行为模拟生物神经元中Ca2+的流动,如图10(a)所示.通过在单层MoS2沟道中控制Ag 导电细丝的形成和断裂进而模拟LIF 模型的易失性开关行为.且在输入连续电压脉冲后,MoS2器件表现出LIF 神经元的电学行为,如图10(b)所示.图10(c)展示了通过施加单个脉冲,器件可以在0.5 ms 内实现开关转换,这表明该器件具有良好的脉冲响应.此外,Dev 等[140]利用化学气相沉积(CVD)生长的2D MoS2实现了阈值电压忆阻器件,并通过外接电路的方式,也成功实现了具有LIF 特性的人工神经元.该电路模拟了生物膜电位的整合过程,生物神经元的离子运动过程由阈值电压忆阻器中的Ag+来模拟,如图10(d)所示.电路示意图如图10(e)所示.当持续输入宽度为100 µs,振幅为1 V 的电压脉冲时,可以得到稳定输出的多个电流峰值,从而展现出LIF 特性,如图10(f)所示.

图10 LIF 模型神经元(a)平面器件Ag/MoS2/TiW 示意图[139];(b)器件在连续脉冲序列下的泄漏-集成-发射的电学行为[139];(c)器件在1 ms、电压为2.0 V 的单脉冲下的易失性开关行为[139];(d)垂直器件Ag/MoS2/Au 的结构示意图和光学图片[140];(e)上图为Ag/MoS2/Au 人工神经元的电路图,下图为神经元的连续输出电流尖峰[140];(f)上图为电路图节点B 处的电压VB,下图为负载电阻RL 两端的电压VRL[140]Fig.10.LIF model neurons:(a)Schematic diagram of planar device Ag/MoS2/TiW[139];(b)leakage-integration-emission electrical behavior of device under continuous pulse trains[139];(c)volatile switching behavior of the device with a single pulse of 2.0 V at 1 ms[139];(d)schematic diagram and optical picture of the vertical device Ag/MoS2/Au[140];(e)the top picture is the circuit diagram of the Ag/MoS2/Au artificial neuron,and the picture below is the continuous output current spike of the neuron[140];(f)the picture in the top panel shows the voltage VB at node B of the circuit diagram,and the picture in the bottom panel shows the voltage VRL across the load resistance RL[140].

3.1.2 H-H 神经元模型

H-H 神经元模型的命名来源于Hodgkin 和Huxley 的合作,其中在1952 年研究乌贼轴突电生理活动时候,用数学模型的方式展示了神经元细胞膜上的I-V变化关系,即H-H 模型.神经元具有可刺激性,当受到微小的刺激后,电位发生波动后会很快恢复到平衡状态,但当受到的刺激超过某一阈值时,神经元的电位将会有一个快速又陡峭的响应.这时,神经元处于激发态.但H-H 模型的人工神经元通常需要一个复杂的电路来模拟神经元膜中离子沟道的动态过程.

基于上述问题,Beck 等[141]报道了一种可以通过双栅极电压调控的高斯异质结晶体管(GHeT),并成功实现了H-H 尖峰神经元,器件的光学照片以及示意图如图11(a)和图11(b)所示.图11(c)显示了生物神经元的H-H 模型的电路,其中Na+的注入会导致神经元膜电位(Vm)产生尖峰,而K+离子的释放会重置Vm.图11(d)和图11(e)显示了H-H 模型中K+电导(gK)和Na+电导(gNa)的时间演变关系.gK随时间的变化可以用n 型金属氧化物半导体晶体管(NMOS)的延迟开启来表示,电压Vm通过阻容负载施加到栅极.而Na+的行为更复杂,需要峰值时间依赖响应,这会使得峰值电导增加,但随着Vm的增加,达到峰值电导的延迟会减少.图11(f)详细介绍了用单个MoS2-GHeT 器件、NMOS(T1和T2)和一些无源元件(R1,R2,C1和C2)来模拟神经元的完整电路图.电压源V3和V5连接在T1和T2的源电极处,使得场效应晶体管的阈值电压具有可编程性.GHeT 和电路组件T1,R1,C1模拟gNa,而电路组件T2,R2,C2模拟gK.在施加突触电流(Isyn)之前,由于大的正栅极偏置(V1)使得GHeT 处于关闭状态,当有足够大的突触电流时,C1和C2会整合Isyn以及 GHeT的断开电流(IOFF).当Vm超过T1的阈值电压时,施加到栅极的电压从V1迅速下降到0 V,从而产生负的相对栅极电压(VTG-Vm).这种情况驱动GHeT 从关态到峰值开态,增加的电流使得Vm的斜率急剧增加.当Vm达到T2的阈值电压时,延迟的gK就能够支配和重置Vm,使其低于T1的阈值电压.当Isyn+IOFF足够高时,这种尖峰响应将重置下去,如图11(g)所示.

图11 H-H 尖峰神经元(a)器件的光学图片示意图[141];(b)器件结构示意图[141];(c)H-H 模型神经元的电路等效图[141];(d)H-H模型中gK 的时间演变关系图[141];(e)H-H 模型中gNa 的时间演变关系图[141];(f)GHeT 神经元的完整电路图[141];(g)图(d)中的GHeT 神经元电路的前30 s 的实验结果[141]Fig.11.H-H spiking neurons:(a)Optical image of the device[141];(b)the schematic of device structure[141];(c)equivalent circuit diagram of H-H model neuron[141];(d)time evolution diagram of gK in H-H model[141];(e)time evolution diagram of gNa in H-H model[141];(f)complete circuit diagram of a GHeT neuron[141];(g)experimental results for the first 30 s of the GHeT neuron circuit in panel(d)[141].

3.2 突触可塑性

突触是将前一个神经元的冲动传输到下一个神经元或者细胞中的结构.随着时间的推移,控制和保持突触权重的能力被定义为突触可塑性,其包括长期可塑性(LTSP)、短期可塑性(STSP)、峰值时间依赖性可塑性(STDP)以及放电速率依赖可塑性(SRDP)等[142-144].它们是突触进行神经信号处理、神经形态计算的基础.

3.2.1 LTSP 长期可塑性

LTSP 可以在兴奋性突触上获得,包括长时程增强(LTP)和长时程抑制(LTD),这表明在连续刺激突触后,突触强度持续增加和减少.同时,LTSP 被认为是长期学习和记忆的生物学基础[145].

但是,在器件工作时,LTP 和LTD 之间转换的不稳定性对训练和识别过程有较大的负面影响.基于此,Kwon 等[42]利用2D 铁磁材料SnS 研究了基于Pt/SnS/Pt 结构的LTP 以及LTD 等突触特性,该器件具有高稳定的LTP/LTD 的转换机制,在10000 个连续刺激下具有均匀的电导变化,如图12(a)和图12(b)所示.而与两端突触相比,三端突触结构由于其额外的输入端和改进的器件结构已被证明更有利于实现复杂的突触功能[146-148].Zhu 等[149]利用2D层状WSe2,NiPS3和FePSe3设计vdWs 异质结,制备了三端离子门突触晶体管,如图12(c)所示,器件可以在生物真实性上模拟人工突触功能,并且在单脉冲刺激下能耗低至30 fJ.图12(d)则展示了生物系统和离子门突触晶体管离子浓度迁移和动态平衡的过程.而图12(e)展示了在一系列连续脉冲刺激下器件由STSP 转换到LTSP 的过程.并且,该突触晶体管展现出显著的线性和对称性,如图12(f)所示,这可以在不引入复杂的外围电路的同时实现高度可控和可预测的学习过程[150].

图12 LTSP(a)人工突触器件示意图[42];(b)重复进行LTP 和LTD 操作,一个周期是100 个增强脉冲和随后的100 个抑制脉冲.左上图和右上图分别对应最初10 个循环和最后10 个循环的运行情况[42];(c)离子门控突触晶体管的示意图[149];(d)生物系统(上)和离子门控突触晶体管(下)中离子迁移和动态平衡过程[149];(e)一系列电压脉冲(5 V,50 ms)施加到栅极(Vds=0.5 V)时,实现从STSP 到LTSP 的转换[149];(f)对基于WSe2 的突触晶体管使用增强(1.2 V,100 ms)和抑制(-0.4 V,100 ms)脉冲信号,间隔3 s,显示出良好的线性、对称性和重复性[149]Fig.12.LTSP:(a)Schematic diagram of artificial synapse[42];(b)the LTP and LTD operations were repeated with a cycle of 100 enhancement pulses followed by 100 inhibition pulses;the upper left and upper right diagrams correspond to the operation of the first 10 cycles and the last 10 cycles,respectively[42];(c)schematic of an ion-gated synaptic transistor[149];(d)ion migration and dynamic equilibrium in biological systems(top)and ion-gated synaptic transistors(bottom)[149];(e)when a series of voltage pulses(5 V,50 ms)are applied to the gate(Vds=0.5 V),the transition occurs from STSP to LTSP[149];(f)by using excitatory(1.2 V,100 ms)and inhibitory(-0.4 V,100 ms)pulsed signals with 3 s intervals for WSe2-based synaptic transistors,the device shows good linearity,symmetry,and reproducibility[149].

为了在不影响器件性能的基础上,实现较低工作电压下的突触可塑性,Wang 等[151]基于2D α-In2Se3材料制备了铁电半导体沟道器件(FeCTs),该器件不但可以很好模拟生物上的STSP,而且可以在施加小电压(±0.5 V)的脉冲刺激下实现LTP/LTD 的模拟.同时,该器件在单脉冲增强/抑制中展现了超低的能耗.

3.2.2 STSP 短期可塑性

STSP 是指通过短期内平衡大脑皮层的增强和抑制功能,来控制增强突触传递,实现神经活动的时间和空间特征,但其在记忆时间上往往只能维持几分钟甚至几秒钟.STSP 与LTSP 相对应,也同时具有短时程增强和短时程抑制,具体实现方式包括双脉冲抑制(PPD)、双脉冲易化(PPF)以及强直后增强(PTP)[56,152,153].如图13(a)所示,在生物突触中,PPD 可以通过触发两个具有时间间隔(Δt)的相同脉冲来实现.如果脉冲紧跟前一个脉冲,在一定的时间范围内,它可以表现出时间突触强度的减弱.而PPF 则与PPD 相反,突触增强行为会逐渐减弱.而PTP 和PPF 类似,也属于短时程增强的类别,但是与PPF 不同的是,PTP 持续时间可达十几秒甚至几分钟.

近来,Sun 等[26]基于MoS2设计的突触器件,通过改变两脉冲的Δt来调节MoS2突触器件产生的焦耳热进而改变器件的电导,最终成功模拟实现了PPF 和PPD,如图13(b)所示.正如预期的那样,随着Δt从10 ms 增加到10 s,PPD 和PPF指数逐渐收敛到100%,两条测量数据与拟合曲线吻合良好.图13(c)和图13(d)展示了在相同脉冲刺激下,PPF 以及PPD 的模拟效果.其中对于PPF来说,后脉冲产生了抑制前脉冲的效果,PSC 得到抑制,导致抑制性突触后电流(IPSC)进一步减小,实现了PPD 过程.对于PPD 来说,后脉冲增强了前脉冲刺激突触强度,兴奋性突触电流(EPSC)进一步增大.此外,Gao 等[154]基于2D MoTe2设计了能够在弱电刺激下模拟STSP 行为的FeFET 器件.通过增加Vg脉冲的持续时间和幅度来实现STSP 到LTSP 转变,并可以观察到更长的保持时间和更强的突触权重调制.研究还表明,STSP 到LTSP 的转变也可以通过改变突触前Vg脉冲数或脉冲频率来模拟实现.

图13 STSP(a)生物突触示意图;(b)PPD 指数和 PPF 指数与Δt 的函数关系图[26];(c)IPSC 和(d)EPSC 效果示意图Fig.13.STSP:(a)Schematic diagram of a biological synapse;(b)PPD index and PPF index are shown as the function of Δt[26];(c)IPSC and(d)EPSC effect diagram.

3.2.3 STDP 与SRDP

STDP 和SRDP 与神经形态系统中信号传输以及记忆学习相关.二者符合Hebbian 理论的学习规律,可以为突触权重调整提供一种有效方法,进而实现人工神经网络的学习功能.在Hebbian理论中,当一个突触前神经元重复或持续地刺激突触后神经元时,两个神经元之间的连接就会增强.也就是说,突触连接权重可以被加强或减弱,这取决于从前神经元到后神经元的传入信号的强度[155].这里信号强度主要指的是输入信号的尖峰时间和尖峰速率.

STDP 指的是突触权重根据施加峰值信号的相对时间进行调控的过程.在STDP 中,突触权重由突触前脉冲和突触后脉冲之间的时间延迟来调节.根据突触权重的变化和脉冲时间的间隔,STDP可以分为四种类型[156-159],如图14(a)所展示的,1)反对称 Hebbian 学习规则;2)反对称反 Hebbian学习规则(原始STDP);3)对称Hebbian 学习规则;4)对称反Hebbian 学习规则.如果将突触前(兴奋性)和突触后(抑制性)脉冲的到达时间分别定义为t1和t2,则当Δt大于或小于0 时,会使得连接强度增加或降低.Δt越小,突触权重的变化越大,反之亦然.在一个典型的STDP 中,突触权重被表示为一个双指数函数,如图14(b)所示[157,158,160].

SRDP 指的是突触权重由施加的峰值信号的尖峰频率调控的过程.它描述了突触可塑性对连续动作电位之间Δt的依赖性,在类脑神经网络中,可以通过应用一系列Δt不同的电压脉冲模拟低频或高频.一般情况下,增强型的PSC 会随着两个电压脉冲之间的Δt的缩短而增加,而抑制型的PSC则会随着Δt的缩短而减小[161].如图14(c)所示,高频重复信号(>10 Hz)会引起LTP,而低频重复信号(<10 Hz)会导致LTD[160,162,163].

图14 STDP 和SRDP(a)四种STDP 模型突触权重变化的示意图;(b)典型的STDP 模型.突触前电流(兴奋性)和IPSC 的相对时间前后影响突触权重产生LTP 和LTD;(c)典型的SRDP 模型,尖峰频率的大小带来的突触权重的变化Fig.14.STDP and SRDP:(a)Schematic diagram of synaptic weight changes of the four STDP models;(b)typical STDP model.Influence synaptic weights to generate LTP and LTD on relative timing of presynaptic currents(excitatory)and IPSCs;(c)typical SRDP model;changes of synaptic weights caused by the magnitude of the spike frequency.

由于Hebbian 学习规则可以为调整突触权重进而实现神经网络学习提供一种有效方法,Wang等[164]基于单层MoS2设计了四端突触器件.通过调节突触前和突触后脉冲的Δt来改变突触强度,很好地模拟了STDP.其中,电流增加和减少分别代表突触增强和抑制,并且电流随Δt的变化符合反对称Hebbian 学习规则,能够很好地实现神经网络计算学习.在相关性检测上,其决定系数R2>0.9,这表现了其模拟结果与生物系统STDP 有良好的相关性.此外,Liu 等[165]基于SnS2,h-BN 和少层Gr 设计了三端浮栅器件.利用浮栅器件成功模拟了SRDP,发现SRDP 指数与刺激频率成正比.这一现象表明,频率较高的脉冲序列可以加强突触前和突触后的相关性,从而产生更强的兴奋作用,这也为人工突触器件中实现高效神经网络系统的基本功能提供了条件.简而言之,SRDP 和STDP的模拟使该器件能够更好地构建神经网络.

为了更加直观地对比不同材料的人工突触器件性能,如表1 所列,分别从2D 材料[44,53,166,167]、氧化物材料[168-176]、有机材料[177-181]以及钙钛矿材料[182-185]出发,对人工突触器件的突触可塑性、耐久性、保持性、能耗或功耗、刺激方式等方面进行了比较.其中从表1 可以看出,2D 材料展现出较好的光响应,因为基于2D 材料的忆阻器在具有良好的保持性和耐久性的同时,其突触器件体现出较低的能耗;氧化物材料的研究相对成熟,器件具有较好的保持性,可以很好地模拟突触可塑性;有机材料在柔性应用方面有很大前景,可以在低功耗的基础上实现光电耦合调控,但其在高温下有机分子不稳定,易分解;基于钙钛矿材料的器件功耗相对较低,对光、电有良好的响应机制,但其在有氧以及高温环境下,数据保持性和耐久性较差.

表1 不同材料的人工突触器件性能对比Table 1. Performance comparison of artificial synaptic devices based on different materials.

4 2D 材料神经形态器件的应用

基于2D 材料的神经形态器件可以将存算一体器件和传感器的功能集成到一个设备中,这为实现感存算一体的多功能神经形态计算,尤其是对于构建人工感知系统开辟了一条新途径.并且,基于2D 材料的神经形态器件不仅在光电子学、生物学、声学以及热学等方面具有良好的物理性质,同时其在纳米尺度下会伴随新奇的物理性质[186].这也使得基于2D 材料的神经形态器件可以满足人们在生物感知(视觉识别[161,187]、声音定位[26]、触觉模拟[188,189])等领域的应用需求.

4.1 视觉识别

人们在用突触器件模拟大脑神经网络方面已经做了广泛的研究[147,190-193].视觉作为人类感知系统中重要的一部分,可以使人能够感知外界环境中物体的方位、形状、大小等各种信息,并且人类依赖视觉获得的信息比通过其他方式获得信息的总和还要多.因此构建视觉识别系统,并对视觉信息进行存储以及分类,是神经形态器件广泛应用的重要部分.

然而,基于传统图像传感器、存储器的人工视觉系统依赖复杂电路,这使得在器件集成和功耗方面存在严重挑战.基于此,Zhou 等[194]利用Pd/MoOx/ITO 结构设计了两端光电电阻随机存取存储器(ORRAM),并发现此结构在波长为365 nm、功率密度为150 mW·cm-2的紫外激光器下可以实现HRS到LRS 的转变,展现出了非易失特性.如图15(a)所示,视觉信息首先通过人眼中的视网膜被检测和提取,然后该信息进一步通过视神经,并在视觉皮层中得到处理.在构建的神经形态视觉系统中,ORRAM 阵列可以实现人类视网膜中的传感和预处理功能.在预处理后的图像经过三层人工神经网络,可完成网络的训练和识别,如图15(b)所示.图15(c)展示了通过ORRAM 进行预处理后,字母的主体特征被突出显示,背景噪声信号被平滑.其中,图像识别率和效率在使用ORRAM 预处理后,有了明显的提高(图15(d)).该方案展示了利用ORRAM 简化神经形态视觉系统电路的能力,促进了基于简单电路的人工视觉系统的发展.

图15 视觉识别(a)人体视觉系统的示意图[194];(b)基于ORRAM 阵列的人工神经形态视觉系统,以及用于图像识别的人工神经网络示意图[194];(c)人工神经形态视觉系统预处理之前(左)和之后(右)的图像示例[194];(d)有/无图像预处理的图像识别率比较[194];(e)在生物RC 系统上执行的认知任务示意图[195];(f)由电和光输入刺激的多功能忆阻器阵列示意图;(g)对语言符号的识别准确率[195]Fig.15.Visual recognition:(a)Schematic diagram of the human visual system[194];(b)artificial neuromorphic vision system based on ORRAM array,and artificial neural network for image recognition[194];(c)images before(left)and after(right)preprocessing through an artificial neuromorphic vision system[194];(d)comparison of image recognition rates with and without image preprocessing[194];(e)schematic diagram of cognitive tasks performed on biological RC systems[195];(f)illustration of a multifunctional memristor array stimulated by various electrical and optical inputs;(g)recognition accuracy of language sign[195].

为进一步提高计算效率,降低成本,Sun 等[195]采用储备池计算(RC),实现了在较低的计算成本下简单快速地对数据进行训练,读出权重,使得学习、计算成本大幅降低.Sun 等通过2D SnS 制备了忆阻器阵列,并实现了大脑的视觉皮层功能对语言的学习和记忆.图15(e)展示了人脑视觉皮层神经元之间的复杂连接和RC 在权重训练后的输出结果.语言符号作为光学信号输入到RC 系统中,不需要专门的图像传感器和相关的模式数据转换,大大节省了能耗和时耗.并且在加入随机噪声干扰后,对测试的语言符号的识别准确率仍然高达91%,如图15(f)和图15(g)所示.该研究为边缘计算达到低训练成本和信息的快速时效处理提供了解决方案.

此外,Du 等[196]基于单层MoS2和BaTiO3铁电薄膜设计了基于光电晶体管结构的神经形态视觉传感器.利用波长依赖的光学传感和多级光学存储特性来实现传感器内神经形态视觉预处理,减少了冗余数据,使得MNIST 手写数据集的图像识别率从15%提高到91%.

4.2 声音定位与模式识别

人类的听觉可以检测、处理和存储声音信号,这使得我们可以辨别发声物体的性质、方向和距离等,进一步使得大脑更加准确地指导我们的行为[197,198].人类听觉通道中的神经中枢不仅仅可以检测、转化电信号,还可以处理和存储声音[199,200].因此,对于人工听觉系统来说,不仅仅要做到接受外界电信号,同时还要对信号进行进一步分析处理和存储.

其中人类听觉的一个重大作用就是可以实现声音定位,其主要依靠双耳时差(ITD)和双耳水平差(ILD)进行定位,如图16(a)所示.基于此,Sun等[26]利用单层MoS2设计了一种横向结构的忆阻器,并可在超低能耗(几十fJ)下实现STSP 的人工突触计算.器件沟道中积累的焦耳热可以使其电导发生改变,进而实现突触可塑性可调,如图16(b)和图16(c)所示.为了抑制ILD 对声音定位的干扰,图16(d)显示了通过抑制声音强度或IPSC 来检测双耳时间差,从而对声音源进行准确的定位.这项工作在无需使用晶体管的情况下成功演示了声音定位对声音源的识别过程.之后,Seo 等[167]开发了一种具有线性和对称的电导更新特征的人工vdWs 混合突触器件,成功实现了对声音模式的准确识别(90%以上),如图16(e)所示.Seo 等通过使用WSe2和MoS2杂化沟道实现了优异的电导可控性,这两种沟道分别用于线性电导增强和抑制.通过训练和推理模拟,证明了混合突触对硬件神经网络(HW-NN)的可行性,并提供了与软件神经网络(SW-NN)相当的高识别率,如图16(f)所示.

图16 声音定位与模式识别(a)ITD 和ILD 的声音定位示意图[26];(b)电压扫描下焦耳热驱动的电导变化;(c)两个连续脉冲刺激后的PPF 和PPD 指数与Δt 的函数关系图[26];(d)基于ITD 的声音定位的突触计算工作机制示意图;“CA”指图(a)所示的耳蜗,蓝色的圆圈代表神经元,水平虚线代表神经元放电的潜在阈值[26];(e)生物突触与vdWs 混合突触器件的功能和结构比较[167];(f)基于三种人工神经网络的声学模式识别率,并与SW-NN 的识别率进行比较[167]Fig.16.Sound localization and pattern recognition:(a)Schematic diagram of sound localization of ITD and ILD[26];(b)joule heat driven conductivity change under the sweep voltage[26];(c)the pulse intervals dependent PPF and PPD indexes stimulated by two consecutive pulses[26];(d)schematic diagram of the synaptic computing of ITD-based sound localization;“CA” refers to the cochlea shown in panel(a);the blue circles represent neurons;horizontal dashed lines represent potential thresholds for neuronal firing[26];(e)comparison of function and structure between biological synapses and vdWs hybrid synaptic devices[167];(f)acoustic pattern recognition rates based on three artificial neural networks with compared results achieved by the SW-NN recognition rate[167].

4.3 触觉模拟

触控操作是当前人与智能设备交互的主流方式,其工作模式高度依赖于人体的触觉.人体皮肤深层存在触觉小体,内有大量的神经细胞,当皮肤感受到外界环境中压强、温度、湿度变化时就会发出微小的电流信号,并随着神经纤维传输到大脑,进而产生触觉[201].

目前来说,开发高性能、制造工艺简单的人工触控突触仍然是一个巨大的挑战.但随着压电电子学的发展,研究者发现外界的机械刺激可以引起压电极化和半导体传输特性之间的耦合效应,这种耦合行为与人工神经元和传入神经中的耦合行为非常相似[201].因此,利用压电效应驱动的突触晶体管成为实现并行感知和计算的重要途径.基于此,Chen 等[202]将压电纳米发电机(PENG)与离子凝胶门控晶体管集成,报告了一种基于石墨烯的压电突触器件.人体皮肤中的感受器接受机械刺激并将其转化为突触前电位,并通过神经元和突触传递到中枢神经系统,如图17(a)所示.其器件结构如图17(b)所示,由一个作为感觉组件的PENG 和一个作为人工突触的离子凝胶门控Gr 场效应晶体管组成.其中,信号传输过程是将机械应变触发的压电势通过离子凝胶电容耦合到场效应晶体管来实现的.图17(c)则进一步揭示了压电Gr 人工感觉突触的工作原理,通过机械应变触发PENG 产生感应电场,使离子凝胶中的离子分布不均匀,从而导致Gr 沟道中的电导发生变化.此外,他们通过对PENG 施加的拉伸和压缩应变脉冲模拟了人工突触可塑性,如图17(d)所示.这项工作为开发神经形态计算中的压电电子突触器件提供了新的思路,这对于未来研发具有人工智能的自供电电子皮肤、神经机器人的神经形态接口、人机交互以及智能压电晶体管等具有重要意义.

图17 触觉模拟(a)生物触觉神经系统[202];(b)带有离子凝胶门控晶体管的 PENG 示意图[202];(c)压电Gr 人工触觉突触工作原理[202];(d)PSC 幅度与应变脉冲数的关系图[202]Fig.17.Tactile mimicking:(a)Biological sensory nervous system[202];(b)schematic diagram of a PENG with iongel-gated transistors[202];(c)the working principle of piezoelectric Gr artificial sensory synapse[202];(d)PSC amplitude shown as the function of strain-pulse number[202].

5 总结展望

2D 材料及其异质结的新奇物理特性,使得神经形态器件能够实现低工作电压以及高开关速度,降低了能耗,提高了器件性能.另一方面,2D 异质结界面性质能够通过栅极电压进行调控,从而更好地模拟神经元和突触功能.因此,2D 材料及其异质结对于构建具有多功能突触器件,设计合理的神经形态集成电路,实现神经形态器件在柔性器件、感知系统等方面的应用上显得至关重要.本文在综述了神经形态器件工作的物理效应之外,还介绍了2D 材料在神经形态发展中的特点和优势.另外,对基于2D 材料的神经形态器件实现人工突触功能做了详细阐述,比如STSP,LTSP 以及STDP 等,并且与传统神经形态器件相比,具有高集成度、低功耗、权重可调、突触学习加速等优势.最后本文对神经形态器件在视觉识别、声音定位、模式识别及触觉模拟等方面的应用做了举例介绍.

虽然近些年基于2D 材料的神经形态器件有了重大研究进展,例如在单一忆阻器单元实现感存算功能[194]、超快感存算神经网络用于图像识别[203]、340 ℃高温极端环境下稳定性良好的异质结忆阻器[130]、高密度存储的忆阻器阵列等[122],但是对于实现人工智能神经形态计算应用体系走向实际应用的角度来看,目前仍在材料制备、工艺兼容、高密度集成、高效能算法构架等方面具有挑战性[204,205].

1)高质量均匀2D 材料的晶圆级合成及无损伤转移;大面积、高质量的2D 晶体是开发下一代光电器件的基础.而晶圆级2D 材料的合成是产业化应用的关键步骤.目前,CVD 可实现晶圆级合成,并且操作相对简单,但是在CVD 生长过程中会引入不必要的缺陷,影响材料的质量,同时会使得材料表面产生不可逆的粗糙度改变从而影响了器件的性能[116,206].此外,2D 材料之间清洁的界面对器件性能有很大的限制.为了获得理想的vdW异质结,可以通过以下几种有效方法来获得洁净的表面: 在真空中退火,样品表面的残留物会显著减少[207],或者用氯仿溶解聚合物残留物[208];另外,通过原子力显微镜接触模式对样品表面机械清洁[209].在vdW 异质结搭建过程中,层间气泡的产生是很难避免的.但这可以使用热传导来抑制气泡的产生,同时去除材料表面上的吸附物[210].总之,高质量均匀2D 材料的晶圆级合成及无损伤转移是器件制造过程的重要环节.

2)与传统CMOS 工艺的兼容性;2D 材料及其异质结能否集成到现有硅基器件在很大程度上取决于它们与现有CMOS 制造工艺的兼容性[211].现有用于2D 材料的CVD 生长工艺需要600-900 ℃范围内的温度,这限制了它们在已成型的CMOS 基板上的直接生长[212].尽管存在一些降低生长温度的技术,但所得材料的质量仍有待解决[213,214].因此,解决神经形态计算器件的 CMOS工艺兼容性问题,是实现大规模集成并设计用于实际应用的类脑芯片的基础.

3)低功耗、高稳定性的器件开发;突触器件的能耗在神经形态计算器件的实现中起着至关重要的作用.沉积在2D 材料上的金属电极会部分破坏原子晶格中的共价键,产生费米能级钉扎效应形成肖特基接触,导致接触电阻增加,从而会引起功耗的增加[215,216].这需要通过改变掺杂或者接触方式来降低2D 材料与金属电极接触电阻产生的能耗.另外,通过降低操作电压,以及降低漏电流、提高电流的开关比也可明显地降低器件的功耗[217].

因此,对于面向未来计算的神经形态器件集成阵列,首先要制备出高质量、大面积、与传统CMOS工艺兼容的2D 材料,并通过特定的物理效应设计出高开关比、低功耗的神经形态器件,同时开发与人类大脑相媲美的神经网络来存储和处理信息,最后利用高密度的集成工艺构建出大规模、基于存算一体架构的神经形态计算系统,延续摩尔定律,克服冯·诺依曼瓶颈的限制,提高计算能力.

猜你喜欢

异质器件神经元
基于异质分组的信息技术差异化教学
《拉奥孔》中“诗画异质”论折射的西方写实主义传统
“对赌”语境下异质股东间及其与债权人间的利益平衡
AI讲座:神经网络的空间对应
Finding the Extraterrestrial
仿生芯片可再现生物神经元行为
这个神经元负责改变我们的习惯
研究人员精确定位控制饮酒的神经元
旋涂-蒸镀工艺制备红光量子点器件
执政者应学习异质传播