APP下载

基于贝叶斯优化的磁光阱多参数自主优化系统

2023-07-08段俊毅于治龙刘小赤

导航定位与授时 2023年3期
关键词:原子团贝叶斯原子

陈 浪,段俊毅,于治龙,郭 烁,刘小赤

(1.沈阳化工大学信息工程学院,沈阳 110142; 2.中国计量科学研究院前沿计量科学中心,北京 100029; 3.中国科学院精密测量科学与技术创新研究院,武汉 430071)

0 引言

激光冷却原子技术是20世纪末以来物理学发展最为迅速、成果最为辉煌的领域之一,作为一种外部操控原子的手段,其实现紧密依赖于光与原子的相互作用。冷原子已成为量子物理基础研究、量子标准与精密测量、量子信息等研究领域的最佳工作介质[1]。其中,以冷原子物理系统为基础的冷原子钟在当前各种物理量测量中具有最高的精密度和准确度,例如光晶格钟、离子光钟的频率不确定度达到10-18至10-19量级[2]。除此之外,冷原子技术还广泛运用于量子精密测量、量子计算、量子模拟等研究领域[3-6]。磁光阱(magneto-optical trap,MOT)是获得冷原子的简便可行装置,该技术相对于其他冷原子技术更简单、易于操作,但是如何选择合适的参数去优化磁光阱性能对相关冷原子实验至关重要[7]。

通过磁光阱获得冷原子样品,需要中性原子与特定波长激光相互作用。以典型87Rb原子磁光阱为例,可使用一束波长为780nm的激光作为冷却光,另一束波长为795 nm的激光作为再泵浦光,并配合一对具有特定磁场梯度的反亥姆霍兹线圈实现对87Rb原子的冷却与囚禁。实验操作主要涉及到冷却光频率失谐、冷却光功率、磁场梯度、再泵浦光功率、激光偏振等多个变量调整,所以开展冷原子实验是一个反复、多步骤的过程[8-9]。通常,实验参数调整范围依据物理理论存在特定区域,可以根据理论进行分阶段优化,但不同参数之间一般并不相互独立,基于经验优化得到的实验参数易受到外部因素的影响,相同的实验参数在不同实验环境下可能会得到有差异的测量结果[10]。另一方面,通过经验调整实验参数的方式需要付出大量时间成本,优化一次实验参数可能需要几个星期甚至更长的时间。

将机器学习算法与物理实验相结合是一种有效优化系统的方案,利用算法进行系统参数优化,通过结合实验系统设计成本函数,利用优化算法对成本函数求最大值,最终可确定最优的实验参数[11-13]。即便此类方案是高度非直观,但效果通常优于传统解决方案且能自主运行[14-15]。当前使用机器学习算法对量子系统参数进行在线优化的方法主要有人工神经网络和差分进化算法[16-20]。但此类算法有一定局限性,人工神经网络需合理设计网络结构,使用大量实验数据训练模型并且容易陷入过拟合与局部最优,需与其他全局最优算法结合使用;差分进化算法种群个数不应设置较少,导致下一代个体适应度比原种群个体适应度差,个体无法更新并收敛到极值点。

为了快速优化磁光阱系统参数,并克服常用优化算法的瓶颈,本文提出了利用贝叶斯优化算法对磁光阱实验系统的多参数进行自主优化。通过将贝叶斯优化算法与实际磁光阱物理系统相结合,设计成本函数,形成多参数自主优化系统。通过运行优化算法对磁光阱系统进行实时优化,对成本函数求最大值得出磁光阱系统最优实验参数。将算法优化与人工优化的系统参数进行测量对比,算法优化相较于人工短时间内优化的参数能够捕获更多冷原子并且原子团温度更低。实验结果表明:该方法能够在短时间内对含有大量参数的复杂物理系统进行优化,并得到较好的效果,也为其他复杂物理系统参数优化提供参考。

1 实验原理

1.1 磁光阱实验原理

传统六束光的磁光阱示意图如图1所示,三对激光束交汇于气室中心,每对激光是偏振方向相反的σ+与σ-光,沿z轴方向通过两个反亥姆霍兹线圈,产生大小与坐标位置有关的非均匀磁场,坐标中心处磁场为零[21-22]。除冷却光外,通常需要再加一束激光用作再泵浦光,将跃迁到其他基态能级的原子重新抽运回来。

图1 三维磁光阱实验装置示意图Fig.1 Schematic diagram of the three-dimensional magneto-optical trap experimental device

为了提升原子冷却数量和进一步降低冷原子温度,磁光阱系统参数需要一定的优化,主要包括冷却光功率、冷却光失谐、再泵浦光功率、磁场梯度等。上述参数若利用人工优化,可能需耗费大量时间。理想的解决方案是使用机器优化算法代替人工,进行自主在线优化,可在短时间内得到一组较优的实验参数。我们拟采用贝叶斯优化算法对磁光阱的各项参数进行优化。

1.2 贝叶斯优化原理

贝叶斯优化是一种高效的全局最优化算法,在科学研究与工业领域运用广泛[23]。通过选择合适概率代理模型与采集函数,设计合适的成本函数,贝叶斯优化只需少数次成本函数评估便可获得近似最优解,适用于求解目标表达式未知、多峰、非凸以及评估代价高昂的问题。

考虑将求解磁光阱系统最优参数问题转化为式(1)最优化问题加以求解

x*=argmaxx∈χ⊆Rdf(x)

(1)

式中,χ为参数优化范围,R为实数集,f为成本函数,x为控制系统运行的实验参数,f(x)为判断系统运行好坏的反馈指标,x*为最优参数集合。

贝叶斯优化求解目标是找到式(1)的全局最优解。假设现有4个不同输入x1,x2,x3,x4及对应成本函数值y1,y2,y3,y4,考虑如何选取下一个评估点。理论上,贝叶斯优化属于主动学习中的一种,由于贝叶斯优化使用代理模型拟合真实的目标函数,根据拟合结果挑选下一个评估点,避免无效的采样,所以贝叶斯优化能在少数次评估下得出复杂目标函数近似最优解,另一方面,贝叶斯优化利用完整的历史数据提高搜索效率[24]。

贝叶斯优化算法的主要模型是贝叶斯定理

(2)

式中,D1:n={(x1,y1),(x2,y2),…,(xn,yn)}为已有数据集合,f为未知目标函数,xn为实验参数,yn=f(xn)+εn为实验效果反馈,εn为随机观测误差,p(D1:n|f)为y的似然分布,p(f)为f的先验概率分布,代表对未知目标函数状态的假设,p(D1:n)为边际化f的边际似然分布,p(f|D1:n)为f的后验概率。

贝叶斯优化主要包括两个核心部分:采集函数和概率代理模型[25]。采集函数根据后验概率分布构造,通过最大化采集函数选择下一个最有潜力的评估点,有效的采集函数能保证选择的评估点使用总损失最小。

(3)

式中,y*为当前最优解,常用的采集函数有汤普森采样、熵搜索、置信边界策略等等。

概率代理模型包含先验概率模型和观测模型,先验概率模型即p(f),观测模型描述观测数据生成的机制,即似然分布p(D1:n|f),根据式(2)更新概率代理模型得到更多后验概率分布p(f|D1:n)。常用的概率代理模型主要包括高斯过程、随机森林、深度神经网络等等。

通过贝叶斯优化算法对磁光阱系统参数进行计算优化主要包括以下3个步骤:

1)根据最大化采集函数产生冷却光功率、冷却光失谐、再泵浦光功率、磁场梯度等参数取值xn;

2)根据生成参数值设置对应仪器,对磁光阱系统运行效果进行评估得到目标函数值yn=f(xn)+εn;

3)将新得到的参数取值与目标函数值对{xn,yn}添加到历史数据集D1:n-1中,并更新概率代理模型,跳转到步骤1,直到满足退出条件,输出磁光阱系统最优参数。

2 实验系统

2.1 磁光阱实验系统

磁光阱真空系统如图2(a)所示,长宽高分别为2 cm、2 cm、3.5 cm,玻璃腔室体积为14 cm3,系统整体体积大约80 cm3。实验中为防止外部电磁场干扰,使用磁屏蔽罩住玻璃腔室。包括冷却光和再泵浦光的整体桌面实验系统如图2(b)所示。系统能够冷却106数量级的原子,冷原子荧光在CCD相机中成像如图2(c)所示。

图2 磁光阱实验系统示意图Fig.2 Schematic diagram of magneto-optical trap experimental system

87Rb原子能级与整体实验装置示意图如图3所示。磁光阱系统冷却光(cooling)与探测光(probe)来自于可调谐半导体激光器(DL),激光的波长调谐到铷的D2线780 nm附近,激光线宽小于10 kHz,饱和吸收稳频系统(SAS)将激光器频率稳定在从基态52S1/2(F=2)跃迁到激发态52P3/2(F′=1 co 3)交叉吸收峰上,经过偏振分束片(PBS)将激光分成两束,一束用作冷却光,另一束用作探测光。冷却光经过声光调制器(AOM)两次移频后频率负失谐于F′=3大约1.5Γ,Γ为Rb原子激发态的自然线宽(2π × 6.07 MHz)。探测光功率大约为0.2 mW,经过声光调制器两次移频后频率负失谐于F′=3大约5 MHz,经过凸透镜(Lens)扩束之后进入石英玻璃腔,同时开启CCD相机接收探测光通过吸收成像法计算囚禁原子的数量与温度。再泵浦光(repump)来自于分布式反馈激光器(DFB),激光器波长调谐到铷的D1线795 nm附近,饱和吸收稳频系统将激光器频率稳定在从基态52S1/2(F=1)跃迁到激发态52P1/2(F′=2)上。利用声光调制器控制再泵浦光的开关,冷却光与再泵浦光重叠后一起通过光纤耦合进入光纤系统,之后利用光纤分束器将激光均匀分成3束,每束激光功率为8.8 mW左右,光束直径为7 mm。激光进入石英玻璃腔之前,用λ/4玻片将线偏光转化为左旋圆偏振光(σ-)和右旋圆偏振光(σ+),这样能利用速度引起的跃迁选择和多普勒频移定则,使原子始终感受到光的辐射压力,从而冷却并囚禁起来。

DL为半导体激光器;DFB为分布式反馈激光器;OI为光隔离器;BS为分束片;SAS为饱和吸收稳频系统;PBS为偏振分束片;QWP为1/4波片;M为全反镜;Lens为扩束凸透镜;CCD为电荷耦合器件;Magnetic Shield为磁场线圈图3 87Rb原子能级图与整体实验装置示意图Fig.3 87Rb atomic energy level diagram and schematic diagram of the overall experimental setup

实验中四级磁场由一对反亥姆赫兹线圈提供随空间位置线性变化的磁场,在一定范围内改变线圈电流大小,调节磁场梯度大小,一般磁场梯度在10 Gs/cm左右。

2.2 磁光阱多参数在线自主优化系统搭建

将贝叶斯优化算法与实际磁光阱系统相结合,首先需确立磁光阱系统优化目标并设计成本函数。对于磁光阱性能优化评估,一般冷却原子数量和原子冷却温度是最重要的2个参数。但是一般探测原子数与原子团温度的方法,如吸收成像法与荧光成像法无法做到实时自动计算,需要人工手动寻找原子团在图像中的具体区域,另一方面算法优化需要多次尝试不同的参数从而确定最优参数,如果对于每一组参数都需要手动计算,实时性较差。一组参数好坏,可以直接从CCD相机所探测的原子团荧光中体现出来,例如图2(c)所示,参数设置越合理,CCD相机中成像原子团体积就会越大并且对应像素点取值越高,该值可以实时计算且原子团在CCD相机中成像区域是固定的,故可将成本函数设计如下

(4)

式中,C(X)为给定一组参数的成本开销也称为成本函数,n为一组参数重复执行次数(实验中n取值为3),xy为原子团所在矩形区域,pij为像素点明暗程度,ε为一较小的随机偏置量,算法优化目标是找到一组使得成本函数最大化的参数。

磁光阱系统待优化参数主要有4个,冷却光功率、冷却光失谐、再泵浦光功率及磁场梯度。其中再泵浦光激光功率通过AOM1控制、冷却光激光功率与频率失谐量通过AOM2控制、磁场梯度通过电流源输出电流控制、探测光开启与关闭通过AOM3控制。使用NI板卡(NI6361)输出TTL脉冲信号控制AOM与电流源开启与关闭及CCD相机触发拍照;使用LabVIEW完成控制仪器运行程序的编写;使用Python中的bayesian-optimization库实现贝叶斯优化算法的调用[26]。Python与LabVIEW通过TCP连接实现优化参数的传输。

多参数在线自主优化流程如图4(a)所示,首先确定每一个优化参数的取值范围,随机选取5组初始参数并借助磁光阱实验系统完成初步5次实验,得到初始化参数及其对应成本作为初始数据集。之后使用贝叶斯优化算法拟合成本函数并预测出当前的最优参数,将预测参数反馈回磁光阱系统进行实验,得到该组参数的成本开销。然后判断当前成本开销是否为到目前为止最大值,若为最大值则记录该组参数。最后判断程序是否满足退出条件,程序退出条件设置为以下两种情况之一,第一种是达到最大优化次数,第二种是连续50次成本开销均没有大于之前的最大值,若两种情况均不满足,则将该组参数及开销加入数据集中,继续下一轮优化,否则输出最优参数集,算法优化完成。

图4 磁光阱多参数在线自主优化系统实验时序Fig.4 Experimental time sequence for magneto-optical trap multi-parameter online autonomous optimization system

磁光阱实验时序图如图4(b)所示,首先LabVIEW通过TCP连接接收到对应冷却光功率、冷却光失谐、再泵浦光功率、磁场梯度等参数,将参数设置到对应AOM、电流源中,该过程会持续大约100 ms。之后通过NI板卡输出TTL脉冲信号开启冷却光、再泵浦光、电流源输出激光囚禁冷却原子,该过程大约持续1 s。然后通过外部硬件触发开启CCD相机进行长曝光,拍摄原子团图像,曝光时长大约100 ms。最后根据拍摄的原子团图像计算参数开销,反馈回优化算法,产生下一组参数,以此往复,直到优化完成。一组参数从优化算法生成、磁光阱运行、原子团图像拍摄、计算参数开销整个流程能在10 s之内全自动完成。

3 实验结果与讨论

3.1 实验结果

结合具体磁光阱系统实验环境及贝叶斯优化算法,将冷却光光功率设置为0.3~21.4 mW,冷却光失谐设置为-5~0Γ,再泵浦光光功率设置为0.1~5 mW,磁场梯度设置为1.75~14 Gs/cm。在以上参数区间随机选取5组不同参数,代入磁光阱系统进行实验可得出5个实验开销。将5组参数组合之后,作为初始数据集,运行贝叶斯算法优化,经过大约30 min的优化过程,迭代优化300次后的实验结果如图5所示。

图5 多参数实时在线优化参数调整实验结果。Fig.5 Results of multi-parameter real-time online optimization parameter adjustment

图5(a)反映了对于不同实验参数以及成本函数变化过程,图中圆点表示当前实验轮次实验参数取值,红线表示到当前实验轮次为止最优参数取值,一组实验参数效果优劣由实验系统运行后给出反馈后再由成本函数计算得出,成本函数取值越大代表该组参数越适合作为实验系统运行参数。经过260次优化之后成本函数达到最大,得出磁光阱系统运行最优参数。图5(b)反映了冷却光功率在参数区间的优化过程,图5(c)反映了冷却光失谐在参数区间内的优化过程,图5(d)反映了再泵浦光在参数区间内的优化过程,图5(e)反映了磁场梯度在参数区间的优化过程。5张图的横坐标为实验次数,包括5次初始化实验与300次优化实验。从图5中可以看出4个优化参数起初起伏变化比较大,随着后续的算法迭代优化,各参数在区间内的起伏程度逐渐降低并趋于稳定,这样的实验结果是符合实验逻辑的。

算法优化过程中记录每一组实验参数取值以及成本函数反馈值,成本函数反馈值越大,说明该组参数越适合作为实验系统的运行参数,算法优化完成后比较输出成本函数最大取值所对应的实验参数值作为实验系统最优实验参数。最终得到最优实验优化参数为冷却光功率为21.3 mW,冷却光失谐为-1.82Γ,再泵浦光功率为4.95 mW,磁场梯度为9.77 Gs/cm。

3.2 结果讨论

表1显示了对于磁光阱系统运行参数使用贝叶斯优化算法自动调参、差分进化算法自动调参、人工手动调参得到的参数值,从表中可以看出算法自动调参与人工手动调参两者得到的结果有一定相似性,但算法自动调参的优点是可以在有限的时间内进行多次尝试,有更大概率找到系统运行最优参数并且不需要先验经验,具有更广泛的适用性。贝叶斯优化算法相对于差分进化算法的优势是每次迭代优化只需采集一个数据点,而差分进化算法需要采集的数据点由种群的个数决定,并且贝叶斯优化算法能够有效利用完整的历史信息来提高优化效率,减少优化所需时长。下面分别使用贝叶斯算法自动调参与人工手动调参得到的参数运行磁光阱系统测量冷却原子数及原子团温度作对比讨论。

实验中使用吸收成像法测量原子数,吸收成像法是用一束近失谐的探测光与原子相互作用,利用了Lambert-Beer定律。图6(a)显示了人工调整得到的原子团图像,图6(b)显示了贝叶斯优化算法得到的原子团图像,可以看出算法优化得到的原子团体积更大。图6(c)显示了两种不同方法在不同冷却光功率情况下捕获的原子数,随着激光功率的增加,原子数先增加后趋于稳定,算法优化得出的参数相对于手动优化得出的参数能够捕获更多原子数。

图6 优化算法自动调参与人工手动调参捕获原子数对比Fig.6 Comparison of the number of atoms captured by the optimization algorithm automatic parameter adjustment and manually parameter adjustment

实验中使用时间飞行法测量原子团温度,测量方法是快速关闭磁光阱,使原子团受热膨胀,由于该过程中原子动能没有改变,所以具有不同速度的原子从囚禁中心到探测区域所用时间不同,在相同时间内不同速度原子的飞行距离也不同[29-30]。在关闭磁光阱后一定时刻拍摄原子团荧光,可以得到空间域上膨胀的原子分布,原子团大小取决于初始温度大小,由此可计算初始原子团温度

(5)

式中,σ为原子团拟合半径的1/е,kB为玻尔兹曼常数(1.380 649×10-23J/K),T为原子团温度,m为87Rb原子的质量(1.443 160 60×10-25kg),t为关闭磁光阱后的时长。

关闭磁光阱后,原子团会往横向和纵向两个方向进行扩散,可以计算出原子团的横向及纵向温度。图7(a)显示不同时刻原子团的光学深度图像(OD),随着原子自由演化时间增加,原子团逐渐向四周扩散膨胀,OD值逐渐降低。图7(b)与图7(c)显示了算法优化的参数与手动优化的参数原子团的横向温度与纵向温度的线性拟合结果,经过算法优化后的原子团具有更低的横向温度与纵向温度,横向温度从0.83 mK降低到0.7 mK,纵向温度从14.3 mK降低到10.9 mK,优化效果显著。

图7 优化算法自动调参与人工手动调参捕获原子团温度对比Fig. 7 Temperature comparison of captured atomic clusters by the optimization algorithm automatic parameter adjustment and manual parameter adjustment

4 结论

我们构建了基于贝叶斯全局最优化算法的多参数自主实时优化系统。通过设计成本函数,优化了磁光阱系统参数,验证了自主实时优化物理系统的多参数方案的可行性。实验结果表明,基于该系统可以实现复杂实验系统的多参数自主优化,经过约30 min的实时优化,我们得出一组可靠的最优系统运行参数,该组参数与手动优化的参数相比能够有效提升系统捕获的原子数,并降低原子团温度。所提方案可以通过设计不同的成本函数推广到其他需要进行参数优化的量子实验系统中。本研究为系统化、远程操控冷原子实验系统提供了一种实时、全自动、智能化的运行控制方法,为冷原子频标物理系统的快速优化提供了一种方案。

猜你喜欢

原子团贝叶斯原子
Ti3Al 合金凝固过程晶核形成及演变过程的模拟研究*
原子究竟有多小?
原子可以结合吗?
带你认识原子
一种精确测量原子喷泉冷原子团温度的方法*
贝叶斯公式及其应用
基于贝叶斯估计的轨道占用识别方法
烃的组成和性质考点初探
一种基于贝叶斯压缩感知的说话人识别方法
IIRCT下负二项分布参数多变点的贝叶斯估计