APP下载

剖面似然比统计及CLs方法在PandaX-II 暗物质实验数据分析中的应用

2019-12-31阿布都沙拉木阿布都克力木吾尔尼沙依明尼亚孜

上海交通大学学报 2019年12期
关键词:暗物质事例检验

阿布都沙拉木·阿布都克力木,谌 勋,吾尔尼沙·依明尼亚孜

(1. 新疆大学 物理科学与技术学院,乌鲁木齐 830044; 2. 上海交通大学 物理与天文学院,上海 200240)

近年来,众多宇宙学和天文观测证据都强烈暗示着宇宙中存在大量的暗物质[1].理论物理学家对暗物质的本质有若干猜想,其中最为流行的理论之一[2-3]认为暗物质是一种参与某种弱相互作用的大质量粒子(WIMP).在极低本底环境下,利用高灵敏的粒子探测器对暗物质进行直接探测是研究WIMP的重要手段.

在过去的三十多年时间内,国际上进行了多项暗物质直接探测实验研究,但是除了个别被广泛质疑的信号外,大部分实验都没有找到暗物质的迹象[4-7].近年来,基于二相型液氙技术的暗物质直接探测实验将暗物质探测的灵敏度提高了多个数量级,其中由我国主导的PandaX-II 暗物质直接探测实验更是基于当时世界上最大的5.4×104kg·d的数据集,于2017年给出了对质量大于100 GeV/c2(1 eV/c2=1.782×10-36kg)的暗物质与普通物质自旋无关散射截面的最强限制[6].

自2017年以来,PandaX-II 实验还分别发表了关于暗物质与普通物质自旋相关散射、轴子暗物质及非弹性散射暗物质的研究结果[8-10].由于数据分析没有找到超出本底的信号,因此仅给出了相应的排除曲线.在这些分析中,剖面似然比(PLR)[11]被用于构造检验统计,并结合一种被称为CLs的方法[12]来估计需要检验的物理量的可能取值.本文以暗物质与普通物质的非弹性散射过程为例,结合PandaX-II 实验在2016年获取的数据,详细讨论如何运用PLR及CLs方法来计算暗物质与核子的等效弹性截面上限.

1 PandaX-II 实验及其数据分析

PandaX-II 实验是一个运用二相型(气/液)氙时间投影室(TPC)技术来进行暗物质直接探测的实验[13].PandaX-II 使用的TPC大致为一个直径约60 cm,高约60 cm的圆柱形,内部装有大约580 kg的液氙.TPC上下各有一个阵列,由55个直径3 inch(1 inch=2.54 cm)的光电倍增管(PMT)组成,用于探测闪烁光信号.粒子在液氙里面与氙原子核或核外电子发生散射,这个过程中部分转移的能量会产生可以被PMT阵列捕获的闪烁光信号(通常被称为S1);还有一部分能量将氙电离,产生自由电子,这些电子在TPC的强电场作用下漂移到气态氙中,并产生可以被PMT接收的正比闪烁光信号(通常被称为S2).采用PMT接收到的光电子(PE)数目来表示光信号的强度.根据一般的暗物质理论,WIMP与原子核散射的截面远大于其与电子散射的截面,因此它在探测器里面发生核反冲的概率更大[14].核反冲过程中产生的自由电子更容易发生重结合,这会增大S1并减少S2;该特征可以用于分辨电子反冲的本底[15].

PandaX-II 实验的数据分析目标为在理论建议的反冲能量区间内寻找出可能的超出本底预期的核反冲信号.为了完成这个目标,探测器记录到的信号需要根据刻度得到的参数进行均匀性修正,并通过一系列数据质量筛选,最终得到待定信号区间内的候选粒子,并运用统计学的方法对候选粒子进行检验.关于数据修正和筛选的细节,可以参考文献[4].

在运用统计方法对数据进行检验之前,需要理解本底信号的分布.PandaX-II 中的本底主要包括如下来源:① 来自于探测器部件内的放射性同位素杂质释放出的伽马光子在液氙内产生的电子反冲事件;② 液氙内部氪、氡等放射性同位素杂质和氙的放射性同位素衰变引起的电子反冲事件;③ 探测器部件内释放出的中子在液氙内产生的核反冲事件;④ 物理上没有关联的S1和S2由于偶然符合形成的“假”事件.使用放射源对探测器进行刻度的分析,结果表明电子反冲和核反冲事例之间存在较大的区分度(见图1).此外,本底水平也需要通过其他方法进行初步估计.例如,来自探测器材料的本底贡献可以基于测得的探测器材料的放射性强度,进行Monte Carlo模拟来进行估计,氙里面的85Kr放射性同位素本底则可以通过测得的85Kr衰变到85Rb过程中的β-γ符合过程的数目来进行估计[4].

图1 PandaX-II 实验 2016年核反冲与电子反冲的事例分布Fig.1 The distribution of nuclear recoil events and electron recoil events in PandaX-II 2016 dataset

一般来说,如果在暗物质的直接探测实验中没有观察到明显超出本底预期的信号,那么数据分析的最终结果是给出暗物质与普通物质发生相互作用的截面上限.银河系内的暗物质密度为一个由天文学所给出的固定输入参数[16],因此实验给出的截面上限是一个和暗物质质量相关的值,最终结果表现为在一定的暗物质质量区间内所给出的一条连续曲线,即所谓的排除线.目前基于液氙的几个实验的最新结果都是基于PLR构造统计量,从而给出了对应的排除线[4-7].

2 剖面似然比方法

粒子物理学家通常运用频率论的统计检验或者贝叶斯检验来探索新物理[17].在频率论的框架下,当处理设置上限问题时,通常将测得数据同时包含本底和信号的假设作为待检验的零假设(H0),并将数据中仅有本底的假设作为备择假设(H1).一个假设H和观测到的数据的符合程度是通过计算P值来估计的,即在该假设成立的情况下,得到观测数据或者与H偏差更大的数据的概率.通常当计算得到的P值低于某一给定阈值时,可以认为假设被排除.

(1)

为计算方便,一般使用的检验统计被定义为

tμ=-2lnλ(μ)

(2)

由前文可知,tμ越大意味着数据和假设之间的偏差也越大.用于量化数据和模型之间的差值的P值可以定义为

(3)

式中:f(tμ|μ)是在信号强度μ固定的情况下进行多次实验得到的tμ的分布,通常需要进行大量的Monte Carlo模拟来得到;tμ,ob则根据实际的观测数据得到.

在使用剖面似然比方法设置信号强度的上限时,统计检验被进一步定义为

(4)

(5)

这样定义的P也通常被表示为Ps+b,说明这是针对同时存在信号(s)和本底(b)所做的检验.

通常,如果要以1-α的置信水平来设置被检验的物理量μ的上限,就需要在使得Pμ≥α的μ的可能取值当中找到一个最大的μlimit.

3 CLs方法

一些实验需要检验的信号强度的数值非常小,会得到相近的f(qμ|μ)与f(qμ|0)的分布,从而在接受某个μ值时,其对应的P值与信号不存在(μ=0)时的P值相当接近,导致实验在该μ值附近已缺乏灵敏度.

为了解决这个问题,CLs方法[17]被用来对P值进行修正.该方法需要计算在仅有本底假设下的P值,即

新修正值被定义为

对于某一个特定的置信水平1-α,若根据某个信号强度μ计算得到CLs≤α,则拒绝这个假设.由于1-Pb<1,CLs值通常大于对应的Ps+b,从而能得到更加保守的结果.由此可见,CLs并非置信水平(Confidence Levels),它只是一个出于实用主义而给出的名称,该方法在高能物理实验里面得到了广泛运用.PandaX-II 在发布2016年数据的几个分析结果都使用了CLs方法来给出对应物理量限制.

4 PandaX-II 对暗物质非弹性散射截面的限制

4.1 WIMP与核子的非弹性散射

为了解释DAMA/LIBRA实验中的疑似暗物质信号[18],一些理论模型考虑暗物质存在多个能级,能级间具有质量劈裂δ,从而暗物质会和原子核发生非弹性散射,从低能态跃迁到高能态[19-21].由于质量劈裂的存在,非弹性散射需要一个最低的暗物质运动速度的存在,相互作用的相空间也被压缩.在文献[10]中,PandaX-II 基于2016年获取的数据来对暗物质与核子的弹性散射等效截面进行了限制.

根据暗物质与核子发生非弹性散射的微分事例率计算公式,并考虑到部分参数来自天文学的输入,最终暗物质非弹散射的事例率依赖于3个参数,分别是暗物质粒子的质量mχ, 暗物质粒子的质量劈裂δ以及弹性散射极限下的零动量暗物质与核子的作用截面(以下简称等效截面)σn[10],其中σn为该分析中的目标物理量.选取暗物质质量mχ分别为1和10 TeV/c2作为参考质量,分析结果将得到在不同δ情况下σn的上限.

4.2 似然函数的构造

为了构造对应的检验统计,需要写出对应的似然函数.由于PandaX-II 首批实验数据包含了不同条件下所得的数据,可根据条件划分为nset个数据集,因此似然函数可以写为不同数据集各自似然函数的乘积形式

其中:函数G为高斯函数,表示暗物质的测量误差δdm和本底的测量误差δbj的影响,这些误差也作为待拟合的冗余参数;bj表示不同种类的本底;σdm为信号截面,即我们所关心的等效截面;σbj则表示不同本底的截面,由相关数据分析给出.在PandaX-II 实验首批数据里面,主要的本底分为5类:① 液氙内溶解的放射性85Kr 产生的电子反冲本底;② 放射性127Xe 产生的电子反冲本底;③ 其他来源的电子反冲本底;④ 无关的S1及S2偶然符合导致的本底;⑤ 来自探测器组件内放射性杂质产生的中子本底.具体来说,每个数据集的似然函数则可写成

4.3 事例S1和S2的联合分布

对于暗物质信号来说,可由公式得到其能量分布,而根据能量生成S1和S2的联合分布需要使用Noble Element Simulation Technique(NEST)模型[22],该模型描述了液氙内沉积的能量如何转化为信号S1和S2,在液氙暗物质实验中得到广泛应用,模型中的一些自由参数需要使用刻度数据去进行优化.对于电子反冲和中子反冲的本底,使用基于Geant4[23]的Monte Carlo模拟得到能谱,同样运用NEST模型获得其S1及S2的联合分布.偶然符合的本底的联合分布通过将实验数据分析得到的单S1事例信号和单S2事例信号进行大量随机匹配而得到.

对于不同的暗物质质量及质量劈裂,信号能谱具有不同的形状,从而得到的S1和S2分布也不尽相同.不同的等效截面则会影响信号窗口内的总事例数.图2显示了在暗物质质量为1 TeV/c2及等效截面为10-40cm2时,不同质量劈裂给出的暗物质事例在信号窗口内的联合分布;采用归一化事例密度表示,颜色越深,密度越高,则事例数越多.

mχ=1 TeV/c2, σn=10-40 cm2图2 不同的质量劈裂对应的暗物质在PandaX-II 探测器中的信号联合分布Fig.2 The dark matter signal distribution in PandaX-II detector at different mass splitting values

4.4 应用PLR方法拟合候选事例

在首期79.6天内,PandaX-II 实验记录到了 24 502 402 个事例.经过挑选后,在3 PE≤S1≤100 PE,100 (raw) PE≤S2≤12 000 PE的信号窗口内保留 716 个事例(其中raw表示原始未修正信号),其分布如图3所示.未观测到明显超出本底的信号.

图3 PandaX-II 实验2016年数据经过筛选后在信号窗口中的分布Fig.3 The distribution of the candidate events from PandaX-II 2016 data in the signal window

假设暗物质质量为1 TeV/c2,在δ=0~300 keV/c2的区域内平均选取20个点.对于每个被选取的δ,计算预期得到1个暗物质事例所需要的等效截面,在等效截面附近选取一系列扫描点σdm,并针对每个截面扫描点,用所有保留的候选事例来计算其对应的检验统计qμ,ob.

为计算Ps+b,需要根据扫描点σdm,拟合得到本底的δbj,从信号及本底的S1和S2联合分布出发进行大量Monte Carlo模拟,生成模拟事例,使用这些模拟事例对选取的扫描点进行拟合,以得到信号+本底假设下qμ的分布f(qμ|μ),从而计算出Ps+b.图4给出了当暗物质δ=120 keV/c2,假设等效散射截面σdm=7.615×10-42cm2时qμ的概率密度分布;根据数据计算出对应的qμ,ob=3.983,从而得到Ps+b=0.032.

同时需要根据拟合得到的本底δb,使用本底的联合分布来进行Monte Carlo模拟,生成仅有本底的模拟事例,并使用这些模拟事例对选取的扫描点进行拟合,以得到仅有本底假设下的qμ分布f(qμ|0),并计算出1-Pb.图4中同样给出示例参数在仅有本底假设下的qμ分布,由该分布可以得到对应的1-Pb=0.148.

δ=120 keV/c2, σdm=7.615×10-42 cm2图4 qμ的概率密度分布Fig.4 The probability density distribution of qμ

这样,我们可得到每个扫描点σdm,qμ,ob及CLs值之间的对应关系.通过在CLs值接近0.1的附近迭代选取更多扫描点并重复上述过程,使最终计算得到的CLs值与0.1的差值小于某一预设误差,从而得到在对应δ置信水平为90%的等效截面上限.最终将这些对应不同δ的σ上限绘制在一张图上,就得到了置信水平为90%的等效截面排除线,如图5中红色实线所示.

图5 PandaX-II 实验2016年数据对于暗物质与核子非弹散射过程中的等效截面的90%置信水平排除曲线Fig.5 Upper limits at 90% confidence level on the effective cross section of WIMP-nucleon in inelastic scattering set by the PandaX-II 2016 data

使用CLs方法时通常会同时给出误差带,计算方式为利用仅有本底假设的Monte Carlo模拟数据,运用上文方法得出置信水平为90%的等效截面.多组模拟得到截面分布的一倍及二倍标准差作为一倍及二倍标准差的误差带上下限.图6给出了对应于暗物质质量劈裂为120 keV/c2时,根据仅有本底假设的Monte Carlo数据所计算得到的90%置信度的截面分布.因为误差带是由Monte Carlo模拟给出,而排除线是由数据给出,所以数据的涨落可能导致部分区域排除线落在一倍标准差之外.

图6 由仅有本底假设的蒙卡模拟数据所计算得到的90%置信度的截面上限分布(δ=120 keV/c2)Fig.6 The distribution of upper limits of the effective cross section at 90% confidence level calculated from MC simulation with background-only hypothesis (δ=120 keV/c2)

5 结语

PandaX-II 实验得到的数据包含了S1和S2的值.为了充分利用这些信息,PandaX-II 的数据分析结合应用了PLR和CLs方法,对暗物质的截面性质给出限制.本文基于PLR方法中检验统计的构造,具体介绍了PandaX-II 实验中构造PLR所需的似然函数如何从数据中得到,以及如何计算最终的排除曲线及误差带,希望能为其他类似实验或者需要运用该方法的领域提供参考.

致 谢本文主要工作来源于季向东教授、刘江来教授领导的PandaX-II 暗物质直接探测实验,该课题得到上海市粒子物理与宇宙学重点实验室、教育部粒子物理与星系宇宙学重点实验室的支持.在此表示感谢!

猜你喜欢

暗物质事例检验
传神写照,意味深长——写人要关注具体事例和细节
作文想好,“事例”不能少
暗能量VS暗物质(下)
对起重机“制动下滑量”相关检验要求的探讨
什么是暗物质
电梯检验中限速器检验的常见问题及解决对策探究
中国十大宪法事例(2017)
关于锅炉检验的探讨
小议离子的检验与共存
什么是暗物质