APP下载

基于Voigt函数的拉曼成像插值方法

2022-05-05范贤光黄彦睿许英杰

光谱学与光谱分析 2022年5期
关键词:拉曼特征参数直方图

范贤光, 黄彦睿, 刘 龙, 许英杰, 王 昕*

1. 厦门大学航空航天学院仪器与电气系, 福建 厦门 361005

2. 传感技术福建省高等学校重点实验室, 福建 厦门 361005

引 言

近年来, 拉曼成像技术已成为细胞内成分监测、 食品质量和食品安全等诸多应用领域的首选之一[1-3]。 拉曼成像的主要优点是特异性高、 无创、 所需样品制备少[4-7]。

得益于激光技术、 滤波器、 光谱仪、 处理算法等相关配套技术的快速发展, 拉曼成像技术自身也得到了很大的提升[8]。 其中, 处理算法(基线校正[9]、 去噪[10]、 信噪比评估[11]等)的开发对于在不增加硬件成本的情况下提高拉曼成像设备的性能具有重要意义。 然而, 现有的处理算法大多集中在拉曼信号上, 虽然图像处理容易实现, 但对拉曼成像处理的研究很少。 我们得出的主要结论是单纯在图像上处理容易导致原始拉曼信息的失真和丢失[12]。 现有的图像插值算法用于拉曼图像的处理的过程中, 只单纯考虑提取拉曼信号峰值面积/强度后每个像素点的值而忽略了拉曼散射的物理特性, 如最近邻插值算法[13]、 双线性插值算法[14]。 然而, 选择合适的图像插值算法对于拉曼成像来说是有意义的, 操作员可以在一定程度上获得更高空间分辨率的拉曼图像, 略微突破硬件的限制; 同时缩短拉曼扫描时间, 有利于观察活性组织动态过程。

为此, 本文提出了一种基于Voigt函数的拉曼成像插值算法(VFI), 该算法考虑了原始测量的拉曼信号对拉曼图像的影响: 首先, 利用数学模型(Voigt函数)对测量的拉曼信号在每个采集点选定的峰值区间进行数学拟合, 并提取Voigt函数的特征参数; 然后, 利用相邻Voigt函数的参数计算新插值点Voigt函数的特征参数, 从而建立新插值点的Voigt函数; 最后, 通过计算其Voigt函数的谱峰面积/强度得到新像素的值, 最后合成所有像素点的信息达到提高拉曼成像空间分辨率的目的。 经过这些处理步骤后, 可以尽可能地保留被测拉曼信号的原始组分分布情况, 避免不必要的错误信息。

1 实验部分

1.1 拉曼成像的插值算法流程

在采集原始样品的拉曼光谱数据后, 采用Voigt函数对已知数据点的成像峰利用Voigt函数进行最小二乘拟合然后提取原始数据的特征参数作为插值点的Voigt函数的特征参数, 构建插值点的Voigt函数, 最后将原始数据与插值点结合生成拉曼图像。 其原理如图1所示。

拉曼成像插值方法的基本步骤如下:

(1) 加载采集的光谱数据, 对鬼峰平滑处理以消除成像的不良影响, 并确定待成像组分, 即确定拉曼位移区间。

(2) 对已知原始数据的成像峰采用Voigt函数通过进行最小二乘拟合得到解析谱峰的特征参数(Voigt函数原理见下一节)。

(3) 从step2提取出已知数据的Voigt函数的特征参数后, 利用线性插值方法计算新插值点的Voigt函数的参数。 一般情况下, 在两个已知点之间只插入一个点(见下一节插值方法), 所以线性插补是合理且足够的。

(4) 根据step3求出的参数, 构建插值点的Voigt函数。

(5) 计算新插值点的值(Voigt函数的谱峰面积/强度), 结合原始数据和新插值点数据合成新的拉曼图像, 提高拉曼图像的空间分辨率。

1.2 插值方法

本节我们推荐两种插值策略模式, 行插值(模式1)和点插值(模式2)。 如图2所示, 在模式1中, 两个黑点a和c插值得到中间橙色点b, 因此在模式1中插值后图像的行数约等于原始图像的两倍。 在模式2中, 利用周围的四个黑点插值得到中间橙色点d, 因此插值后图像的行数和列数约等于原始图像两倍, 即假设原始拉曼图像的空间分辨率为m×n, 从图2可以看出, 模式1下的空间分辨率可以提高到(2m-1)×n, 模式2下的空间分辨率可以提高到(2m-1)×(2n-1), 这意味着增加了约50%和75%的点。 理论上, 在两个已知点之间可以插入任意数量的点, 但不建议添加过多的点。

图2 VFI插值策略

拉曼光谱峰的线形本质上是洛伦兹线形, 由于受仪器或样品特性的影响, 谱峰的线形可以表述为高斯函数和洛伦兹函数的卷积类型, 即Voigt函数。 Voigt函数没有解析解, 只能用数值描述。 Wertheim提出了Voigt函数的近似表示

(1)

式(1)仅拟合成像的拉曼特征峰而未考虑荧光背景的影响, 因此, 将其荧光背景近似为直线, 并结合Voigt函数形成数学模型为

W(V,k,v,b)=V(v,α,w,γ,θ)+kv+b

(2)

式(2)中, 特征参数共有6个,v表示拉曼位移值,α为特征峰的最大值强度,w表示特征峰的最大值对应的拉曼位移值,γ为半峰全宽,θ(0≤θ≤1)为高斯-洛伦兹系数,k为荧光背景基线斜率θ(0≤θ≤1),b为荧光背景的纵截距。

图3是利用Voigt函数对原始数据插值情况的示意图, 其中图3(a)和(b)分别是相邻两个样品采集数据1和2利用Voigt函数拟合情况示意图(黑色k线为采集点去除鬼峰后的光谱数据), 图3(c)是根据点1和2的Voigt函数利用线性插值得到的插值点的拟合情况示意图。

图3 模式1中利用邻近点拟合插值点的Voigt函数的原理

图像插值算法最可能出现的问题是图像的过度失真和信息丢失。 因此, 本文引入了直方图相似度和结构相似度算法(SSIM), 通过这两个数学指标来评价插值后拉曼图像效果。 在实验部分, 我们将用不同扫描间隔得到的拉曼图像通过行插值和列插值, 通过这两个指标可以对插值图像与分辨率最高的测量图像进行比较来评价图像的相似度。

1.3 材料和测试仪器

以头孢呋辛酯(药品1)、 人宫颈癌细胞(细胞1)作为检测样本。 拉曼成像设备采用由日本Nanophoton 公司研发的Raman 11成像系统进行。 实验条件的详细信息请参考文献[8]。 4种实验样品采用的拉曼成像峰分别为247, 539, 116和247 cm-1。

(a): Voigt function of point 1; (b): Voigt function of point 3;

(c): Voigt function of point 2

拉曼成像采用日本Nanophoton Raman 11仪器, 扫描方式为线扫描(每行400个点, 像素点间距为2 μm), 扫描步长2 μm。 采用激光功率为0.1 mW·μm-2的785 nm激光线、 NA(数值孔径)为0.45的50个空气显微镜物镜和600 grooves·mm-1光栅进行测量。 采用不同的扫描时间获得不同质量的拉曼图像。

2 结果与讨论

图4和图5展示了在两种模式下药品1和细胞1的采集点待插值拉曼图像、 VFI单行/单点插值图像和与VFI图像对比的采集点高分辨率拉曼图像。 待插值拉曼图像图4(a, d)和图5(a,d)由于扫描分辨率低导致图像模糊、 颗粒状明显, 但是经过单行/单点插值处理后, 图4(b,e)和图5(b,e)的视觉质量得到了改善, 变得更加平滑和精细。 因此, 对采集点待插值拉曼图像通过VFI插值后[图4(b,e)和图5(b,e)]与采集点对比图像[图4(c,f)和图5(c,f)]相比, 相似度较高, 组分分布情况相似。 而在图5(a,d)(模式2)中, 待插值拉曼图像的分辨率远低于图4(a,d)(模式1), 组分分布信息也得到了很好的保存。

图6显示了该插值方法在两种模式下药品1和细胞1插值后的拉曼成像和相同分辨率的采集图像的复合直方图[如图4(b和c), (e和f)], 结果显示直方图的重合度较高。

图4 模式1中药品1和细胞1的实验对比图像

图5 模式2中药品1和细胞1的实验对比图像

图6 两种模式下药品1和细胞1的插值一行/一点后拉曼图像与同分辨率采集图像的复合直方图

表1为两种模式下不同实验样品插值后的拉曼图像和高空间分辨率图像的直方图欧几里得距离[15]和SSIM结果, 欧几里得距离越接近于0意味着直方图相似度较高, 图中四种样品的SSIM值均大于等于0.9, 意味着VFI的效果是可靠的(SSIM的值从0到1, 1意味着相似性最高; 0意味着相似性最差)。 因此, 从图6和表1可以看出, 本文提出的VFI算法不会对原始图像产生过度的失真, 并且尽可能地保留了信息。

表1 两种样品的直方图欧几里得距离和SSIM值

本文所提出的数学方法理论上可以在图像上添加任意整数个数的点。 因此, 为了进一步观察VFI的效果, 我们将图4(a)和(d)中的低空间分辨率图像在模式1中, 在两个已知行之间添加3、 7行进行插值。 如图7所示, 增加更多的点并没有明显改善图像质量, 但计算成本成倍增加。 事实上, 图7(a), (b)和图4(b)几乎是一样的, 图7(c), (d)和图4(e)也是一样的。 因此, 在原始图像上添加太多的点是没有意义的。

图7 药品1和细胞1在模式1下不同插值数量下VFI插值后的拉曼图像

除了讨论了VFI算法的优点外, 还需要考虑算法的一些注意事项。 在拉曼成像中最需要考虑的仍然是扫描间隔(行和列), 如果这些参数选择不当, 所提出的VFI也不能达到很好的效果。 在图8中, 我们在比图4(a)和(d)更大的线扫描间距下扫描药品1和细胞1, 利用模式1对测量图像进行插值, 尝试获得较好的成像效果。 显然, 要获得与高分辨率测量图像[图4(c)和(f)]相同的效果是完全不可能的。 而且, 在某些情况下, 如果某个分量的分布面积很小, 就会丢失分量信息。 图9为其中一例: 在细胞原始拉曼图像[图9(a)]中, 红色圈内为组分高浓度区(仅一行); 加大一倍行扫描间隔采集到的拉曼图像丢失了高浓度区域[图9(b)], 由于该处的组分信息已丢失, 因此插值后的图像仍然会丢失该点的真实组分浓度[图9(c)]。 理论上, 需要选择好扫描间隔, 避免遗漏重要的组分浓度信息。

图8 模式1下药品1和细胞1在不同扫描间隔以及插值后的拉曼图像

图9 组分信息丢失示意图

3 结 论

为了提高拉曼成像的空间分辨率, 我们提出了一种简便易行的拉曼成像插值方法, 该方法采用Voigt函数对已知原始数据光谱的拉曼峰进行最小二乘拟合。 该方法能很好地将谱峰转化为数学模型, 便于建立插值点的Voigt函数。 然后, 对高分辨率测量图像和相同分辨率的插值图像的相似性分析表明, 所提出的VFI不仅在图像视觉感官上, 而且在数学指标上都是有效和可靠的。 最后, 我们描述了VFI的注意事项。 它可以作为拉曼成像数据处理和软件的有效补充。

猜你喜欢

拉曼特征参数直方图
符合差分隐私的流数据统计直方图发布
馆藏高句丽铁器的显微共聚焦激光拉曼光谱分析
冕洞特征参数与地磁暴强度及发生时间统计
基于FPGA的直方图均衡图像增强算法设计及实现
黑磷的多声子共振拉曼散射*
基于交通特征参数预测的高速公路新型车检器布设方案研究
用直方图控制画面影调
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
中考频数分布直方图题型展示