APP下载

苯类有机物与羟基自由基的反应速率常数预测模型研究*

2022-05-17瑾,马羚,焦

云南化工 2022年4期
关键词:静电场预测值交叉

付 瑾,马 羚,焦 龙

(西安石油大学化学化工学院,陕西 西安 710065)

1 概况

苯类有机物是地下水环境中常见的污染物。地下环境中的苯类有机物以非水相液体(NAPL)的形态污染土壤、含水层和地下水。残渣可持续残留数十年甚至数百年,长期污染地下环境,分解过程的中间产物也对环境造成二次污染。苯类污染物的主要来源是石油生产、使用、储存和运输过程中造成的石油泄漏和渗透。地下水环境油污事故时有发生,特别是在快速发展的产油国,此类污染问题尤为严重。

近年来,许多氧化剂(如羟基自由基(·OH)、臭氧和硝酸盐自由基)已被用于降解环境中的有机物,有机污染物与·OH的反应是去除环境中有机污染物的最重要途径[1-2]。苯类有机物与·OH的反应速率常数(kOH)是大气中有机化合物的重要参数,是评价环境持久性和生态风险性的重要指标[3]。通过实验方法获得kOH成本高、费时费力,难以满足化学物质生态风险评估的需要。因此,亟需建立一种能够高效预测有机化合物的kOH的理论方法。

定量构效关系(QSAR)是在一个已知化合物的分子结构和生物活性之间建立一个数学模型,然后预测该系列中一个未知化合物的生物活性。该技术已成功地应用于预测有机化合物的各种反应(如与·OH、硝基和臭氧的反应)的动力学速率常数。目前,QSAR广泛应用于药物设计[4-8]、化合物的化学物理性质研究[9-12]、反应机理[13-18]、环境中化学物质暴露水平和生物活性评价[19-20]评价等领域。三维定量构效关系(3D-QSAR)通过分子三维空间构型计算各种场的作用以建立QSAR模型,操作简单,一般模型预测准确度更高,且更为稳定。本研究采用3D-QSAR中比较分子场分析(CoMFA)方法,对苯类有机物的44种化合物建立其kOH的QSAR模型,分析了苯类有机物的分子结构对其kOH值的影响。

2 实验与方法

2.1 数据集

44个化合物的数据列于表1。采用SYBYL-X 2.0(Tripos, U.S)分子模拟软件构建全部的分子模型及建立QSAR模型,通过留一交叉验证和外部测试集验证,评估模型的预测能力。将44种化合物随机分为两组:第Ⅰ组中含37种化合物,第Ⅱ组中含7种化合物(第Ⅱ组在表1中用“*”标记)。用均方根相对误差(RMSRE)、交叉验证均方根误差(RMSECV)、预测均方根误差(RMSEP)来评价模型的预测能力,其定义分别见式(1)~(3)[21]。

表1 kOH的实验值和预测值

(1)

(2)

(3)

表1(续)

2.2 分子构建与结构优化

所有对CoMFA的分子建模和计算都是由SYBYL-X 2.0 (Tripos, U.S.)软件进行。在SYBYL软件里构建44个分子结构模型,采用Gasteiger-Huckel来计算原子电荷,通过Tripos标准分子力场进行分子结构优化,能量梯度收敛值RMS设为 0.0209 kJ·mol-1·A-1,最大迭代次数设为1000次,其余均采用默认值。

2.3 CoMFA模型构建

CoMFA是将立体场和静电场建立在分子周围的三维的网格上,对于每个网格点,计算了分子与已定义探针之间的相互作用能。CoMFA模型由sp3杂化的C+原子作为探针,并设定其临界值在 125.58 kJ·mol-1。当x、y和z轴的三维网格间距为2A时,Lennard-Jones公式和库仑函数用于计算的空间场和静电场的作用能。最后进行偏最小二乘法分析,先用交叉验证方法检验所得模型的预测能力,得到最佳主成分数(N)和交叉验证系数平方(q2),再进行非交叉验证得到非交叉验证相关系数平方(R2)和Fisher统计量(F)、估计标准偏差(SEE),并用这些数据作为判断回归模型预测能力的依据,以三维等势图显示[21-22]。

3 结果与讨论

3.1 CoMFA模型结果分析

以第I组化合物为训练集建立CoMFA模型,该模型的最佳主成分值为2,q2=0.885,R2为0.935,SEE为0.070,F值为244.967。用所建立的模型预测第II组化合物的kOH数值,预测结果见表1。第II组kOH数值的预测RMSRE为0.3911,RMSEP为0.0382,预测值与实验值之间的回归方程为y=0.9622x+0.3589(y表示预测值,x表示实验值),相关系数为0.9688。如表1所示,化合物的kOH数值预测值和实验值基本一致。用第I组完成留一交叉验证,依次预测第I组中37个样品的kOH数值。预测结果如表1所示,第I组化合物kOH数值的预测RMSRE为0.6860,RMSECV为0.0669,预测值与实验值之间的回归方程为y=0.9338x+0.6465(y表示预测值,x表示实验值),相关系数为0.9671。实验值与预测值数点图见图1。两种验证结果说明所建立的CoMFA模型合理,具有预测能力。

图1 实验值与预测值散点图

分子之间的重叠范围影响CoMFA模型的构建,分别尝试用不同化合物为模板利用Align Database板块进行分子叠合,结果表明,44号化合物(2-Naphthol)的叠合效果最好。因此,选取最活跃的44号分子作为模板对第I组化合物进行分子叠合,叠合结果如图2所示。

图2 分子共同骨架的叠合图

图3为CoMFA模型中模板分子的立体场和静电场的三维等势图。在立体场等势图中,绿色区域表示分子活性会随着空间位阻的上升而提高,黄色区域表示空间位阻的降低有助于分子活性的提高;此外,静电场等势图中,红色区域表示引入带负电荷的取代基有利于提高分子活性,蓝色区域表示引入带正电荷的取代基有利于提高化合物的活性。从等视图可见,在44号分子的2号·OH取代位、6、7取代位的位置附近显示为黄色区域,表示该基团使kOH值减小;从静电场等势图可见,分子的两个苯环连接的附近为红色区域,表示该区域添加负电荷能够减小化合物的kOH值。

Steric field Electrostatic field图3 CoMFA模型的三维等势图

4 结论

本研究采用CoMFA方法对44个苯类化合物进行研究,生成3D-QSAR模型。CoMFA分析结果显示,交叉验证系数q2值为0.885。交叉验证系数q2接近于1,说明所有化合物都具有相似的相关性,所建立的模型的稳定性会更好。这些统计参数表明,所建立的模型具有可靠、良好的内外预测能力,该模型有望作为预测苯类有机物kOH值的计算工具。

猜你喜欢

静电场预测值交叉
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
菌类蔬菜交叉种植一地双收
AI讲座:ML的分类方法
一道静电场课后习题的拓展与变式
自体荧光内镜对消化道肿瘤诊断临床应用分析
静电场中的“守恒定律”及应用
“六法”巧解分式方程
“静电场”测试题(A)
连数
连一连