APP下载

正构烷基酚热力学性质的构效关系

2015-06-12何伟平黄菊王德堂王天易

化工学报 2015年1期
关键词:正构描述符烷基

何伟平,黄菊,王德堂,王天易

(1徐州工业职业技术学院化学工程技术学院,江苏 徐州221140;2徐州工程学院化学化工学院,江苏 徐州221111;3南京理工大学化工学院,江苏 南京 210094)

引 言

烷基酚类化合物是一种环境内分泌干扰物,可使生物体的生殖功能或免疫功能出现异常[1-3]。该类化合物可用于合成树脂、洗涤剂、农药乳化剂等[4-7]。在其生产、使用或垃圾焚烧过程中,若处理不当,会导致水体、土壤、空气的污染。烷基酚类化合物化学性质稳定,不易自然降解,并容易通过食物链在生物体内富集[8-11],因此分析其理化性质对研究其环境行为和生态学特性具有重要意义。

通过实验测定有机化合物的各种性质非常复杂,因此从分子结构水平对其性质进行研究就成为一种简便、实用、有效的手段。近年来,定量结构-性质相关性(QSPR)已广泛应用于预测有机化合物的理化性质研究[12-18]。

目前,对芳香族化合物进行研究的物质有多卤联苯及其衍生物[19-20]、多卤代二苯并呋喃[21-22](多卤代二苯并噻吩)、烷基苯[23-24]等。其中,以单一的卤代产物为研究对象的文献报道居多,少见以多种官能团(尤其多原子官能团)取代产物为研究对象的文献报道。分子描述符主要包括基于位置建立的路径指数、基于电负性建立的定位指数、基于支化度建立的连通性指数等。研究的理化性质包括分子平均极化率α、标准焓Hϴ、内能E、恒容热容

标准熵、色谱保留时间沸点等。

烷基酚分子结构中包含酚羟基和烷基,并且烷基结构千差万别,故烷基酚结构与单一的卤代产物有很大差别,目前对烷基酚热力学性质的构效关系研究极为少见。本研究在前人研究[23]的基础上简化了主量子拓扑指数0P、1P,并提出了新的对称特征指数Q,与苯环上烷基的数目T、苯环上相邻烷基的对数B共同作为分子描述符,用于正构烷基酚热力学性质的研究,经过变量筛选,使用最佳子集回归建立了5个模型,研究结果为预测该类化合物的热力学性质、定量评估其环境风险提供了一定的理论依据。

1 热力学数据与分子描述符

1.1 热力学数据

本研究选取150个正构烷基酚分子,利用G03量子化学计算程序包,采用B3LYP方法和6-31G*基组计算其分子稳定构型的热力学性质,结果列于表1。

1.2 分子描述符

有机物分子的物理化学性质与其主量子拓扑指数有关。根据文献[23],定义成键原子的点价ti为

式中,hi为与原子i直接相连的氢原子的数目,mi为原子i的价电子数,ni为原子i的主量子数即电子层数。

规定其n阶指数为

这里i−1表示与i直接相连的原子,其余以此类推。0阶、1阶指数的计算公式为

图1 2,3,5,6-四甲基苯酚的分子结构Fig.1 Molecular structure of 2,3,5,6-tetramethylphenol

单变量的一元线性回归模型无法同时拟合所有热力学性质达到最优(否则这些热力学性质将高度线性相关,事实上该假设并不一定成立),故需要选择多个分子描述符作为构效关系模型的自变量。

理论表明,分子的热力学性质与其对称性也有关系。定量描述分子的对称性并用于建立构效关系模型,在以往的文献中少见报道。

表1 正构烷基酚的热力学性质Table 1 Thermodynamic properties of n-alkyl phenols

Table 1 (continued)

Table 1 (continued)

以2,3,5,6-四甲基苯酚为例说明Q的计算过程。将分子图中i和j位置烷基的相似度记作sij,构建相似度矩阵

由此可得到矩阵M各对角线(主、副对角线分别对应分子的旋转和反映操作)元素之积:

此外,烷基酚的热力学性质还与苯环上烷基的数目T、苯环上相邻烷基的对数B有关。根据上述方法,采用Visual Basic程序软件对表1中的分子结构进行计算,并将分子描述符0P、1P、T、B和Q值也列于表1。

2 模型的建立与分析

2.1 自变量的选择

模型中的各自变量不应出现明显的相关性,否则应当将多余的变量删除以重新拟合。为了评价模型中各自变量的多重相关性,引入方差膨胀因子

式中,R为自变量中某一变量与余下变量的相关系数。若VIF<5,表明变量间没有明显的自相关性;若5<VIF<10,表明变量间存在适度的共线性;若VIF>10,则表明该变量与余下变量高度线性相关,应当从模型中剔除。

本研究中0P、1P、T、B和Q的VIF值见表2。由表2可知,0P、1P与其他变量高度线性相关(经计算知0P、1P相关系数达 99.32%),剔除 VIF值最大的分子描述符0P,则剩余变量的VIF值均小于10,故确定1P、T、B和Q作为自变量进行热力学性质建模。

表2 分子描述符的膨胀因子Table 2 Variance inflation factors of molecular descriptors

2.2 模型建立过程

为了使建立的模型能精确预测且多重共线性最小,将正构烷基酚的热力学性质与分子描述符使用minitab软件的最佳变量子集回归方法进行拟合,回归结果见表 3。其中,R2为判定系数,为调整判定系数,Mallows Cp为马洛斯统计量(若接近变量数加上常量数,则表明模型在估计真实回归系数和预测未来响应时比较精确且无偏倚),SD为标准偏差。

由表3可见,正构烷基酚的热力学性质与1P具有较好的相关性,5种热力学性质一元模型的分别为99.4%、99.8%、99.8%、98%、98.6%,说明1P较好地反映了正构烷基酚热力学性质的变化规律。最终的变量数加上常量数(即1)均等于Mallows Cp统计量,说明拟合精确且无偏倚。回归结果表明,随着变量数增加,R2、逐渐增大到一定程度后不再变化,而SD逐渐减小到一定程度后不再变化,但存在过度拟合的弊端,故不能依据这3种指标确定最终的构效关系模型。

为了用最少的变量精确、可靠地进行拟合,以确定最终的QSPR模型,引入 Akaike信息判据、Kubinyi函数,其计算公式为

式中,RSS为剩余方差和,n为化合物数,b为变量数。

要求仅当所增加的变量能够减少AIC值或提高FIT值时才在原模型中增加该变量。AIC值越小、FIT值越大,则所建模型越稳定、预测能力越高。利用式(6)、式(7)计算出AIC、FIT,并和F(Fischer检验值)也列于表3。

表3 热力学性质与分子描述符的最佳变量子集回归结果Table 3 Results of molecular descriptors and thermodynamic properties with leaps and bounds regression

由表3可见,根据AIC值最小、FIT值最大的原则确定拟合各热力学性质的自变量(若该两条原则发生矛盾,以使用变量数较少者为准):α使用1P、T、B、Q拟合,Hϴ、E使用1P、T拟合,使用1P、T、Q拟合,使用1P、B、Q拟合。为了使所得预测模型具有较高的可信度,一般遵循如下经验规则:n/b≥5。本研究中n=150,b=2、3或4,因此变量数满足要求。

2.3 模型分析

构效关系回归模型最终结果见式(8)~式(12)。

得到的5个构效关系模型相关系数均在0.99以上,属于优级相关;Hϴ和E的相关系数更是达到了1的完全相关。将估算值和理论值进行关联,二者大多比较吻合,如图2~图6所示。

2.4 其他建模方法

2.4.1 基于主量子拓扑指数 采用文献[23]的方法,构效关系回归模型最终结果见式(13)~式(17)。

图2 正构烷基酚α的估算值和理论值的相关性Fig.2 Relationship between calculated and theoretical values for α of n-alkyl phenols

图3 正构烷基酚Hϴ的估算值和理论值的相关性Fig.3 Relationship between calculated and theoretical values for Hϴ of n-alkyl phenols

图4 正构烷基酚E的估算值和理论值的相关性Fig.4 Relationship between calculated and theoretical values for E of n-alkyl phenols

图6 正构烷基酚Sϴ的估算值和理论值的相关性Fig.6 Relationship between calculated and theoretical values for Sϴ of n-alkyl phenols

对照式(8)~式(12),可知本研究采用的建模方法略优于文献[23]的方法。进一步分析发现,0P与1P、T完全相关(0P=−0 .0316 + 0 .4081P+ 0 .487T,R2=100.0%,=100.0%),故本研究中移除0P不影响建模拟合优度,但是增强了模型系数的含义(否则0P和1P前的系数并不反映各自对热力学性质的影响,而是反映它们的共同作用)。

分子描述符Q不但能区分不同烷基的差异,还能区分烷基相同但取代位置不同的情形,因此具有较好的选择性。为了说明该作用,将表 1中T=3的分子(共9个)的、Sϴ分别使用0P、1P和1P、Q拟合,结果见式(18)~式(21)。

对比式(18)~式(21),可知在烷基数目相同的情况下,若考虑Q的影响,构建的模型优于使用0P、1P构建的模型。

2.4.2 基于 Randic分枝指数 采用文献[25]的方法,在 Randic分枝指数基础上定义分子连接性指数,如式(22)所示,并规定羟基中氧原子σ=6。

式中,σ表示成键原子的点价(对于碳原子,σ为其支化度);i、j、k表示分子中依次排列的各成键原子。

将表1中的150个分子的热力学性质使用0X、1X拟合,结果见式(23)~式(27)。

对比式(8)~式(12)和式(23)~式(27),可知本研究构建的模型比单纯使用分子连接性指数构建的模型能更有效地预测正构烷基酚的热力学性质。

3 模型检验

3.1 稳健性检验

为了检验模型的稳健性,以式(8)~式(12)中判定系数最低的、Sϴ为例说明。从表1中的150个分子中依次抽出序号为1、4、7、…、148共30个分子作预测集(同样方法剔除2、5、8、…、149,依此类推),用余下的 120个分子作训练集进行建模。对训练集进行最佳变量子集回归,并利用AIC值、FIT值进行变量筛选,筛选结果见表 4。各组训练集的、Sϴ回归模型见表5。

由表4可知,除Sϴ的最佳变量子集有差异外(进一步分析可知T、B对Sϴ的贡献相当),各组训练集的筛选结果相应统计量较为接近,而且接近原样本的回归结果。由表5可知,各组训练集得到的模型系数较为接近,并且接近原样本的回归模型。由上可见,本研究构建的QSPR模型具有较好的稳定性,能满足预测热力学性质的需要。

3.2 预测能力

利用每个模型对相应被保留的 30个分子的、Sϴ进行预测,得到的预测值与理论值较为吻合,说明提出的分子描述符用于预测正构烷基酚的热力学性质是合理的。以第1组为例,使用对应的模型对保留的 30个分子进行预测。限于篇幅,本研究仅列出序号为1、11、21、…、141的15个分子预测结果,见表6。

表4 分子描述符的筛选结果Table 4 Screening results of molecular descriptors

表5 训练集的、Sϴ回归模型Table 5 Regression models of , Sϴ in training sets

表5 训练集的、Sϴ回归模型Table 5 Regression models of , Sϴ in training sets

Property Training set Model R2/% 2adj/%R SD CV ϴ 1 CV ϴ 1=++− 99.7 99.7 2.626 94.8 3.38 6.67 16.7 P T Q 2 C=++− 99.7 99.6 2.804 3 CV ϴ 1 Vϴ 1 95.1 3.37 6.73 17.0 P T Q=+ +− 99.7 99.7 2.866 4 CV ϴ 1 94.9 3.38 6.61 17.1 P T Q=++− 99.7 99.7 2.698 5 CVϴ 1 95.0 3.39 6.78 18.2 P T Q=+ +− 99.7 99.7 2.734 95.0 3.38 6.61 16.5 P T Q S ϴ 1 S =++− 98.7 98.7 7.875 2 S ϴ320 5.21 2.95 23.8 1P T Q=+ +− 98.8 98.7 7.963 3 S ϴ322 5.19 3.15 14.3 1P B Q=++− 99.0 99.0 7.894 4 S ϴ322 5.21 2.96 18.9 1P B Q=++− 98.9 98.9 7.846 5 S ϴ320 5.22 3.40 29.7 1P T Q ϴ=++− 98.9 98.8 7.767 321 5.21 3.12 13.4 1P B Q

表6 正构烷基酚的恒容摩尔热容、熵的预测Table 6 Predicting results for , Sϴ of n-alkyl phenols

表6 正构烷基酚的恒容摩尔热容、熵的预测Table 6 Predicting results for , Sϴ of n-alkyl phenols

No. Molecule CV ϴ S ϴ Theo./J·mol−1·K−1 Pre./ J·mol−1·K−1 Error/% Theo./ J·mol−1·K−1 Pre./ J·mol−1·K−1 Error/%1 2,3,5,6-4c1 189.93 186.95 −1.57 449.99 433.24 −3.72 11 2,6-2c1-4-c3 190.13 197.41 3.83 438.45 457.44 4.33 21 2-c1-3-c3 180.49 181.53 0.57 438.41 439.17 0.17 31 2-c1-5-c3 173.34 179.01 3.27 433.17 435.58 0.56 41 3-c4-2-c2 220.47 222.76 1.04 494.27 502.83 1.73 51 2-c2-5-c3 200.69 199.66 −0.51 472.98 467.49 −1.16 61 2,3-2c3 220.60 222.80 1.00 492.17 502.89 2.18 71 4-c7-2-c3 294.67 301.40 2.28 619.15 624.66 0.89 81 2-c4-3-c3 240.93 243.14 0.92 525.73 534.32 1.63 91 2-c5-6-c3 261.46 260.76 −0.27 557.46 561.88 0.79 101 4-c2-3-c1 160.55 161.13 0.36 404.43 407.66 0.80 111 3-c2 135.96 133.52 −1.79 378.89 372.70 −1.63 121 3-c5 196.51 194.72 −0.91 469.62 467.23 −0.51 131 4-c1 108.20 112.22 3.71 333.53 339.87 1.90 141 4-c4-2,3,6-3c1 250.30 248.23 −0.83 535.84 527.92 −1.48

由表6可见,所有分子的、Sϴ预测误差均低于5%,说明构建的模型预测能力较强。

4 结 论

根据烷基酚分子具有共同的母体结构,对文献[23]提出的主量子拓扑指数0P、1P进行了简化。利用方差膨胀因子,剔除了与1P高度线性相关的0P,有助于减少自变量和提高模型的质量。并引入Akaike信息判据、Kubinyi函数,在不影响拟合优度的条件下用尽可能少的变量表现模型。

提出了分子对称特征指数Q。考虑到随着碳链的增长烷基的对称性减弱,采用类原子点价的方法对烷基进行了折算;借助矩阵形式,对旋转对称和反映对称的相似程度进行了估算。由回归模型结果可知,对称特征指数Q对分子的α、、Sϴ有一定的贡献作用。

主量子拓扑指数1P与分子的热力学性质有密切联系,其相关系数达98%以上。苯环上烷基的数目T对分子的热力学性质也有影响,T越大相关热力学性质的值越大(Hϴ为负值),这可能是烷基为供电子基团,从而增大了苯环电子云密度的结果。

通过建模方法对比和模型检验证实了本研究选取的分子描述符1P、T、B和Q与分子平均极化率(α)、标准焓(Hϴ)、内能(E)、恒容摩尔热容()和标准熵(Sϴ)等热力学性质的相关性良好,能达到99%以上的优级相关,建立的模型稳定,预测值与理论值吻合得很好。

[1]Liu Zhengtao (刘征涛), Zhang Ying (张颖), Xu Jingbo (徐镜波),Kong Zhiming (孔志明), Shen Pingping (沈萍萍). Study on relationship between quantitative structure and reproductive disturbance of alkyl phenolic compounds [J].Research of Environmental Sciences(环境科学研究), 2002, 15 (6): 39-41

[2]Liu Hongling (刘红玲), Zhou Yu (周宇), Xu Yan (许妍), Yu Hongxia(于红霞). Investigation of toxicity effect for chlorophenols and alkyl phenols on zebrafish embryos [J].Journal of Safety and Environment(安全与环境学报), 2004, 4 (4): 3-6

[3]Guo Jinlian (郭金莲). Research progress of the impact of alkyl phenolic compounds on female reproductive health [J].Foreign Medical Sciences:Obstet Gynecol Fascicle(国外医学: 妇产科学分册), 2006, 33 (5): 349-352

[4]Wang Detang (王德堂), Zhou Lixue (周立雪), Leng Shiliang (冷士良), Wu Hao (吴昊), Qiao Huiying (乔卉莹), Xiao Xianju (肖先举).New production technology and application of oil-soluble pure phenolic resin [J].Jiangsu Chemical Industry(江苏化工), 2007, 35(5): 47-49

[5]Xu Nian (徐念). Synthesis and properties of alkylphenol gemini surfactant [D]. Hebei: Hebei University of Technology, 2008

[6]Li Shaoran (李绍冉), Guo Wenli (郭文莉), Li Shuxin (李树新),Shang Yuwei (商育伟). Synthesis of branched-chain dodecylphenol[J].Chemical Reagents(化学试剂), 2010, 32 (2): 155-158

[7]Ma Qiang (马强), Bai Hua (白桦), Wang Chao (王超), Zhang Qing(张庆), Xi Haiwei (席海为), Xiao Haiqing (肖海清), Dong Yiyang(董益阳), Wang Baolin (王宝麟). Analysis of alkylphenols and bisphenol A migration from textiles and food packaging materials by liquid chromatography tandem mass spectrometry [J].Journal of Instrumental Analysis(分析测试学报), 2009, 28 (12): 1415-1418

[8]Zhao Li (赵丽). The structure-activity relationship for ecological effects of alkyl phenols [D]. Beijing: Beijing University of Chemical Technology, 2004

[9]Xu Zhigang (许志刚), Liu Zhimin (刘志敏), Yang Baomin (杨保民),Zi Futing (字富庭). Research progress of phenolic environmental estrogens analysis [J].Chemical Reagents(化学试剂), 2012, 34 (5):424-428

[10]Dai Yuanyuan (戴媛媛), Niu Haifeng (牛海凤), Dong Yubo (董玉波),Zhu Lin (朱琳). Toxic effect of nonylphenol on aquatic animals:a review of recent studies [J].Journal of Environment and Health(环境与健康杂志), 2012, 29 (10): 948-951

[11]Wu Wei (吴唯), Shi Jianghong (史江红), Chen Qingcai (陈庆彩),Zhang Hui (张晖), Liu Xiaowei (刘晓薇). Analysis of estrogens,nonlyphenol, 4-tert-octylphenol and bisphenol A in the sediments [J].Environmental Science(环境科学), 2012, 29 (10): 948-951

[12]Jin Hao (金浩), Wang Xinghao (王星皓), Yang Fen (杨芬),et al.QSRR/QSPR models of physicochemical properties of polybrominated diphenyl ethers [J].CIESC Journal(化工学报), 2014, 65 (3):797-804

[13]Du Xihua (堵锡华). Physicochemical property of polybrominated diphenyl ethers by new path location index and neural network [J].CIESC Journal(化工学报), 2014, 65 (4): 1169-1178

[14]Guillaume Fayet, Patricia Rotureau, Laurent Joubert, Carlo Adamo.On the prediction of thermal stability of nitroaromatic compounds using quantum chemical calculation1 [J].Journal of Hazardous Materials, 2009, 171 (1/2/3): 845-850

[15]Marvin Charton. Advances in Quantative Structure-Property Relationships [M]. London: Elsevier Science Ltd., 2002

[16]Tulasamma P, Reddy K S. Quantitative structure and retention relationships for gas chromatographic data: application to alkyl pyridines on apolar and polar phases [J].J.Mol.Graph Model., 2006,25 (4): 507-513

[17]Mu Guangfen, Liu Huitao, Wen Yingying, Luan Feng. Quantitative structure-property relationship study for the prediction of characteristic infrared absorption of carbonyl group of commonly used carbonyl compounds [J].Vibrational Spectroscopy, 2011, 55:49-57

[18]Xiang Zheng (向铮), Liang Yizeng (梁逸曾), Hu Qiannan (胡黔楠).Relativity study of the topological index of methylalkane structures and chromatographic retention index [J].Chinese Journal of Chromatography(色谱), 2005, 23 (2): 117-122

[19]Chen Yan (陈艳), Du Xihua (堵锡华). QSPR research on thermodynamic properties of polychlorinated diphenyl ethers [J].Journal of Chemical Industry and Engineering(China)(化工学报),2008, 59 (10): 2427-2435

[20]Du Xihua (堵锡华). QSPR research of thermodynamic properties of polychlorinated biphenyl [J].Journal of Chemical Industry and Engineering(China)(化工学报), 2007, 58 (10): 2432-2436

[21]Du Xihua (堵锡华). QSPR study on thermodynamic properties of polybrominated dibenzofurans and polybrominated dibenzothiophenes[J].CIESC Journal(化工学报). 2010, 61 (12): 3059-3066

[22]Lin Zhihua (林治华), Liu Shushen (刘树深), Li Zhiliang (李志良).Quantitative structure-retention relationship (QSRR)studies of polychlorinated dibenzofurans (PCDFs)on diverse gas chromatographic stationary phases on a set of novel molecular distance edge vector [J].Chinese Journal of Chromatography(色谱), 2001, 19 (2): 116-123

[23]Qin Zhenglong (秦正龙). Study on quantitative structure-property relationship of alkyl benzenes by the principal quantum number topological index [J].Chinese Journal of Organic Chemistry(有机化学), 2004, 24 (3): 338-342

[24]Porto L C, Souza E S, Junkes Bda S, Yunes R A, Heinzen V E.Semi-empirical topological index: development of QSPR/QSRR and optimization for alkylbenzenes [J].Talanta, 2008, 76 (2): 407-412

[25]Gao Jiancun (高建村), Peng Zheng (彭政), Weng Yongji (翁永基). A study on relation between molecular structure and performance of some Mannich’s base corrosion inhibitors by using molecular connectivity [J].Oilfield Chemistry(油田化学), 2003, 20 (4):380-382

猜你喜欢

正构描述符烷基
冷冻机油基础油正构烷烃测定及其对低温性能的影响
利用正构烷烃建立快速筛查禁用偶氮染料定性分析方法探究
基于结构信息的异源遥感图像局部特征描述符研究
基于AKAZE的BOLD掩码描述符的匹配算法的研究
烷基胺插层蒙脱土的阳离子交换容量研究
Linux单线程并发服务器探索
特征联合和旋转不变空间分割联合的局部图像描述符
高寒草甸植物正构烷烃特征分析
麦秸烟尘中正构脂肪醇和正构烯烃的化学组成
五种小麦麸皮烷基酚类化合物体外抗肿瘤作用及初步的机制研究