APP下载

应用毒性评价软件工具和Toxtree软件预测硝基烃及其衍生物的毒性

2022-10-17贺泳迪宋金瓯王晓文谢继标

中国药理学与毒理学杂志 2022年7期
关键词:官能团衍生物决策树

贺泳迪,宋金瓯,武 斌,王晓文,谢继标,王 斌

(1.天津大学内燃机燃烧学国家重点实验室,天津 300072;2.南华大学附属怀化医院,湖南 怀化 418000)

硝基烃是一类广泛存在于燃烧装置尾气及城市大气中的有毒物质,具有一定的一般毒性、致癌性、致畸性和致突变性,被认为经由燃烧尾气中的氮氧化物和不完全燃烧产物之间的反应生成[1-4]。由于硝基为吸电子基团,硝基烃及其衍生物一般具有较大的偶极矩、极性和分子间吸引力,液态化合物的沸点一般较高;硝基烃在中高温度条件下会进一步反应,被认为是复杂的醚、醇和醛等物质的前驱物,也可进一步还原生成亚硝基物、羟胺、亚胺和胺[5-6]。在工业上一般通过烷烃的气相或液相硝化制取硝基烃,进而以硝基烃为底物加工生成其衍生物,目前可生产的硝基烃衍生物多达2000余种。目前排放标准日渐严格化,提高了对硝基烃等特殊污染物的关注,国内外在化学反应动力学层面针对硝基烃及其衍生物均展开了广泛研究[5-9];同时,硝基烃及其衍生物作为燃油添加剂[7]、药品[10]和化学合成前体[11]的应用越来越广泛。但针对硝基烃及其衍生物毒性、致癌性和致突变性的研究有限,仅有6-硝基联苯和1-硝基芘等十余种硝基烃被国际癌症研究机构(International Agency for Research on Cancer,IARC)纳入第二类致癌物名录,大量同类物质,尤其是可能于中高温环境下形成的硝基醇和硝基醛等物质,未见实验报告。因此,亟需推进对该类物质的危害性研究,并建立毒性数据库,以保障实验室防护和生产防护等需要。

毒性评价软件工具(Toxicity Estimation Software Tool,TEST)是世界范围内应用最为广泛的免费毒性预测软件之一,具有多种化学品导入方法和毒性预测方法:①可通过输入化学文摘(chemical abstract service,CAS)登记号、SMILES码和系统命名名称等常见信息查找化学物,或直接使用软件内置的二维结构图编辑器绘制特定化学品的结构,整体便捷、快速;②内置查询数据库,可实现离线查询;③用户可自主选择需调用的毒性预测方法,软件提供了层次法、最近邻法和一致法等6种方法以供选择,避免了单一方法的局限性;④可基于化学物质的结构特征自动计算分子描述符,采用所选方法预测毒性;⑤可量化评估急性毒性,可预测带鲦鱼(fathead minnow)半数致死浓度(lethal concentration 50%,LC50)、大型蚤(Daphnia magna)LC50、梨形四瓣虫(Tetrahymena phriformis)半数生长抑制浓 度(inhibition growth concentration 50%,IGC50)、大鼠经口半数致死量(lethal dose 50%,LD50)、发育毒性、致突变性、生物富集因子和部分理化性质,在诸多基于定量结构活性关系(quantitative structure-activity relationship,QSAR)的毒性预测软件中有较高的预测覆盖性(涵盖多种杂环类和大分子物质)。

Toxtree是基于决策树的推理模型,可通过直接输入SMILES码、系统命名名称查询化学物质,或采用系统自带的二维结构图编辑器绘制化合物结构;界面简单,使用快捷,内存占用小,预测覆盖性良好,各步基于规则的预测推理均有透明报告,包含多个经实验检验的决策树;基于特定化合物结构,用户可选用特定决策树预测化合物毒性关注阈值(threshold of toxicological concern,TTC)、致癌性、致突变性(包括Ames实验和啮齿类微核实验)、皮肤腐蚀性和眼刺激性等。TTC是一项为化学品制定的人体暴露水平阈值,当人体摄入量低于该阈值,则一般认为难以造成健康危害[12]。TTC法常被用于预测化学品毒性、初步评价化学品危害性、评估相关动物实验必要性和优先性等[12]。Toxtree提供了多个预测TTC的决策树,如Cramer决策树、扩展的Cramer决策树、修订的Cramer决策树和Kroes决策树等。Toxtree对于不饱和羰基化合物毒性预测效果不佳[13],但对于结构复杂糖类、苷类、醌类和萜类化合物的致癌性和遗传毒性预测具有良好灵敏性和准确性[14]。

此2种毒性预测软件在国内已被多次用于复杂有机物(如中草药有效成分)的毒性预测[12,14-17]、农业污染物毒性评估[18-19]等,适合于QSAR预测毒性数据库的快速建立,但基于两者毒性预测应用研究在国内仍有限,硝基烃及其衍生物数量数以千计,其危害性检测依赖于大量动物实验,难以在短期内一一检测,因此,基于QSAR毒性预测软件的快速预测尤为重要。

鉴于目前针对硝基烃及其衍生物危害性动物实验仍较不足,本研究采用此2种常用毒性预测软件预测硝基烃及其衍生物急性经口毒性、发育毒性、致突变性和致癌性,为建立QSAR预测毒性数据库的提供预测数据,为后续动物实验,以及相应实验室防护和生产防护提供一定参考。

1 材料与方法

1.1 研究对象

所选用硝基烃及其衍生物来源于Aladdin和MACKLIN 2个常用的化学品商用平台,在上述平台在售化学品名录中,共调研得此类物质1200余种,鉴于TEST软件对官能团种类较少物质预测准确度较高[18],且目前对含有多种官能团硝基烃衍生物研究和应用均相当有限,从1200种硝基烃及其衍生物中筛选出硝基烃及除硝基官能团外仅含有一种官能团的硝基烃衍生物(如邻硝基苯酚,仅含有硝基官能团和羟基官能团)共计449种,为本研究的研究对象,记录入数据库。其中文名称、英文名称和CAS登记号等信息均来源于对应平台。数据库的建立结构参考高雅等[15]的建设模板。根据硝基烃及其衍生物不同的结构及官能团,所选用硝基烃及其衍生物可分为15类,即①硝基烃46种;②硝基烃卤代物103种;③硝基醇类化合物13种;④硝基酚类化合物25种;⑤硝基醚类化合物27种;⑥硝基醛类化合物6种;⑦硝基酮类化合物10种;⑧硝基羧酸类化合物31种;⑨硝基酯类化合物39种;⑩硝基腈类化合物16种;[11]含氮/含硫杂环硝基衍生物37种;[12]硝基胺/肼类化合物38种;[13]硝基酰胺/酰肼/酰氯类化合物19种;[14]带含硫官能团的硝基物质23种;[15]其他物质16种,包含呋喃、酸酐、腙类等物质的硝基衍生物。

1.2 预测方法

TEST(Version 5.1)[20]由美国环境保护局(US Environmental Protection Agency,US EPA)开发,在本研究中用于预测物质的经口急性毒性(大鼠经口LD50)、发育毒性和致突变性(Ames实验)。对急性经口毒性的定量预测,TEST提供了层次法、最近邻法和一致法,其中一致法预测结果为采用其他方法预测结果的均值,可平衡不同方法优缺点,保证预测结果最优化[16]。因此本研究采用一致法。对于致突变性和发育毒性的预测,TEST仅给出定性预测结果(阴性/阳性)。其中对于致突变性预测TEST提供了层次法、最近邻法和一致法;对于发育毒性预测TEST提供了层次法、最近邻法、单一模型法和一致法,本研究均采用一致法。特殊情况下,对某些结构较为复杂物质,层次法或最近邻法若失效,此时仅记录其他方法的预测结果(如预测LD50时,如层次法失效,则仅记录最近邻法的预测结果)。待分析物质通过CAS登记号进行导入,对于TEST内置数据库内未记录物质,采用二维结构图编辑器绘制结构。预测过程采用严碎片约束算法,不进行Relax Fragment Constraint优化。

Toxtree(Version 3.1.0)由欧盟联合研究中心(Joint Research Centre,JRC)开发,在本研究中用于预测物质的TTC、遗传毒致癌性结构预警(genotoxic carcinogenicity structural alert,GC SA)、非遗传毒致癌性结构预警(nongenotoxic carcinogenicity structural alert,NGC SA)和致突变性(Ames实验)。对于TTC预测,Toxtree内置了修订的Cramer和Kroes TTC等多个决策树,本研究采用简洁、常用的修订Cramer决策树;对于致癌性预测,本研究采用内置的“通过判别分析和结构规则预测致癌性/致突变性概率(predicts the possibility of carcinogenicity and mutagenicity by discriminant analysis and structural rules)”决策树;对于致突变性预测,本研究采用内置的“ISS体外诱变警报〔in vitromutagenicity(Ames test)alerts by ISS〕”决策树。各决策树在预测前未做修改。待分析物质通过输入物质系统命名名称导入,对于内置数据库未能识别的物质,通过二维结构图编辑器绘制结构。

1.3 统计学分析

对不同结构的硝基烃及其衍生物的急性毒性采用全球化学品统一分类和标签制度分类法(Globally Harmonized System,GHS)和Hodge/Sterner(H/S)分类法进行分类,对分类结果进行有序分类变量的秩和检验统计学分析,以明确各结构分类的物质的大鼠经口LD50在GHS和H/S急性毒性分类中的差异是否具有统计学意义。鉴于本研究同时采用TEST和Toxtree 2个软件预测了致突变性(Ames实验),对于2个软件的定性预测结果进行Kappa一致性检验。部分研究报告了硝基烃或其衍生物的大鼠经口LD50的实验值及相应急性毒性分类,对于同一物质大鼠经口LD50所属毒性分类的预测值和实验值进行Kappa一致性检验。当Kappa值介于0~0.4之间时,认为一致性较差;介于0.4~0.75之间时,认为一致性一般;介于0.75~1.0之间时,认为一致性较好。

对于致突变性和致癌性等阴性/阳性分类型数据,基于贝叶斯逆概率定律,主要的评价指标采用Cooper统计量[15,21],包括灵敏性、特异性和准确性。其中,灵敏性=预测值和实验值均为阳性的样本数/实验值为阳性的样本数,特异性=预测值和实验值均为阴性的样本数/实验值为阴性样本数,准确性=预测值和实验值一致的样本数/总样本数。急性毒性分类计算准确率(%)=实验值和预测值毒性分类一致样本数/总样本数的比率×100%。

2 结果

2.1 软件预测结果

修订的Cramer决策树根据29个化学结构特点将化学品分为3类,即Ⅰ类物质(结构简单,存在有效代谢途径)、Ⅱ类物质(其结构对应的无害性次于Ⅰ类物质,但不存在Ⅲ类物质的结构特点)和Ⅲ类物质(存在不可推定为安全的结构特点或含有高反应活性的官能团,可能存在显著毒性)。由于修订的Cramer决策树将硝基官能团认定为一种加强毒性的官能团(functional group associated with enhanced toxicity),本研究中数据库中449种硝基烃及其衍生物均被Toxtree认定为毒理学关注阈值Ⅲ类物质,即均不可预设为安全的物质,可能具有显著的经口毒性[22]。

本研究选用的2种急性毒性分类方法中,GHS分类法中将毒性分为5类,大鼠经口LD50分别为第1类0~5 mg·kg-1,第2类5~50 mg·kg-1,第3类50~300 mg·kg-1,第 4 类 300~2000 mg·kg-1,第5类≥2000 mg·kg-1;H/S分类法则分为6类,大鼠经口LD50分别为极毒0~1 mg·kg-1、高毒1~50 mg·kg-1、中毒50~500 mg·kg-1、低毒500~5000 mg·kg-1、基本无毒5000~15 000 mg·kg-1和相对无害≥15 000 mg·kg-1)。TEST对大鼠经口LD50的预测结果(图1,表1)显示,298种(66.4%)硝基烃及其衍生物的大鼠经口LD50属GHS急性毒性第4类,104种(23.2%)属GHS急性毒性第5类;354种(78.8%)硝基烃及其衍生物大鼠经口LD50预测值属H/S分类法“低毒”类,82种(18.3%)属H/S分类法“中毒”类。绝大多数硝基烃及其衍生物属中低毒性物质。1-硝基-2,5-双三氟甲基苯、4-叔丁基-2,6-二硝基苯酚、4-(硝基苄基)膦酸二乙酯、6-硝基吲哚、3-硝基-7-氮杂吲哚和3-硝基邻苯二甲酰肼的大鼠经口LD50预测值显示,属H/S分类法的高毒物质(或GHS急性毒性第2类物质),表明在相应实验室使用和生产过程中需着重注意防护工作。对不同结构分类的硝基烃及其衍生物的LD50的GHS分类进行有序多分类样本比较秩和检验,表明不同结构分类的硝基烃及其衍生物急性毒性分类预测差异具有统计学意义(P<0.01)。

Fig.1 Dot plot of results of acute oral toxicity of nitro-organic compounds predicted by Toxicity Estimation Software Tool(TEST).Dots in the figure represent the oral rat LD50data predicted by TEST.Data points in Fig.1A and Fig.1B are located in the same positions.Fig.1(A)and Fig.1(B)show the toxicity classifications according to Globally Harmonized System(GHS)standard and Hodge/sterner(H/S)standard,respectively.

Tab.1 Predicted results of acute toxicity classifications(LD50),developmental toxicity,mutagenicity and carcinogenicity of nitro-organic compounds

TEST和Toxtree软件对不同结构分类的硝基烃及其衍生物的发育毒性、致突变性(Ames实验)、GC SA和NGC SA预测结果见表1。由于本研究的分析对象中脂链硝基烃(及其衍生物)仅占3%,大多数导入预测软件的硝基烃及其衍生物均为硝基芳烃的衍生物或含氮/含硫杂环物质的硝基衍生物,而Toxtree内置的“通过判别分析和结构规则预测致癌性/致突变性概率”决策树将硝基苯结构认定为遗传毒致癌性结构和致突变性结构之一,因此396种(88.2%)硝基烃及其衍生物的预测结果(表1)显示有GC SA,396种(88.2%)被Toxtree提示有Ames实验致突变性结构预警。对于部分结构特殊的硝基烃及其衍生物,如硝基官能团的邻位均有取代基(如2,6-二氟硝基苯),或硝基官能团的邻位存在羧酸取代基,或硝基官能团所在环上存在磺酸基团时,前述决策树将排除此类物质的GC SA和致突变性结构预警。此类硝基烃及其衍生物的预测结果未显示致癌性阳性或致突变性阳性。少数硝基烃及其衍生物具有邻苯二甲酸、邻苯二甲酸二酯、咪唑、苯并咪唑、二甲酰亚胺和邻苯基苯酚等结构,此类结构被前述决策树认为具有不涉及DNA损伤的致癌模式,被Toxtree预测为具有非遗传毒致癌性,因此仅13种(2.9%)硝基烃及其衍生物的预测结果显示有NGC SA。

被TEST预测为致突变性阳性的硝基烃及其衍生物有284种,占全部物质的63.3%,而被Toxtree预测为致突变性阳性的物质有396种(88.2%)。2个软件对于285种(63.5%)物质的预测结果一致;在被TEST预测为致突变性阳性的硝基烃及其衍生物中,258种(占比90.8%)同样被Toxtree预测为致突变性阳性,2个软件在阳性预测上一致性较高。相较于TEST致突变性预测中结合最近邻法和层次法的预测逻辑,Toxtree的“ISS体外诱变警报”决策树简单地将硝基苯结构认定为致突变性结构,仅根据碎片结构进行预测,导致其在致突变性预测中相比于TEST更为严格,因此,有137种硝基烃及其衍生物被TEST预测为致突变性阴性,但被Toxtree内置决策树提示具有致突变性结构预警。相对于TEST,Toxtree的预测逻辑较为武断,导致Toxtree和TEST对于致突变性的预测一致性较差(Kappa系数=0.09)。综合2个软件的预测结果,数据库中442种(94.0%)硝基烃及其衍生物被记录为致突变性阳性。

213种(47.4%)硝基烃及其衍生物的TEST预测结果为发育毒性阳性,其中,硝基烃(60.9%)、硝基醚类(74.1%)、硝基酯类(64.1%)和带含硫官能团的硝基物质(65.2%)的发育毒性阳性率均达60%。

硝基烃大鼠经口LD50、发育毒性、致突变性和致癌性的预测结果(表2)显示,苊、芴、萘、联苯和萘等PAH前驱物[23]的硝基衍生物的发育毒性和致突变性的预测结果基本均为阳性,所有此类物质均被Toxtree提示具有GC SA;相比于单硝基烃,结构相似的二硝基烃的大鼠经口LD50预测值明显更高。

Tab.2 Predicted and experimental results of acute toxicity classifications(LD50),developmental toxicity,mutagenicity and carcinogenicity of nitro-hydrocarbons

Tab.2(Continued)

2.2 预测结果评价

ChemidPlus数据库有大鼠经口LD50实验数据的硝基烃及其衍生物共66种,对比大鼠经口LD50预测值和实验值,结果(图2,表3)显示,大鼠经口LD50的实验值为TEST预测值的0.01~16.39倍,33种(50.0%)硝基烃及其衍生物的预测相对误差在±50%以内,22种(33.3%)物质的预测相对误差在±30%以内;对于部分取代基复杂的物质,如5-硝间苯二甲酸二甲酯和双(4-硝苯)硫醚,预测误差较大;40种(60.6%)硝基烃及其衍生物的LD50预测值和实验值所属的GHS急性毒性分类一致,49种(74.2%)物质预测值和实验值所属的H/S急性毒性分类一致,整体预测准确率尚可。LD50预测值和实验值所属的GHS急性毒性分类的一致性不佳(Kappa系数=0.28),对于H/S急性毒性分类的一致性一般(Kappa系数=0.56),明显优于GHS分类。ChemidPlus数据库中有Ames实验数据的硝基烃及其衍生物共151种,TEST预测致突变性(Ames实验)的灵敏性、特异性和准确性(Cooper统计量[15,21])分别为86.6%,63.2%和80.7%,Toxtree预测的灵敏性、特异性和准确性分别为93.8%,21.1%和75.5%,Toxtree对致突变性的预测呈现低特异性的原因如上文所述;Lhasa数据库中有致癌性实验数据的硝基烃及其衍生物共27种,Toxtree预测的灵敏性、特异性和准确性分别为84.2%,62.5%和77.8%。由于各QSAR平台、数据库对于发育毒性的评价标准不一,通常难以给出可靠性评价[14]。

Fig.2 Dot plot of oral rat LD50of nitro-organic compounds predicted by TEST(hollow circles)and reported in literature(solid squares).

Tab.3 TEST predictions and experimental values reported in literature on oral rat LD50of nitro-organic compounds

Tab.3(Continued)

对于46种硝基烃的大鼠经口LD50(表2),除硝基甲烷(LD50预测值 3138.51 mg·kg-1,实验值941.21mg·kg-1)、硝基乙烷(LD50预测值553.02mg·kg-1,实验值1100.33 mg·kg-1)、2-硝基联苯(LD50预测值1908.01 mg·kg-1,实验值1231.21 mg·kg-1)和 1,3-二硝基苯(LD50预测值201.21 mg·kg-1,实验值59.51 mg·kg-1)外,硝基烃的预测相对误差均<40.0%;其中,1-硝基丙烷、硝基苯、邻硝基甲苯等常用硝基烃的预测误差<10.0%。硝基烃大鼠经口LD50的预测值和实验值所属的H/S急性毒性分类的一致性较好(Kappa系数=0.85);TEST和Toxtree软件对硝基烃致突变性的预测准确性均为67.9%。

综上所述,除Toxtree预测致突变性特异性不佳外,TEST和Toxtree整体预测可靠性尚佳,优于同类数据库的评估结果[14]。

3 讨论

针对硝基烃及其衍生物的致毒、致病机制,目前存在多种说法,但均与硝基官能团紧密相关。魏桐等[24]和闫秀芬等[25]提出,与体内蛋白形成共价加合物是硝基烃的重要致毒机制之一。对于加合物的生成机制,目前尚有不同观点:①单电子还原酶作用促进硝基自由基的形成,进而启动氧化应激机制;②双电子还原酶促使硝基烃生成亚硝基产物。该毒性机制被认为与硝基官能团自身的强氧化性、亲电性,电荷和前线轨道能级差[25-26]以及C-N键的低键能有关。硝基烃及其衍生物均带有硝基官能团,可能广泛存在上述致毒机制。本研究预测结果同样显示,绝大多数(98.4%)硝基烃及其衍生物具有低毒及以上的急性经口毒性,多硝基物质的急性经口毒性预测值明显高于具有类似结构的单硝基物质。此外,本研究预测结果显示,硝基胺类的急性经口毒性普遍较低,由于苯环上的氨基则增加苯环和硝基上的负电性[25],进而使急性经口毒性降低。

Yin等[27]针对卤代硝基烃的研究表明,卤代硝基甲烷可诱导氧化应激,进而造成DNA损伤,诱导细胞凋亡,但是在胃肠道的快速脱卤将导致其急性经口毒性快速降低;与此对应,本研究发现,79.6%硝基烃卤代物的急性经口毒性预测结果为低毒,大多数硝基烃卤代物表现出的低毒性可能与上述胃肠道脱卤机理有关;预测结果显示,86.4%硝基烃卤代物被Toxtree提示有GC SA,94.2%硝基烃卤代物为致突变性阳性,这一定程度表明,本研究所分析的大分子卤代硝基烃,也存在与卤代硝基甲烷类似的诱导氧化应激,进而造成DNA损伤,诱导细胞凋亡的致癌、致突变机制。

综上所述,由于硝基官能团的存在,硝基烃及其衍生物可能普遍存在一定急性经口毒性,其毒性大小与硝基官能团的数量、电荷、前线轨道能级差、所对应C-N键键能有关;硝基烃卤代物可能会导致DNA损伤,表现为致突变性和致癌性;卤代官能团和氨基官能团的引入可能使急性经口毒性下降。而其他硝基烃及其衍生物的风险评估仍需进一步的实验毒理学、计算化学研究。

由本研究预测结果可见,大部分硝基烃及其衍生物具有急性经口毒性,相当一部分硝基烃及其衍生物具有致癌性和发育毒性,这与目前学界对于硝基烃的共识一致。但需要注意的是,一部分硝基烃及其衍生物具有中高毒性,包括目前应用广泛的吸热碳氢燃料引发剂硝基丙烷[5-7]和常见于大气中的二硝基取代芳烃,在这些物质的生产流程及其排污后处理过程中需要着重注意硝基烃及其衍生物的检测、处理,及对应的生产防护;鉴于硝基烃来源于碳氢污染物和氮氧化物之间的反应[1-4],来源尤为广泛,预测结果显示的广泛存在的急性经口毒性表明,对此类物质进行针对性的大气监测具有必要性;预测结果提示硝基烃及其衍生物在发育毒性方面存在高发性,Kroes等[22]和高雅等[16]曾提出,发育毒性与致畸性具有较强的相关关系,因此,需要开展进一步的致畸性、发育毒性研究。综上所述,硝基烃及其衍生物预测结果显示的高发存在的中高急性经口毒性、致癌性、致突变性和发育毒性表明了展开进一步化学、毒理学研究的必要性,同时也为风险评估提供了重要参考;TEST和Toxtree整体上的预测准确性一定程度上表明了基于该2个QSAR预测软件进行硝基烃及其衍生物的危害性评估的可行性,但对于部分取代基复杂的衍生物,预测准确性仍较为有限。

猜你喜欢

官能团衍生物决策树
有机物官能团的定量关系在解题中的应用
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
烃的含氧衍生物知识测试题
烃的含氧衍生物知识链接
同分异构之官能团位置异构书写规律
逆向合成分析法之切断技巧
决策树在施工项目管理中的应用
“五抓”烃的含氧衍生物
潜析结构 把握性质