APP下载

三叶崖爬藤matK基因编码区全序列测定及编码产物研究

2021-05-09袁莉霞孙崇鲁

湖北农业科学 2021年7期
关键词:信号肽亲缘进化树

吴 浩,周 磊,袁莉霞,孙崇鲁

(浙江医药高等专科学校,浙江 宁波315100)

三叶崖爬藤(Tetrastigma hemsleyanum)又称金钱吊葫芦,是葡萄科崖爬藤属珍稀药用植物,全株可入药,以块根效果最佳。主要分布于浙江、福建等省,可用于治疗风湿性关节炎、肝炎及病毒性脑膜炎等多种疾病[1]。由于临床应用量的激增,野生蕴藏量急剧下降,近年来栽培[2,3]、组培[4]等方面的研究集中。由于三叶崖爬藤与爬藤属其他植物外形颇为相似[5],因此在三叶崖爬藤种质资源收集过程中会遇到一定的困难。

近年来分子鉴定技术已广泛应用于植物物种的鉴定,其中DNA条形码序列分析已逐渐被应用于多基原鉴定、产地鉴别等方面。用于鉴定的DNA条形码有ITS、matK和psbA-trnH等,谭新宁等[6]利用ITS序列成功鉴定了青葙子(Celios cristata)及其6种同属的混伪品;Zhou等[7]利用ITS序列成功鉴定25种雪藤属草药,并建立了该类草药的分子标记系统;Zahra等[8]对32种唇形科植物利用rbcL、matK以及psbA-trnh进行鉴定,结果发现matK和psbA-trnh两种序列对种间的鉴定成功率高于rbcL,为40%;郑辉等[9]研究峨眉山区唇形科药用植物发现,以ITS2和matK序列鉴定唇形科药用植物是最快速、准确的鉴定和识别方法,能准确地阐明物种之间的亲缘关系。

matK是位于叶绿体等基因组中tmK基因的内含子部分[10],用于编码的matK基因分子量小,拷贝数多,结构简单,不仅含有较高的基因同源性,而且还存在大量的变异位点,可用于物种间亲缘关系研究及进化树构建,是鉴定同属不同植物品种的优良候选基因[11-13],因此在各类药材鉴定中具有较好的应用前景。本研究从生物信息学的角度对三叶崖爬藤的matK基因进行分析,为三叶崖爬藤资源开发提供数据支持,为濒危药用植物三叶崖爬藤的分子鉴定及保护提供一定的理论基础。

1 材料与方法

1.1 材料

除三叶崖爬藤(Tetrastigma hemsleyanum)通过转录组测序获得外,其他13种matK基因序列均从NCBI网站上下载得到,用于研究系统进化树,所下载其他崖爬藤属植物的matK基因序列Genbank号如表1所示。

表1 物种名及Genbank号

1.2 数据分析

利用NCBI ORFfinder对三叶崖爬藤matK基因进行分析,搜索开放阅读框;采用ProtParam工具(https://web.expasy.org/protparam/)分析三叶崖爬藤matK蛋白的氨基酸种类及相对分子质量等理化性质;利 用Protscale(https://web.expasy.org/cgi-bin/protscale/protscale.pl?1)进行matK亲/疏水性的预测;利用在线软件SignalP4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)预 测matK的 信 号 肽;运 用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)完成跨膜结构域的分析;利用软件Tar⁃getP 2.0(http://www.cbs.dtu.dk/services/TargetP-1.1/index.php)进行亚细胞定位预测;利用在线工具JPred 4(http://www.compbio.dundee.ac.uk/jpred/)预测二级 结构,再利用SWISS-MODEL(http://www.swissmodel.expasy.org/)进行同源建模,预测三维结构;最后运用MEGA7对三叶崖爬藤等14种matK基因序列完成进化树的构建。

2 结果与分析

2.1 开放阅读框预测

三叶崖爬藤matK基因的开放阅读框分析见图1。三叶崖爬藤matK基因序列长度为969 bp,利用ORFFinder对其进行开放阅读框分析,共获得6个开放阅读框(ORF1~ORF6),其中ORF1的长度最大,为969 bp,起始密码子位于171 bp,终止密码子位于969 bp,共编码266个氨基酸。

2.2 氨基酸组成分析

ProtParam分析表明,三叶崖爬藤matK的分子式为C1508H2222N378O371S7,相对分子质量为4 486,共含有20种氨基酸(图2),其中亮氨酸的比例最高,占所有氨基酸的12.40%,其后依次为苯丙氨酸(10.50%)、丝氨酸(10.20%)、异亮氨酸(7.50%)、赖氨酸(6.40%)、天冬酰胺(6.00%)、络氨酸(6.00%)、组 氨 酸(5.60%)、缬 氨 酸(4.90%)、谷 氨 酰 胺(4.90%)、精氨酸(3.80%)、甘氨酸(3.80%)、脯氨酸(3.80%)、丙氨酸(3.00%)、谷氨酸(3.00%)、天冬氨酸(2.60%)、色氨酸(2.30%)、甲硫氨酸(1.90%)、半胱氨酸(0.80%)、苏氨酸(0.80%)。不稳定系数为49.32,该蛋白为不稳定蛋白。

图1 三叶崖爬藤matK基因的开放阅读框分析

图2 三叶崖爬藤matK的氨基酸组成

2.3 亲/疏水性分析

三叶崖爬藤matK中存在一些极性氨基酸,对蛋白质的高级结构形成有一定的影响,利用Protscale对三叶崖爬藤matK的氨基酸序列进行亲/疏水性分析(图3),预测结果发现总平均疏水指数(GRAVY)为-0.020,说明此蛋白为亲水性蛋白质,最高分值为2.40,最低分值在-2.05。

图3 三叶崖爬藤matK氨基酸的亲/疏水性

2.4 信号肽预测分析

利用在线软件SignalP4.1对三叶崖爬藤matK的信号肽进行预测分析(图4)。结果表明,三叶崖爬藤matK最大S值为0.899,出现在第12位氨基酸上;最大Y值为0.134,出现在第20位氨基酸上;最大C值为0.081,出现在第28位氨基酸上。S平均值大于0.5,表明该蛋白为分泌蛋白,存在信号肽,属于信号肽的概率高达99.8%,信号肽剪切位点预测处于64~65位氨基酸。

图4 三叶崖爬藤matK的信号肽预测

2.5 跨膜区预测

利用软件TMHMM Server v.2.0对三叶崖爬藤matK蛋白进行跨膜预测分析(图5)。结果表明,该蛋白膜外的比例为100%,而在膜内的比例为0,说明该蛋白不存在跨膜区,不具备介导细胞内及细胞间的信号传递功能。

图5 三叶崖爬藤matK的跨膜结构预测

2.6 亚细胞定位预测

通过软件TargetP 2.0对三叶崖爬藤matK蛋白进行亚细胞定位预测(图6)。结果表明,线粒体导肽的可能性为0,叶绿体转运肽的可能性为0.014 3,类囊体管腔转移肽的可能性为0,因此三叶崖爬藤matK蛋白只存在于叶绿体中。

2.7 蛋白二、三级结构预测

利用在线工具JPred 4分析三叶崖爬藤matK氨基酸序列的二级结构。结果如图7所示。再利用SWISS-MODEL对三叶崖爬藤matK蛋白进行同源建模,获得该蛋白质的三维结构,如图8所示。

2.8 系统进化树的构建

图6 三叶崖爬藤matK的亚细胞定位预测

图7 三叶崖爬藤matK的二级结构

图8 三叶崖爬藤matK的三维结构

通过NCBI收集13种爬藤属植物的matK基因,并与测序获得的三叶崖爬藤一起通过MEGA7构建进化树(图9)。结果显示,单叶红枝崖爬藤、红枝崖爬藤、尾叶崖爬藤、草崖藤、毛枝崖爬藤与三叶崖爬藤的亲缘性较高;显孔崖爬藤、广西崖爬藤、茎花崖爬藤、过山崖爬藤、厚叶崖爬藤、景洪崖爬藤、十字崖爬藤与三叶崖爬藤的亲缘性略远;其中崖爬藤的亲缘性最远。

图9 三叶崖爬藤matK基因的系统进化树

3 讨论

目前matK蛋白大多处于功能及表达方面的研[14,15],本研究所编码的三叶崖爬藤matK蛋白质预测位于细胞器叶绿体中,所含的氨基酸包括20种,基因解析中发现翻译的蛋白含有相对较多的极性氨基酸,该蛋白不稳定系数为49.32,表明为不稳定的亲水蛋白质,含有信号肽,不含跨膜区。此研究为三叶崖爬藤matK蛋白的提取研究提供了一定的基础。

matK基因序列结构相对保守,在同属类植物中同源性较高,较rbcl进化速率慢[16],快于ITS[17],可应用于下一级(种)的分类。近年来,matK被应用于多种植物的亲缘性研究,陈芙蓉等[18]通过matK、trnL等序列的分析,建立一种能快速鉴别野菊以及药用菊的有效方法;黄琼林等[19]通过构建matK基因的系统进化树,直观有效地将高良姜和混伪品区分开来;戚华沙等[20]通过trnH-psbA、matK序列对不同来源的34份油茶种子完成了鉴别,发现trnH-psbA+matK序列可有效鉴别普通油茶、越南油茶以及其他供试油茶物种;刘利平等[21]利用DNA条形码的4个序列(matK、rabL、psbK-psbI、atpF-atpH)对天南星及其易混品进行鉴定,建立了适用于该物种的DNA条形码有效鉴别方法。本研究测序获得三叶崖爬藤matK基因序列,通过NCBI网站,Blast对比获得13条同属植物matK序列为969 bp,拥有6个开放阅读框;通过构建的系统进化树发现毛枝崖爬藤与三叶崖爬藤的亲缘性最高,崖爬藤与三叶崖爬藤的亲缘性最远,且三叶崖爬藤能有效地与其他爬藤属物种区分开来。本研究为后续深入研究三叶崖爬藤matK基因,并有效利用该基因进行爬藤属或下一级分类研究奠定了基础。

猜你喜欢

信号肽亲缘进化树
谷子近缘野生种的亲缘关系及其利用研究
中国医学科学院药用植物研究所药用植物亲缘学研究中心
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
菊科药用植物遗传多样性及亲缘关系的ISSR分析
小白菜种质遗传多样性与亲缘关系的SRAP 和SSR分析
运用计算机软件预测木质部寄生属信号肽
艾草白粉病的病原菌鉴定
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
内源信号肽DSE4介导头孢菌素C酰化酶在毕赤酵母中的分泌表达