APP下载

高良姜黄酮醇合成酶基因的生物信息学分析

2023-06-27黄琼林

中国民族民间医药·下半月 2023年3期
关键词:高良姜生物信息学

【摘 要】

在前期建立的转录组数据中注释获得高良姜黄酮醇合成酶(flavonol synthase, FLS)编码基因序列,通过生物信息学分析软件对该基因及其编码蛋白进行序列分析,探讨其编码蛋白的理化性质、亲/疏水性、高级结构、保守功能域以及系统发育关系,并运用fragments per kilobase of exon per million reads mapped (FPKM)法计算该基因在高良姜不同组织中的表达差异。获得的高良姜FLS基因含有1005 bp的开放阅读框,编码含有334个氨基酸的蛋白质。编码蛋白的序列分析发现,高良姜FLS蛋白分子量约为38.2 kDa,属于亲水性、混合结构型蛋白,不含有跨膜结构域并定位在细胞质;具有黄酮醇合成酶保守功能域。FLS基因在高良姜不同组织中的表达趋势为根茎>茎>叶片。上述结果可为后续利用该基因调控高良姜黄酮醇类成分的生物合成奠定基础。

【关键词】 高良姜;黄酮醇合成酶;生物信息学

【中图分类号】R284.1   【文献标志码】 A    【文章编号】1007-8517(2023)06-0027-04

Bioinformatics Analysis of Gene Encoding Flavonol Synthase from Alpinia officinarum

HUANG Qionglin

Guangdong Medical University, Zhanjiang 524023, China

Abstract:

To analyze cDNA sequence feature of FLS gene and the function of its coding protein from traditional Chinese medicine Alpinia officinarum, a FLS gene was annotated from the transcriptome of A.officinarum and then analyzed using bioinformatics approaches. The results revealed that acquired FLS gene contained an open reading frame with a length of 1005 bp and encoded 334 amino acids. The FLS protein was a hydrophilic and hybrid protein and its molecular weight was 38.2 kDa. The FLS protein did not contain transmembrane domain and locate in cytoplasm. The FLS protein also contained a flavonol synthase functional domain and belonged to flavonol synthase superfamily. The FLS gene expressed highest in rhizome, and followed by stem, and least in leaf of A.officinarum. The results would provide a firm foundation for the biosynthesis of the medicinal flavonol in A.officinarum.

Keywords:AlpiniaofficinarumHance; Flavonol Synthase; Bioinformatics

高良姜是嶺南地区道地中药材,也是民间常用调味剂和汤料,来源于姜科多年生植物高良姜Alpiniaofficinarum Hance的干燥根茎,具有散寒止痛、温中止呕的功效[1]。据资源[2-3]调查,高良姜野生资源已几乎灭绝,人工栽培的规模和产量也在逐年下降,部分产区已经出现供不应求的趋势。黄酮类是高良姜发挥药效作用的物质基础。高良姜含有高良姜素、高良姜素-3-O-甲醚、山萘酚、槲皮素等黄酮醇成分,这些成分具有显著的抗肿瘤、抗氧化、抗菌等药理活性[4]。鉴于高良姜的药效成分较为明确,开展基于黄酮醇生物合成的基因调控研究,是促进高良姜有效成分积累和资源可持续利用的可考虑途径之一。

黄酮醇合成酶(flavonol synthase,FLS)是植物类黄酮生物合成途径的关键调控酶之一,能使二氢黄酮C3位发生羟基化,进而催化成一系列黄酮醇类化合物[5-6]。FLS编码基因的表达已被证实对黄酮醇含量具有正调控作用[7-8]。当前,青天葵[9]、杜仲[10]、金银花[11]等药用植物FLS基因已得到克隆。

本研究从转录组测序数据中挖掘和鉴定高良姜FLS基因,使用生物信息学方法进行该基因及其编码蛋白的序列特点分析和功能预测,并采用fragments per kilobase of exon per million reads mapped (FPKM)法探讨其在高良姜中的表达模式,以期为利用基于FLS基因的基因工程途径调控高良姜黄酮醇的生物合成奠定基础。

1 材料与方法

1.1 基因序列 在前期研究中,作者分别以高良姜叶片、茎和根茎为材料进行了转录组高通测序,并通对序列组装获得了147652条非冗余基因(unigene)[12]。本研究以“flavonol synthase”为检索词,在上述获得的unigene中搜索编码高良姜FLS的基因序列。

1.2 生物信息学分析 采用公共生物信息学数据库(见表1)进行高良姜FLS结构和功能的预测和分析。

1.3 高良姜FLS基因的表达分析 采用FPKM法计算FLS基因在高良姜叶片、茎和根茎中的表达量,其计算公式为:高良姜FLS基因表达量=(FLS基因的fragment数×109)/(FLS基因序列长度×样品fragment总数)。

2 结果与分析

2.1 基因序列 在高良姜转录组数据中检索到一条长度为1050 bp的高良姜FLS基因cDNA序列,将其命名为AoFLS,其中包含1002 bp编码区、35 bp 5端非编码区和10 bp 3端非编码区。AoFLS开放阅读框(open reading frame, ORF)长度为1005 bp,编码334个氨基酸。

2.2 编码蛋白AoFLS的功能域分析 如图2所示,AoFLS含有3个功能域,分别是1个特异性功能域——α-同戊二酸依赖性双加氧酶(α-oxoglutarate-dependent dioxygenase,2OG-FeII_Oxy)、2个非特异性功能域——黄酮醇合成酶(flavonol synthase)和异青霉素N合成酶及相关双加氧酶(Isopenicillin N synthase and related dioxygeneases),说明AoFLS具有黄酮醇合成酶的功能。因此,AoFLS确定为高良姜黄酮醇合成酶基因,其编码蛋白即高良姜黄酮醇合成酶。

2.3 编码蛋白AoFLS的理化性质分析 AoFLS的分子量为38.2 kDa,等電点为6.15,属于酸性蛋白质。在氨基酸组成上,含量较为丰富的是赖氨酸(Lys)和谷氨酸(Glu),所占比例均为9.0%。蛋白质不稳定指数为39.94,小于40,说明其为稳定蛋白质。

2.4 编码蛋白AoFLS的亲/疏水性分析 如图3所示,AoFLS多肽链第175位的丝氨酸具有最高的分值0.820,此处表现出最强的疏水性;位于第316位的苯丙氨酸显现最低分值-2.653,此处为亲水性最强。从整条多肽链来看,AoFLS整体表现为亲水性,而且不存在明显的疏水区域,说明其为亲水性蛋白质。

2.5 编码蛋白AoFLS的跨膜结构和亚细胞定位分析 从图4所示的跨膜结构域分析结果可知,AoFLS的整条多肽链位于细胞膜外的概率均高于整条多肽链位于细胞膜内或部分氨基酸存在跨膜结构的概率,说明该蛋白不含有跨膜结构。另外,亚细胞定位分析显示,AoFLS蛋白位于细胞质的积分值为10.00,位于细胞核、细胞外、叶绿体等位置的积分值均为0,表明AoFLS蛋白定位在细胞质上。

2.6 编码蛋白AoFLS的二级结构分析 如图5所示,组成AoFLS二级结构的元件有α-螺旋、随意卷曲、延伸链和β-转角等四种,各自的比例分别是34.73%、42.51%、17.37%和5.39%,说明AoFLS蛋白具有以α-螺旋和随意卷曲为主要组成元件的混合型结构。

2.7 AoFLS基因表达分析 基于FRKM法计算AoFLS在高良姜不同组织中的相对表达量,结果如图6所示,该基因在根茎中的表达最高,其次是茎,在叶片中的表达则最少。

3 讨论

黄酮醇合成酶不仅决定植物黄酮醇类物质的合成与积累,还影响植物花色的形成、种子数量等生理过程,是植物生长发育的关键调控节点[13-14]。因此,开展FLS基因及其编码蛋白功能和调控研究对高良姜黄酮醇成分的合成及其品种优育有着重要的促进作用。

本研究在高良姜转录组数据的基础上鉴定出了AoFLS基因,获得了其1002 bp的编码区序列及编码334个氨基酸的蛋白质序列。AoFLS蛋白含有黄酮醇合成酶的典型功能域并归属于黄酮醇合成酶超级家族,说明其具有催化黄酮醇化合物合成的功能。此外,本研究还发现AoFLS为亲水性混合结构型蛋白质,不含有跨膜结构域并且定位在细胞质。这些结论为后续高良姜FLS蛋白的分离、功能鉴定和调控研究提供了参考依据。

FRKM法是在分析高通量测序数据时常用的一种基因相对表达量计算方法,它对测序长度和基因长度进行归一化处理,使得不同长度的基因在不同测序深度下得到的基因表达水平具有可比性[15-16]。FRKM法分析显示,AoFLS在高良姜不同组织中均有表达,并且在根茎中表达最高,提示高良姜黄酮醇的合成可能在根茎中更为活跃,这也与高良姜以根茎入药的事实相符。

本研究基于转录组测序数据中鉴定出高良姜FLS基因,进行了其编码蛋白的序列分析和功能预测,明确该基因在高良姜的表达模式,为后续利用FLS基因调控高良姜黄酮醇类药效成分的合成,促进其资源可持续利用奠定了基础。

参考文献

[1]国家药典委员会. 中华人民共和国药典:一部[M]. 北京:中国医药科技出版社, 2020: 300.

[2]谭业华,陈珍. 南药高良姜生产调查、问题分析及发展对策[J]. 海南师范大学学报(自然科学版), 2014, 27(3): 293-296.

[3]杨全,严寒静,庞玉新,等. 南药高良姜药用植物资源调查研究[J]. 广东药学院学报, 2012, 28(4): 382-386.

[4]李洪福,李永辉,王勇,等. 高良姜化学成分及药理活性的研究[J]. 中国实验方剂学杂志,2014,20(7): 236-244.

[5]FERREYRA M, RIUSS S P, CASATI P. Flavonoids: biosynthesis, biological functions, and biotechnological application[J]. Pront Plant Sci, 2013(4): 407.

[6]PETRUSSA E, BRAIDOT E, ZANCANI M, et al. Plant flavonoids-biosynthesis, transport and involvement in stress responses[J]. Int J MolSci, 2013(14): 14950-14973

[7]ZHOU X W, FAN Z Q, CHEN Y, et al. Functional analysis of a flavonol synthase-like gene from Camellia nitidissima reveal its roles in flavonoid metabolism during floral pigmentation[J]. J Biosci, 2013(3): 593-604.

[8]鄭雪莲,李嘉仪,杨俊,等. 枇杷黄酮醇合成酶FLS基因表达与黄酮醇积累的相关性分析[J]. 福建农业科技,2019(5):1-6.

[9]黄琼林,卓一南,曾湘达,等. 中药青天葵黄酮醇合成酶基因的克隆与生物信息学分析[J]. 西南农业学报,2018,31(10): 2030-2035.

[10]常立,李周岐,李煜,等. 杜仲Fls基因的克隆及原核表达[J]. 西北农林科技大学学报(自然科学版),2014,42(4): 102-108.

[11]乔中全,何钢,王晓明,等. 金银花黄酮醇合成酶的克隆及序列分析[J]. 生物技术通报,2012(4): 63-68.

[12]黄琼林. 高良姜转录组的特征分析[J]. 中药新药与临床药理, 2020, 31(6): 729-734.

[13]杜灵娟,陈凯利,刘雅莉. 葡萄风信子FLS1基因克隆及其表达与花色性状之间的关联性分析[J]. 西北林学院学报,2017,32(1): 106-113.

[14]MAHAJAN M, AHUJA P S, YADAV S K. Post-transcriptional silencing of flavonol synthase mRNA in tobacco leads to fruits with arrested seed set[J]. PLoS One, 2011(12):e28315.

[15]王曦,汪小我,王立坤,等. 新一代高通量RNA测序数据的处理与分析[J]. 生物化学与生物物理进展,2010,37(8): 834-836.

[16]黄琼林,何瑞,詹若挺. 青天葵HMGR基因片段的鉴定和生物信息学分析[J].广东农业科学, 2015,42(21): 140-144.

(收稿日期:2022-07-27 编辑:陶希睿)

猜你喜欢

高良姜生物信息学
治脾胃虚寒
高良姜联合收获技术及装备在湛江徐闻试验成功
治胃寒痛
应用rbcL条形码鉴别高良姜及其伪品大高良姜
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
治胃寒痛
响应曲面法优化大高良姜黄酮酶法提取工艺