APP下载

半边旗叶绿体基因组及其结构分析

2023-10-08黄琼林叶晓霞谭靖怡王燊黄学山赖嘉琪吴民华广东医科大学基础医学院广东湛江540广东医科大学药学院广东湛江540广东医科大学第一临床医学院广东湛江540

中药新药与临床药理 2023年9期
关键词:井栏密码子叶绿体

黄琼林,叶晓霞,谭靖怡,王燊,黄学山,赖嘉琪,吴民华(.广东医科大学基础医学院,广东 湛江 540;.广东医科大学药学院,广东 湛江 540;.广东医科大学第一临床医学院,广东 湛江 540)

叶绿体是绿色植物所具有半自主性细胞器,是高等植物合成淀粉、叶绿素、胡萝卜素等次生代谢产物以及大部分氨基酸的场所,对植物的生命活动有着举足轻重的作用。叶绿体含有独立于核基因组的遗传体系,即叶绿体基因组[1]。在陆生植物中,叶绿体基因组约长110~160 kb,由大单拷贝区(large single copy region,LSC)、小单拷贝区(small single copy region,SSC)以及位于LSC 和SSC 之间的两个反向重复区(inverted repeat region,IR)4 部分构成,呈现为双链环形四段式结构[2]。植物叶绿体基因组通常编码110 ~130个与光合作用、自身转录翻译、其他生物合成相关基因以及少数功能未知基因[3-4]。尽管结构和基因组成保守,但IR 部分经常发生扩张和收缩,引起叶绿体基因组的变异和进化[5]。因此,叶绿体基因组具有序列短、结构稳定、基因组成保守、进化速率适中等特点[2-3]。鉴于这些优势,叶绿体基因组已被应用于植物的物种鉴定[6]、遗传多样性[7]、进化发育[8]等研究。

半边旗PterissemipinnataL.为凤尾蕨科凤尾蕨属多年生草本植物,在岭南地区分布较广,其全草入药,具有生肌止痛、凉血止血、清热解毒的功效,常被用于治疗跌打损伤、外伤出血、目赤肿痛以及痢疾、毒蛇咬伤等病症[9]。半边旗主要成分为萜类、黄酮及其苷类,其中一个贝壳杉烷型二萜类化合物5F(11α-羟基-15-氧-16-烯-贝壳杉烷-19酸)具有显著的抗肿瘤作用且无明显毒性[10-11]。目前半边旗的研究主要集中在植物化学以及5F 的药理药效方面,而半边旗基于叶绿体基因组的遗传多样性、系统进化等研究仍为空白。此外,半边旗与同属井栏边草P.multifidia、蜈蚣草P.vittata等植物形态较为相似,容易混淆[12],因此,以叶绿体基因组为手段进行半边旗的物种鉴定,对其临床用药安全也具有重要的意义。

本研究采用高通量测序技术获取半边旗的叶绿体基因组序列,从结构组成、密码子偏好性、简单重复序列等方面分析其叶绿体基因组特征,并将半边旗与近缘物种进行叶绿体基因组比较分析,探讨它们之间的系统发育关系,以期从基因组学层面为半边旗的物种鉴定、遗传多样性、进化发育等研究提供参考。

1 材料与方法

1.1 植物材料半边旗的新鲜植株采自广西壮族自治区钦州市浦北镇,经广东医科大学天然药物研究与开发重点实验室吴科锋研究员鉴定。取其生长旺盛、无病虫害的叶片,置于-80 ℃保存备用。

1.2 DNA 提取和测序使用Magbead Plant DNA Kit(北京康为世纪生物科技有限公司)提取基因组总DNA,经质检合格后,通过超声法随机打断,采用NexteraXT DNA Library Preparation Kit(美国因美纳公司)构建DNA文库,并运用NovaSeq 6000高通量测序平台(美国因美纳公司)进行双端测序,获得原始读序(raw read)。

1.3 叶绿体基因组组装和注释采用NGS QC Tool Kit软件包对获得的raw read进行质量评价,剔除低质量序列、构建文库时加上的接头序列以及存在不确定碱基的序列,以获得高质量读序(clean read)。以井栏边草P.multifidia的叶绿体基因组序列(Genbank 登记号:MZ848380)为参考,采用SPAdes 3.11.0 软件对clean read进行序列拼接,并使用PLANN软件对所得序列进行基因注释和归类。将拼接和注释完整的半边旗叶绿体基因组序列提交至Genbank,登记号为OL681881。运用OrganellarGenomeDraw(OGDRAW)软件进行半边旗叶绿体基因组的可视化并绘制其图谱。

1.4 叶绿体基因组结构分析采用Codon W v1.3软件统计同义密码子相对使用度(relative synonymous codon usage,RSCU),分析半边旗叶绿体基因组编码区(coding sequence,CDS)的密码子偏好性。若RSCU>1,表示该密码子使用频率相对较高;若RSCU<1,则表示此密码子使用频率相对较低。使用MISA v2.1 软件(https://webblast.ipk-gatersleben.de/misa/)分析简单重复序列(simple sequence repeat,SSR)类型和分布,SSR 基序的长度设置为1、2、3、4、5、6,对应的最小重复数依次为10、5、4、3、3、3。

1.5 叶绿体基因组比较分析采用IRscope软件(https://irscope.shinyapps.io/irapp/)进行半边旗与井栏边草Pterismultifida、蜈蚣草Pterisvittata、栗蕨Histiopteris incisa、尖叶卤蕨Acrostichumspeciosum的边界分析,比较它们的IR 收缩和扩张情况。采用基于Shuffle-LAGAN 模式的mVISTA 软件(http://genome.lbl.gov/vista/mvista/submit.shtm)进行上述5 种植物叶绿体基因组的多重比对,寻找它们的序列差异性。

1.6 进化发育分析将半边旗的叶绿体基因组序列与从Genbank数据库下载的9种植物的叶绿体基因组序列共同导入MAFFT v7.429 软件进行多重比对,并使用IQTREE 1.6.12软件进行系统进化树的构建,建树模式设置为最大似然法(Maximum likelihood,ML),自展值设置为1 000。

2 结果与分析

2.1 叶绿体基因组的基本特征如图1所示,半边旗叶绿体基因组呈现为典型的环状双链四分体结构,全长为162 270 bp,GC含量(即整个基因组序列中鸟嘌呤和胞嘧啶所占的比例)为42.3%,平均测序深度为462X。其中,LSC 长度为81 963 bp,SSC 长度为21 125 bp,两个反向重复区IRA 和IRB 的长度则均为29 591 bp。

图1 半边旗叶绿体基因组图谱Figure 1 Genome map of chloroplast genome from Pteris semipinnata L.

2.2 叶绿体基因注释和归类半边旗叶绿体基因组共注释到131 个基因,其中蛋白编码基因88 个,rRNA基因8 个,tRNA 基因35 个。其中rps16、trnG-UCC、atpF、rpoC1、trnL-UAA、trnV-UAC、petB、petD、rpl2、trnI-GAU、trnA-UGC、ndhA、rpl16、trnT-UGU基因各含有一个内含子,clpP、ycf3基因含有两个内含子,ndhB、rps12基因存在反式剪接情况。见表1。

表1 半边旗叶绿体基因的组成的归类Table 1 Classification of composition of chloroplast genome in P.semipinnata

2.3 密码子偏好性分析在半边旗叶绿体基因组的编码区中共检测到27 395 个密码子,除了89 个为终止密码子外,其余的密码子共编码20 种氨基酸。其中编码亮氨酸(Leu)的密码子最多,达2 897 个,而编码色氨酸(Trp)的密码子最少,仅447 个。所有密码子的RSCU 值如图2 所示,UUA 的RSCU 值最高,为1.63,是半边旗叶绿体基因子使用频率最高的密码子;而GGC 的RSCU 值最小,为0.6,是最不常用的密码子。RSCU值大于1的密码子共有31个,其中以A/U(T)结尾的有28 个,表明半边旗叶绿体基因组密码子偏好以A/U(T)碱基结尾。

图2 半边旗叶绿体基因组同义密码子使用情况Figure 2 Relative synonymous codon usage(RSCU)in chloroplast genome of P.semipinnata

2.4 SSR 分析如表2所示,半边旗叶绿体基因组中共检测到59个SSR,包括48个单核苷酸、7个二核苷酸、2 个三核苷酸和2 个四核苷酸基SSR,未检测到五、六核苷酸基序SSR。SSR 类型以A/T 居多,共35 个,而且大多数SSR以A或T碱基结尾。这些SSR主要分布在基因间隔区(45个,76.3%),其次是位于内含子(9 个,15.3%),分布在编码区的SSR 最少(5 个,8.5%)。

表2 半边旗叶绿体基因组SSR 统计Table 2 SSR statistics in chloroplast genome of P.semipinnata

2.5 IR 边界分析对半边旗及井栏边草Pteris multifida、蜈蚣草Pterisvittata、栗蕨Histiopteris incisa、尖叶卤蕨Acrostichumspeciosum叶绿体基因组进行边界分析,结果如图3 所示。5 种植物的JLB(LSC-IRB 边界)均位于基因间隔区,分别距离位于SSC中的trnI基因50、74、49、47和3 bp。半边旗与井栏边草、蜈蚣草、栗蕨的JSB(SSC-IRB 边界)均位于ndhF基因内,且位置偏差不超出5 bp,较为保守;而尖叶卤蕨的JSB与其他4种植物呈现较大的差异,ndhF基因在这个位置出现缺失。5种植物的JSA(SSC-IRA边界)相似度较大,均位于chlL基因内,除尖叶卤蕨外,位置偏差在5 bp以内。5种植物的JLA(LSC-IRA 边界)均位于基因间隔区,分别距离位于IRa中的ndhB基因391、1、374、377和476 bp。

图3 5 种植物的叶绿体基因组LSC/SSC 和IR 区域的边界分析Figure 3 Boundary analysis of LSC/SSC and IR regions in chloroplast genomes of five plants

2.6 序列差异性分析对半边旗等5种植物叶绿体基因组进行全序列比对,结果经可视化后如图4 所示。在5种植物叶绿体基因组中,LSC区的序列变异程度高于SSC 区,非编码区的序列变异明显大于编码区。5种植物中,同属的半边旗、蜈蚣草、井栏边草的序列相似度较高,而来自其他属的栗蕨和尖叶卤蕨的序列差异性较大;在凤尾蕨属的3种植物中,半边旗与井栏边草的序列相似度高于蜈蚣草,大多数基因的相似率在80%以上。

图4 5 种植物的叶绿体基因组序列变异分析Figure 4 Sequence variation in the chloroplast genomes of five plants

2.7 进化发育分析为理解半边旗的进化位置,将半边旗等10 种植物叶绿体基因组进行多重比对并构建系统进化树,结果如图5所示。半边旗与同属的井栏边草、蜈蚣草最先聚集在一起,说明它们的亲缘关系最近,与传统植物分类结果相符。

图5 基于叶绿体基因组序列构建的10 种植物系统进化树Figure 5 Phylogenetic tree of 10 plants based on chloroplast genome sequences

3 讨论

本研究完成了半边旗叶绿体基因组的测序、组装和注释,发现其具有植物叶绿体基因组典型的环状双链四分体结构,总长度162 270 bp,含有LSC、SSC以及位于它们之间的2个IR,且2个IR的序列相同、方向相反。半边旗叶绿体基因组共编码131个基因,按功能可分为自我复制相关基因、光合作用相关基因、其他基因以及未知基因4 类,与高良姜[13]、露兜树[14]等植物叶绿体基因组的基因构成一致。因此,半边旗叶绿体基因组符合植物叶绿体基因组的结构特点。

密码子偏好性可以在一定程度上反映基因的进化程度以及评估最优密码子和基因的表达水平[15]。本研究中,在半边旗叶绿体基因组的编码区共检测出27 395 个密码子,其中以编码亮氨酸的密码子最多,且密码子偏向使用A 或U(T)两种碱基,此结果也与高良姜[13]、露兜树[14]等研究中多种植物叶绿体基因组密码子偏好性相一致。

SSR具有高重复性、高突变率、共显性遗传等特点,是广泛应用于品种鉴定、遗传多样性、分子辅助育种等研究的一种分子标记[16]。本研究发现,半边旗叶绿体基因组共含有59 个SSR,其中单核苷酸重复基序占比例最大,达到81.4%(48/59),并且由A和T 碱基单独或组合形成的SSR 占比为71.2%(42/59)。结果表明,半边旗叶绿体基因组与绝大多数植物的叶绿体基因组一致,SSR 以单核苷酸重复基序为主,且以A 和T 碱基及其组合的重复基序为主要类型。SSR 分析可为后续基于叶绿体DNA 的半边旗分子标记开发提供数据。

叶绿体基因进化速率适中,是物种鉴定的常用DNA 条形码,如马新业等[17]曾采用叶绿体psbA-trnH间隔区在科的水平上有效地鉴别了79 种药用蕨类。本研究对半边旗以及同属植物井栏边草、蜈蚣草进行叶绿体基因组全序列比较,发现它们在matK、rbcL、rpoB、rpoC、psbA-trnH间隔区等区域均有明显的碱基差异,提示叶绿体基因可以实现半边旗与属内近缘物种的鉴别。后续实验可比对分析半边旗与近缘、易混物种的matK、rbcL、rpoB、rpoC、psbAtrnH间隔区等常用DNA 条形码序列,建立基于叶绿体DNA 序列的半边旗真伪鉴别体系,为半边旗的资源保护和临床用药安全提供依据。本研究也发现,凤尾蕨属3个物种叶绿体基因组的序列差异较大,而决明子属[18]、蒿属[19]等被子植物叶绿体基因组的属内变异水平不及凤尾蕨属明显,可能是由于蕨类植物起源远早于被子植物,进化时间更长[20]。叶绿体基因组在不同植物类群中的属内进化差异仍需进一步研究。

绿体基因组结构和基因组成虽然比较保守,但在进化过程中,IR 区经常发生收缩或扩张,造成植物不同类群出现叶绿体基因组长度的差异[21]。本研究发现,半边旗、蜈蚣草、井栏边草、栗蕨及尖叶卤蕨等5种植物的叶绿体基因组比较保守,但尖叶卤蕨与其他4种植物在边界收缩与扩张上的差异多一些,主要体现尖叶卤蕨在SSC-IRb 边界的ndhF基因缺失。系统进化树也表明,半边旗与同属植物聚成凤尾蕨科分支,再与卤蕨科栗蕨等物种聚成一个大分支,其他科植物也分别聚成相应的科分支,较好地反映了半边旗的进化地位。

本研究采用高通量测序和生物信息学方法,组装和注释蕨类中药半边旗的叶绿体基因组,并解析了其结构特点和系统进化关系,研究结果丰富了蕨类植物的基因组信息资料,也为半边旗的物种鉴定、遗传多样性和产品开发等可持续性利用研究奠定了坚实的基础。

猜你喜欢

井栏密码子叶绿体
论“牛盖井栏壶”的经典特征
密码子与反密码子的本质与拓展
漫谈紫砂壶《六方井栏》的文化意蕴
10种藏药材ccmFN基因片段密码子偏好性分析
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
浅谈紫砂《井栏壶》的创作
茶树CsActin1基因密码子偏性分析
《如意井栏壶》创作之我见
茶树叶绿体DNA的PCR-RFLP反应体系优化
烟草叶绿体密码子的偏好性及聚类分析