APP下载

透明草金鱼的皮肤转录组分析

2022-01-26刘肖莲李春艳白晓慧刘国山刘克明姜巨峰

水产科学 2022年1期
关键词:碱基测序通路

刘肖莲,李春艳,白晓慧,郝 爽,刘国山,刘克明,马 林,姜巨峰

( 天津市水产研究所,天津市观赏鱼技术工程中心,天津 300221 )

草金鱼(Carassiusauratus),又名红鲫或金鲫,是金鱼中最古老的一种,体形和尾鳍与普通鲫鱼相似,体色有红色、五花等。该品种抗病力和适应性强,耐低溶解氧,养殖难度低,投入成本小,回报率高,是发展都市农业、开发休闲渔业、保证渔民增收的理想养殖品种之一。草金鱼中有一类为透明草金鱼,因鸟粪素缺失,其头部、鳞片和身体均为透明,内脏和骨骼清晰可见。研究发现,鸟粪素并非真正的有色物质,而是与水结合成晶体形式的嘌呤,能将光线从表面反射出来,当鸟粪素缺失时,光线就能透过鱼体显示出内部的器官[1]。由于其身体透明,与普通草金鱼相比,透明草金鱼具有较高的观赏价值和经济价值。而目前关于草金鱼的研究主要集中在饲料添加剂对体色的影响[2]以及病害致病机理研究[3-4]等方面。在体色方面,Xu等[5]对透明鲫鱼和红草金鱼进行杂交和自交,通过观察不同组合子代的体色,发现透明性状对于不透明性状来说为显性,且透明性状为数量性状,推论金鱼体色的遗传机制是复杂的,需要进一步研究。

转录组是指在某一发育时期或特定条件下机体某组织所转录的全部RNA,包括信使RNA和非编码RNA。在没有基因组信息的情况下,转录组技术可作为对物种进行基因发掘、查找控制特异性状的关键基因和了解性状形成的分子机制的有效手段。史东杰等[6]通过对白色皮肤和红色皮肤的锦鲤(Cyprinuscarpiovar.koi)进行转录组分析,发现其差异表达基因富集在包括肌动蛋白细胞骨架调节/黏着斑通路在内的132个代谢途径。郝世鑫[7]采用转录组测序技术研究新西兰黑金鲍(Haliotisiris)软体独特的黑色性状,筛选出4个与黑色素合成代谢相关的基因。笔者对透明草金鱼与不透明草金鱼进行转录组测序,从转录组水平上研究透明草金鱼的分子形成机制,为进一步筛选草金鱼透明性状的目的基因及创制透明草金鱼新品种奠定基础。

1 材料与方法

1.1 材料

试验用草金鱼采自天津市马永红水产养殖合作社,于相同的饲养环境中随机选取透明草金鱼3尾、不透明草金鱼3尾,体长为(45.00±5.42) mm。将试验鱼麻醉,刮去鱼鳞后取皮肤组织,经液氮速冻后-80 ℃保存备用。

1.2 RNA提取、文库构建与测序

皮肤组织总RNA采用Trizol reagent试剂盒(Invitrogen)进行提取,采用琼脂糖凝胶电泳检测RNA是否降解,Nanodrop超微量紫外光分光光度计检测D(260 nm)/D(280 nm),Qubit检测RNA质量浓度,Agilent 2100 Bioanalyzer检测RNA分子完整数(RIN值)。按照TruSeq DNA Library Prep Kit (Illumina)说明书,通过cDNA合成,末端修复,连接接头和扩增纯化,得到草金鱼皮肤组织cDNA文库。建好的文库在Illumina HiSeq4000测序平台上进行测序(天津诺禾致源生物信息科技有限公司)。

1.3 序列拼接及功能注释

将测序所得的原始序列中的带接头的和低质量的序列去除,得到的序列称为过滤序列。由于已发表基因组缺乏完整的基因注释文件,故对得到的转录组序列进行无参分析。采用Trinity软件对过滤序列进行拼接,选择最长的转录本作为unigene。将所得的unigene与美国国立生物技术信息中心蛋白质序列数据库(Nr)、美国国立生物技术信息中心核酸序列数据库(Nt)、蛋白质家族数据库(Pfam)、同源蛋白簇数据库(KOG/COG)、蛋白质序列数据库(Swiss-prot)、京都基因与基因组百科全书数据库(KEGG)、基因本体论(GO)等数据库进行比对,以获得unigene的注释信息。

1.4 差异基因表达分析

采用软件Bowtie将每个样品的过滤序列比对到组装出来的转录本上,使用软件RSEM统计每个样品比对到每个基因上的read count数目,根据每百万fragments中来自某一基因每千碱基长度的fragments数目(FPKM)估算基因的表达水平。采用DESeq软件筛选差异表达基因,差异基因的筛选条件为:padj<0.05且log2|Fold Change|>1。通过Goseq行差异表达基因的GO富集分析,通过KOBAS进行KEGG通路显著性富集分析,找出差异表达基因参与的主要生化代谢途径和信号转导途径。

1.5 微卫星分析

采用MISA软件对获得的unigene进行微卫星序列的查找,其筛选标准设置为:单、二、三、四、五、六碱基重复的最少重复次数分别为10、6、5、5、5、5。

2 结果与分析

2.1 转录组测序与组装

采用Illumina HiSeq4000测序平台对透明草金鱼和不透明草金鱼(各3尾个体)进行转录组测序,测序产出数据质量评估情况见表1。6个样品分别得到52 630 100、54 113 970、41 297 798、42 691 754、59 027 442、59 603 014条过滤序列,各样品的GC含量为45.80%~47.59%,Q30碱基百分比在93.16%以上,表明测序数据质量可靠,可用于后续组装分析。对测序所得序列进行转录本拼接,共获得72 083个unigene,总核苷酸数为95 213 926,平均长度为1321 bp,N50为2264 nt。

表1 样品测序产出数据质量评估Tab.1 Quality assessment of sequencing data output

2.2 功能注释

将所得的unigene序列与Nr、Nt、Pfam等数据库进行比对,发现有38 516个基因注释到Nr数据库,占总数的53.43%(表2);69 547条序列注释到Nt数据库,占总数的96.48%;8545条序列在7个数据库中均得到注释,占总数的11.85%;70 032条序列至少在1个数据库中得到注释,占总数的97.15%。

表2 unigene注释成功率统计Tab.2 Statistical result of unigene annotation

2.3 差异表达分析

对透明草金鱼和不透明草金鱼2组样品进行差异表达分析,当基因在2组样品之间的表达量差异为2倍以上时,则认为该基因在样品间存在显著的表达差异,根据统计结果绘制基因表达差异火山图(图1)。由图1可见,透明草金鱼与不透明草金鱼共存在181条差异表达基因,其中上调基因66条,下调基因115条。

图1 样品组间基因差异表达分析火山图Fig.1 Volcano plot of differentially expressed genes between the two groups蓝色圆点表示无显著性差异的基因,红色圆点表示有显著性差异的上调基因,绿色圆点表示有显著性差异的下调基因.Blue dots represent non-differentially expressed genes, red dots represent significantly up-regulated genes, and green dots represent significantly down-regulated genes.

2.4 差异表达基因的富集

对差异基因进行GO功能注释(图2)。在生物学过程中,基因多富集在单有机体过程、刺激反应、生物过程调节等方面,也有基因富集在黑素体定位、色素沉着、色素颗粒运输等GO类别上;在细胞组成中,基因多富集在膜、色素颗粒、黑素体、肌动蛋白复合物等;在分子功能中,基因多富集在催化活性、肌动蛋白结合、水解酶活性等。

图2 样品组间差异表达基因GO功能注释Fig.2 Gene ontology annotation of differentially expressed genes between the two groups

将透明草金鱼和不透明草金鱼的差异表达基因比对到KEGG数据库中,进行代谢通路富集分析。选取富集最显著的20个通路条目绘制KEGG富集散点图(图3)。由图3可见,差异表达基因主要富集在MAPK信号通路、嘌呤代谢、Toll样受体信号通路、细胞紧密连接、甘油磷脂代谢等通路中。

图3 差异表达基因KEGG富集分析散点图Fig.3 KEGG pathway enrichment of differentially expressed genes

2.5 微卫星分析

从72 083个unigene中找到38 775个微卫星位点,占unigene总数的53.79%,微卫星位点的平均间距为2456 bp。其中复合型微卫星4565个,单碱基重复20 918个,二碱基重复9481个,三碱基重复3236个,四碱基重复491个,五碱基重复65个,六碱基重复19个。在单核苷酸重复类型中,数量最多的重复基元是A/T(23 720个),二碱基重复中出现次数最多的是AC/GT(7715个),三碱基重复中则以AAT/ATT出现次数最多(662个)。

3 讨 论

3.1 透明草金鱼转录组组装与注释分析

3.2 透明草金鱼差异表达基因功能分析

对透明草金鱼皮肤和不透明草金鱼皮肤的基因表达水平进行比较,发现181条差异表达基因,其中上调基因66条,下调基因115条。为了解差异基因的功能与代谢通路,对差异基因进行了GO功能分类与KEGG通路分析。差异基因主要富集在微管、微管结合、微管锚定、微管调控过程、蛋白质绑定、肌动蛋白结合、鸟嘌呤核苷酸结合、中间纤维、中间纤维细胞骨架、肌动蛋白复合物等条目,与虹彩细胞的细胞结构和功能相吻合。虹彩细胞的反射层由折射率不同的小板有序排列而成,反射小板的主要成分是鸟嘌呤,鸟嘌呤与水结合后形成鸟嘌呤晶体,可以折射一定长度的波长。而虹彩细胞中色素颗粒的定向运动与微管、肌动蛋白有关[14]。本试验结果与文献[15]的研究结果一致,其对锦鲤的红色皮肤和白色皮肤进行RNA转录组测序,发现差异表达基因大多富集在细胞骨架蛋白结合、肌纤维和糖原磷酸化酶活性等方面。本试验中,下调的差异表达基因Cluster-22359.15170与黑素体定位、细胞色素的沉着等功能有关,可作为候选基因对其功能进行深入研究。KEGG通路分析结果表明,差异基因多富集在MAPK通路、肌动蛋白细胞骨架调节通路、嘌呤代谢通路、内质网的蛋白质加工通路等,这些通路上的SAR1(GTP酶)、PAK(P21活化激酶)、ACTN(肌动蛋白)、CACN(电压依赖性钙通道)等基因在透明草金鱼皮肤中均表现为下调,说明这些基因可能与虹彩细胞中鸟嘌呤合成或色素颗粒转移过程有关。

对差异表达基因中差值较大的差异表达基因进行功能分析发现,透明草金鱼中上调倍数较高的差异表达基因主要富集在tRNA鸟嘌呤甲基转移酶活性、GTP酶活性、嘌呤核苷三磷酸结合、嘌呤核苷酸结合、鸟苷酸结合、7-甲基鸟苷RNA加帽等生物学过程,这些基因参与调节了鸟嘌呤的合成,导致透明草金鱼皮肤中虹彩细胞和鸟嘌呤的缺失,使其皮肤呈现透明性状,这与Bian等[9]的研究结果一致。与不透明草金鱼相比,透明草金鱼中下调程度较高的差异表达基因在蛋白质酪氨酸磷酸酶活性、酪氨酸代谢、微管结合、微管骨架组织、核糖核蛋白复合物的生物发生等GO条目,通常认为,酪氨酸酶代谢是影响脊椎动物黑色素生成的主要通路,而细胞内色素颗粒的运动与微管有关,这些基因在透明草金鱼中表达下调,说明它们参与了细胞内黑色素的合成和迁移。同时,下调程度较高的基因富集到MAPK信号通路、内质网的蛋白质加工、系统性红斑狼疮、抗原处理和呈递等通路,MAPK信号通路也是黑色素生成的主要通路之一,而酪氨酸酶基因家族蛋白一般通过内质网和高尔基体加工后转运到黑色小体中参与黑色素的合成,这与下调基因富集在糖核蛋白复合物的生物发生的生物学过程也是相吻合的。富集在系统性红斑狼疮、抗原处理和呈递等免疫相关通路的基因在透明草金鱼中显著下调,可能与黑色素细胞中的黑色素可作为物理屏障吸收和屏蔽紫外线,保护DNA免受紫外辐射损伤有关[16]。以上差异表达基因可作为草金鱼透明性状的候选基因,对其在不同时期皮肤组织中的表达模式以及功能研究有待进一步分析。

4 结 论

采用高通量测序技术对透明草金鱼与不透明草金鱼的皮肤组织进行转录组测序,共获得72 083个unigene,通过差异表达分析筛选出181个差异基因,对差异表达基因进行GO功能注释和KEGG通路分析,了解了差异基因有关的分子功能、生物学过程以及代谢通路,同时鉴定了38 775个微卫星位点。试验结果有利于进一步开展草金鱼透明性状的功能基因以及分子形成机制等研究。

猜你喜欢

碱基测序通路
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
变应性鼻炎中促炎信号通路与非促炎信号通路的研究进展*
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
生物测序走在前
基因“字母表”扩充后的生命
创建新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员