APP下载

文蛤转录组中微卫星位点生物信息分析

2021-05-12陈爱华吴杨平陈素华张志东李秋洁

海洋渔业 2021年2期
关键词:文蛤基元微卫星

田 镇,陈爱华,吴杨平,陈素华,张 雨,曹 奕,张志东,李秋洁

(1.上海海洋大学水产科学国家级实验教学示范中心,上海201306;2.江苏省海洋水产研究所,南通 226007)

文蛤(Meretrix meretrix)隶属帘蛤目(Veneroida),帘蛤科(Veneridae),是一种广温、广盐性滩涂埋栖型经济贝类,为我国主要养殖贝类和出口水产品之一[1]。近年来,有关文蛤生物学特性以及基因资源挖掘等多方面研究越来越多,极大地促进了文蛤养殖业持续健康发展[2]。目前,关于文蛤生理胁迫[3-5]、呼吸代谢[6]、过氧化氢酶分析[7]、遗传多样性[8-9]等方面的研究已有众多报道,但在转录组水平SSR微卫星特征生物信息学分析方面的研究鲜有报道。

微卫星(microsatellites),也称简单重复序列(simple sequence repeat,SSR),为1~6个核苷酸组成的短串联重复序列[10],具有高稳定性、特异性和共显性等优点,多应用于水产生物遗传多样性分析和分子标记育种等领域[11]。随着高通量测序技术发展,通过转录组、基因组等测序平台大量快速测定DNA分子序列技术,利用生物信息学分析开发出数量庞大的SSR标记,已在多种水产动物中得到广泛应用[12]。

本研究采用第二代高通量测序技术对文蛤进行转录测序(RNA-sequencing,RNA-Seq),通过对文蛤转录组中不同类型微卫星的统计与分析,了解其微卫星分布频率和数量,从转录组水平阐明文蛤SSR组成特征,对进一步利用微卫星标记技术开展遗传标记辅助育种和种群遗传学研究具有重要的参考价值。

1 材料与方法

1.1 动物材料

实验用文蛤于2017年3月取自江苏省文蛤良种场(南通),随机挑选外形完整、无损伤的广西和江苏原种个体各30粒。取其鳃、肝胰腺组织样品浸没在RNAlater溶液(天根,中国)中,并于-80℃储存。

1.2 数据来源

提取文蛤鳃、肝胰脏组织样本的总RNA,送生工生物工程(上海)股份有限公司采用PacBio SMRT测序技术和Illumina RNA-Seq技术进行转录组测序,通过整合PacBio SMRT和Illumina测序数据,生成高质量的文蛤转录组数据,以此作为分析数据。

1.3 SSR位点搜索

用Krait10.2软件[13]对文蛤转录组中的SSR位点进行搜索和统计。搜索参数为:单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸、六核苷酸,最少重复次数分别为12、7、5、4、4、4。SSR分布的平均距离=总Unigene长度/搜索到的SSR数量,出现频率=搜索到的SSR数量/总Unigene数量[14]。用Perl语言操作系统下MISA软件进行检验。

2 结果与分析

2.1 文蛤转录组中SSR的数量

文蛤的转录组中共检索到98 598条编码序列(coding sequence,CDS),总长110 964 842 bp,GC含量约为36.17%。通过对文蛤进行SSR位点搜索,共发现完整的SSR位点8 856个,SSR总长度为162 416 bp,平均长度18.34 bp,约占总序列长度的0.15%。SSR详细信息见表1。

2.2 微卫星序列的重复碱基类型分析

文蛤SSR位点碱基重复数量统计见表2。单碱基重复序列在文蛤转录组中所占比例最高(33.89%),其次为三、四碱基重复序列占比(分别为25.45%、24.84%),二、五碱基重复序列占比再次之(分别为11.88%、3.79%),六碱基重复序列占比最低(0.15%)。每种重复碱基类型的分布密度情况为:四碱基>三碱基>单碱基>二碱基>五碱基>六碱基;SSR发生频率大小依次为:单碱基>三碱基>四碱基>二碱基>五碱基>六碱基。

表1 文蛤转录组中SSR位点搜索结果Tab.1 Search results of SSR in RNA-sequencing of Meretrix meretrix

表2 文蛤微卫星SSR位点类型Tab.2 SSR types of Meretrix meretrix

本次检索的8 856个SSR位点中共包含26种重复碱基元(表3)。单、二、三、四、五、六碱基重复分别有2、4、5、5、5、5种。在单碱基重复中,A/T重复基元所占比例最大(31.72%);二碱基重复基元(AT/TA)、三碱基重复基元(AAC/TTG)和四碱基重复基元(AAAC/TTTG)占比相近(分别为6.33%、10.24%、6.64%);五碱基重复基元(AAAAC/TTTTG)和六碱基重复基元(AATACC/TTATGG和AATCCC/TTAGGG)占比最少(分别为0.25%、0.02%、0.02%)。这表明在文蛤转录组中微卫星位点的分布对A/T具有偏好性。

2.3 微卫星序列数量及长度分布

SSR重复类型的重复数存在较大差异(图1)。SSR位点数量随着重复次数的增加而呈明显减少的趋势,四碱基、五碱基、六碱基重复随着重复次数超过4、4、5次时数量呈平滑曲线减少;单碱基重复、二碱基重复和三碱基重复随着重复次数增加到11、6、4次后,SSR位点数量开始呈线性升高,重复次数超过5、7、12次,平缓下降,直至为0。二碱基重复、三碱基重复、四碱基重复、五碱基重复和六碱基重复的重复次数大多分布在4~11,仅单碱基重复的重复次数为11~19。

文蛤转录组中所发现的8 856个完整型微卫星位点中,微卫星的长度差异不大,片段长度范围为10~35 bp,平均长度18.34 bp(图2)。其单碱基、三碱基、四碱基重复片段长度分别为12 bp、15 bp、16 bp时SSR位点数量最高(分别为1 219条、1 193条、1 225条)约占完整微卫星总数的41%。除单碱基重复随着重复片段长度的增加,位点数量呈平滑曲线下降。其他碱基重复分布特点呈“波浪形”分布并逐渐下降。

表3 文蛤转录组SSR中优势重复碱基组成和频率统计Tab.3 Composition and frequency of dom inant repeatmotifs in the RNA-sequencing of Meretrix meretrix(in consideration of sequence com plementarity)

图1 文蛤转录组中每种类型SSR数量随重复次数分布Fig.1 Variation of repeat times w ith the number ofm icrosatellites in the RNA-sequencing of Meretrix meretrix

图2 文蛤转录组中微卫星的长度分布Fig.2 Length distribution ofm icrosatellites in the RNA-sequencing of Meretrix meretrix

3 讨论

本研究共获得8 856个完整性SSR位点,SSR的发生频率为8.98%,平均分布长度为18.34 bp。文蛤SSR发生频率与栉江珧(Atrina pectinata)(8.2%)[15]、墨西哥湾扇贝(Argopecteni rradiansconcentricus)(10%)[16]、缢蛏(Sinonovaculaconstricta)(8.89%)[17]相似,但比泥蚶(Tegillarcagranosa)(14.83%)[18]、马氏珠母贝(Pinctadamartensii)(13.34%)[19]略低,说明文蛤SSR位点分布丰度处于较低的水平。这也可能与数据库的大小、SSR位点的搜索标准以及物种间的分布特征有关[20]。

基于转录组水平搜索的文蛤微卫星重复类型中,单碱基重复类型的占比最高为33.89%,其次为三碱基、四碱基重复类型(分别占25.49%、24.84%),这与通过EST-SSR方法开发出的文蛤[21]、马 氏 珠 母 贝[19]、菲 律 宾 蛤 仔(Ruditapes philippinarum)[22]、罗 氏 沼 虾(Macrobrachium rosenbergii)[23]、斑鳢(Channamaculata)[24]和扁玉螺(Neveritadidyma)[25]SSR位点中呈现出单碱基重复数量最多,二碱基重复、三碱基重复和四碱基重复数量依次递减的趋势相似;但与栉孔扇贝(Chlamysfarreri)[26]、三 角 帆 蚌(Hyriopsis cumingii)[27]、黑鲷(Acanthopagrusschlegelii)和真鲷(Pagrusmajor)[28]SSR三碱基重复类型数量最多有所不同。不同物种间的碱基重复类型不同,研究认为高等水生动物以低重复基元居多,而低等水生动物以高重复基元居多,但文蛤作为低等贝类动物以单碱基重复和三、四碱基重复类型的比例高,可能暗示该科贝类具有更高的进化水平、更长的进化时间或更高的突变频率[14]。目前大部分的SSR标记采用的是二碱基重复SSR,扩增出的产物常会出现影子带,对于结果分析存在一定的干扰性。而四碱基重复SSR相比二碱基重复SSR标记不但多态性更高,而且遗传稳定性更好[29-30]。根据文蛤SSR特征,可以尝试开发三碱基、四碱基重复的SSR标记,为今后开展文蛤等贝类种群遗传多样性分析等研究提供新的思路。

通过单碱基、三碱基和四碱基3种重复类型中各重复单元比较发现,在各重复长度中,A/T较G/C含量高出很多,这与很多水产生物基因组SSR具有的特点相一致,如金乌贼(Sepia esculenta)[31]、中 国 明 对 虾(Fenneropenaeus chinensis)[32]、三 疣 梭 子 蟹(Portunustri tuberculatus)[33]SSR。水生生物中微卫星富含A/T的原因可能是由于DNA复制滑动机制和重组机制,导致A/T重复类型的机率更高[34]。也有研究认为,由于基因组DNA中的CpG的甲基化使之突变,甲基化的胞苷酸C易通过脱氨基作用变为胸腺嘧啶T,而少量的GC又是维持DNA热力学稳定性所必需的,故突变的A/T类型相应增加[35]。

SSR分子标记多态性的高低决定其潜在利用价值,其多态性取决于其SSR片段长度大小[36]:当长度小于12 bp时,呈低多态性;片段长度为12~20 bp时,呈中度多态性;长度大于20 bp时,呈高多态性[37]。从SSR片段长度来看,本次基于转录组开发的文蛤微卫星中71.22%的长度处于12~20 bp之间,属于中度多样性。这对后续微卫星分子标记开发有一定的利用价值。

4 小结

本研究利用生物信息学软件分析比较了文蛤转录组中微卫星序列的分布特征,结果显示:文蛤具有以单碱基为主、三四碱基重复次之的微卫星序列;文蛤转录组SSR共包含26种重复基元,其中优势基元为单碱基重复A/T有2 809个,其次为三碱基重复AAC/TTG有907个,四碱基和二碱基重复中的AAAC/TTTG、AT/TA分别有588、561个,说明文蛤转录组微卫星位点的分布对A/T具有偏好性。本研究结果将为研究文蛤SSR标记开发、群体遗传多样性、遗传连锁图谱、种质资源鉴定和分子遗传育种等后续研究提供基础数据。

猜你喜欢

文蛤基元微卫星
绿鳍马面鲀全基因组微卫星分布特征
面向异构履带车辆的统一运动规划方法
斑点叉尾全基因组微卫星分布特征分析*
基于转录组西施舌微卫星标记开发及隐种鉴定
巨魾(Bagarius yarrelli)全基因组微卫星分布特征分析
基于多重示范的智能车辆运动基元表征与序列生成
有级转向履带车辆的驾驶员操控行为模型
文蛤蒸蛋
如东文蛤 天下至鲜
人体细胞内存在全新DNA结构