APP下载

鸡IFITM3 基因编码区克隆及生物信息学分析

2022-10-12周泽宇张夕霏张传生耿立英李祥龙

中国畜牧杂志 2022年10期
关键词:多态性位点测序

张 贝,孟 婕,周泽宇,张夕霏,张传生,耿立英,李祥龙

(河北科技师范学院,河北省特色动物种质资源挖掘与创新重点实验室,河北秦皇岛 066004)

干扰素诱导跨膜(IFITM)蛋白家族是JAK-STAT抗病毒通路的重要免疫家族,在病毒的侵入阶段发挥着重要作用。家族主要存在5 个成员,其中和不受干扰素所诱导,而和都是受干扰素所诱导的免疫基因。家族成员对病毒抑制能力存在差异:对冠状病毒和丝状病毒的抑制效果更显著;而对流感病毒的抑制效果最为显著;和高度同源,但抗病毒效果没有显著。前人研究表明,禽类对禽流感病毒具有显著的抑制作用。

单核苷酸多态性(SNPs)是基因组中最为丰富的一种遗传变异类型,也是生物进化的一种原材料。研究发现,基因rs12252 位点的多态性与各类流感病毒的重症感染存在关联。Kim 等发现基因的rs4986790 位点多态性与人类免疫缺陷病毒的感染存在强关联,该位点为错义突变位点(nsSNPs)。进化是遗传多样性与物种多样性的基础,选择则是物种进化的主要动力,选择压力分析则是进化分析的重要组成部分。Saitou提出碱基的突变大多数是随机,然而部分位点在外界选择压力下,其突变存在一定的方向。因此,本研究对鸡基因SNP 多态性和nsSNP 功能性进行分析,并分析基因的选择压力;挖掘潜在免疫功能性位点,为地方鸡种的遗传资源开发和优良鸡种的选育提供理论基础。

1 材料与方法

1.1 实验材料 本研究选取3 个鸡种共90 只个体为实验材料,坝上长尾鸡(BS)30 只、北京油鸡(BY)30 只、来航鸡(LH)30 只,每个品种公母各半。BS 采自张家口市绿色田园禽业科技有限公司,BY 采自中国农业科学院北京畜牧兽医研究所北京油鸡资源保种场,LH 采自上海新杨家禽育种中心。进行翅静脉采血,采用酚-氯仿抽提法提取鸡基因组DNA,样品-20℃冰箱保存备用。

1.2 引物设计、PCR 扩增及测序 根据NCBI 数据库原鸡()基因(NC_052536.1)序列,对基因2 个外显子使用不同的体系分段PCR扩增。引物序列信息见表1,引物由北京诺赛基因有限公司合成。

表1 鸡IFITM3 基因引物信息

Exon1 的PCR 扩增反应体系为:TaKaRa(R044A)2×PrimeSTAR GC Buffer 12.5 μL,PrimeSTAR HS DNA Polymerase 0.25 μL,dNTP Mixture 2 μL,上、下游引物(10 pmol/μL)各1 μL,DNA 模 板(10 ng/μL)1 μL,ddHO 7.25 μL,共25 μL。反应条件:98℃变性10 s,60 ℃退火5 s,72 ℃延伸50 s,共30 个循环。Exon2的PCR 扩增反应体系为:2×Taq PCR Mix(CWBIOCW2849M)12.5 μL,上、下游引物(10 pmol/μL)各1 μL,DNA 模板(10 ng/μL)1 μL,ddHO 9.5 μL,共25 μL。反应程序为:94℃预变性5 min;94℃变性30 s,57℃退火30 s,72℃延伸1 min,共30 个循环;72℃延伸5 min;4℃保存。使用1.5%琼脂糖凝胶进行电泳检测,将与目的条带一致的样品分别送北京诺赛基因有限公司和北京华大基因有限公司进行Sanger 测序。

1.3 IFITM3 蛋白的生物信息学分析 利用多种在线网站及软件对IFITM3 蛋白序列的理化性质、信号肽、跨膜结构、磷酸化、棕榈酰化和高级结构等进行分析,相关信息见表2。

1.4基因的多态性分析 利用DNAMAN V6进行序列的比对拼接,获得鸡完整的编码区(Coding Sequences,CDS)序列。利用Chromas1.62和MEGA X 查看测序图谱,统计分析测序结果。利用Popgen32 分析基因中SNP 位点的遗传多态性,利用PIC_CALC 计算SNP 位点的多态信息含量(Polymorp hism Information Content,PIC)。

1.5基因nsSNP 的生物信息学分析 利用SIFT、PolyPhen-2、PROVEN 和SNAP 对nsSNPs 位点的有害性进行分析;利用I-MUTANT3.0 对nsSNPs位点蛋白的稳定性进行分析。同时利用ConSurf 对nsSNPs 位点的保守性进行预测分析。本研究使用trRosetta 对蛋白进行从头计算建模,构建蛋白的高级结构模型。利用Pymol2.5 展示蛋白高级结构模型,并对nsSNPs 突变位点的氢键变化进行分析。相关网址信息见表2。

表2 鸡IFITM3 基因生物信息学分析的相关网址

1.6基因的选择压力分析 利用EasyCodeML1.4对基因进行选择压力分析,可检测基因编码区的正选择位点。常用=Ka/Ks 值来判定位点是否受到了正选择压力,其中>1 表示位点受正选择压力,=1 表示位点受中性选择,<1 则受纯化选择(也称负选择)压力。EasyCodeML1.4 有多种模型计算方式,M1a 和M7 模型是被设置为序列只有保守位点和中性位点,即位点0<≤1;而M2a 和M8 模型增加了正选位点的计算,即值可大于1。从NCBI 数据库下载红原鸡(NM_001350061)、绿头鸭(KX811739)、鸿雁(KX594327.1)、朱鹮(XM_009463652)、褐背拟地鸦(XM_005529103)、加那利雀(XM_018907951)、阿德利企鹅(XM_009334087)和白喉带鹀(XM_00549 4829)的CDS 序列,和测序鸡种的序列整合成一个文档,进行禽类基因的选择压力分析。本研究将测序鸡种分为地方鸡种(BS 和BY)和商业鸡种(LH)2 个群体,利用LOSITAN 对2 个群体的编码区SNP 位点进行群体选择压力分析。

2 结果

2.1 鸡基因编码区的PCR 扩增及序列分析 分析发现鸡基因的2 个外显子序列的GC 含量存在差异,则使用不同的PCR 体系进行分段扩增。由图1 可知,扩增条带特异清晰,扩增片段与目标条带相符,可进行下一步实验。

图1 鸡IFITM3 基因编码区PCR 结果

2.2 鸡IFITM3 蛋白的生物信息学分析

2.2.1 鸡IFITM3 蛋白质理化性质分析 分析表明,鸡基因编码区大小为414 bp,共编码137 个氨基酸,其蛋白质的分子式为CHNOS,原子总数2 122,相对分子质量14 961.49,哺乳动物机体外的估计半衰期为30 h,其不稳定指数为 37.19,属于稳定蛋白;由20 种氨基酸组成,其中亮氨酸含量最高,为10.9%,色氨酸含量最低,为0.7%。该蛋白质理论等电点6.89,为偏酸性蛋白;脂溶系数为103.87,总平均亲水系数为0.302。利用ProtScale 对蛋白的疏水性进行分析;横坐标表示氨基酸位置,纵坐标表示疏水大小得分(Score),Score<0 表示亲水,Score >0 表示疏水。结果表明,亲水性得分最高为肽链的128Q(-2.522),疏水性得分最高为109I(3.933);肽链上的疏水性氨基酸多于亲水性氨基酸,该蛋白质为疏水性蛋白(图2A)。

2.2.2 IFITM3 蛋白高级结构预测分析 由图2B 可知,氨基酸二级结构由-螺旋(41.61%),无规则卷曲(37.23%),延伸链(13.87%),转角(7.30%)所构成,可见此蛋白质主要由-螺旋和无规则卷曲构成。且鸡IFITM3 蛋白的三级结构预测结果与二级结构分析结果相一致(图3)。使用InterPro 分析发现:蛋白质的功能域为CD255,位于41~108 氨基酸区间。分析可知,V103I位点在突变前后,其氢键的连接种类和数目未发生改变(图3)。H126P 位点在突变后失去了4 个氢键,即该位点变异前和4 个氨基酸(123I、122N、129Q、130H)发生4 个氢键连接;突变后无氢键连接,只和相邻氨基酸发生肽键连接。进一步分析发现V103I 位点位于跨膜螺旋区(TMhelix2),H126P 位于膜外区(图2C)。

图3 鸡 IFITM3 基因nsSNPs 氢键变化结果

2.2.3 IFITM3 蛋白信号肽、跨膜区及修饰位点的预测分析 鸡IFITM3 蛋白的信号肽预测表明,Singal Peptide预测值为0.002,Other 预测值为0.998;即该蛋白质不具有信号肽,属于非分泌型蛋白。跨膜区域预测结果显示,该蛋白存在2 个跨膜区域:TMhelix1 区域为46~68,TMhelix2 区域为101~123;即 鸡IFITM3 蛋 白为跨膜蛋白(图2C)。磷酸化位点预测结果显示,该蛋白具有6 个丝氨酸(7、29、49、69、86 和89)、5 个苏氨酸(30、36、52、53 和90)、3 个酪氨酸(55、81和93)的磷酸化位点。糖基化位点预测结果表明,只预测到1 个N 型糖基化修饰位点(95)和4 个O 型糖基化修饰位点(7、29、30 和33)。棕榈酰化位点预测结果显示,该蛋白具有2 个棕榈酰化位点(59 和60)。

图2 鸡 IFITM3 蛋白分析结果

2.3基因多态性分析

2.3.1基因SNP 位点的筛查 由图4 可知,鸡基因存在5 个SNP 位点:SNP1(g.330G>T)、SNP2(g.867T>G)、SNP3(g.893T>C)、SNP4(g.991A>G)和SNP5(g.1177C>A)(以外显子1 的起始位点为+1)。检测到的SNP 位点数目较少,其中SNP3 为可变剪切位点,SNP4 为错义突变位点。

图4 鸡 IFITM3 基因SNP 突变位点

2.3.2基因SNP 的多态性分析 由表3 和表4可知,SNP1 在原鸡为T,在测序的鸡种中都为G,基因型皆为GG。这表明在测序鸡种群体中其位点已固定,不具有多态性。SNP3 属于可变剪切位点,优势基因C,主要基因型为CC。然而,依据Ensemble 数据库的红原鸡基因信息(ENSGALG00000026970)分析发现,鸡基因不存在多个转录本。这表明SNP3 突变不影响蛋白的正常剪切,该位点极可能是中性突变。SNP4 为错义突变(V103I),其优势基因A,主要的基因型为AA。多态性分析发现,SNP2 在3 个鸡种的PIC 值都小于0.25,为低度多态性;SNP3 只在BS 群体中PIC 值为0.255,具有中度多态性;其他群体为低度多态性。SNP4 在BY 和LH 群体的PIC 值大于0.25,具有中度多态性。SNP5 在3 个群体的PIC 值都大于0.25,都具有中度多态性。并且PIC 值的结果与观测杂合度和期望杂合度的分析相符合,即SNP3、SNP4、SNP5 位点的遗传丰度较高。

表3 鸡 IFITM3 基因的SNP 等位基因频率信息

表4 鸡 IFITM3 基因SNP 位点多态性信息

2.4基因nsSNPs 的生物信息学分析

2.4.1 nsSNPs 的功能性预测结果 由图5 可知,此次测序发现的nsSNPs 只有SNP4。将测序结果与Ensemble数据库比对发现,基因还存在一个nsSNPs 未检测到,则将其补充为SNP6(g.1061C>A)。由表5 可知,V103I 位点被5 种软件预测为中性/良性;而H126P 除被SNAP 软件预测有影响,其余4 种也预测为中性/良性。功能性预测分析只是nsSNPs 预测分析的一类方式,要充分研究nsSNPs 突变对蛋白的影响还需更深入分析。

表5 鸡IFITM3 基因nsSNPs 有害性结果

2.4.2 基因nsSNPs 的保守性分析 利用ConSurf 预测IFITM3 蛋白的进化保守位点,对2 个nsSNPs 位点进行分析,结果可见图5。得分7~9 分才被认为是保守性位点,其余得分为非保守性位点。V103I 和H126P 位点的保守性得分皆低于6,属于非保守位点。

图5 鸡 IFITM3 的nsSNPs 保守性结果

2.5基因的选择压力分析

2.5.1 禽类正选择位点检测 由表6 可知,M7vs.M8 比对模型值小于0.05,检测到具有显著性的正选择位点。分析发现,正选择位点只有120V,其定位参照红原鸡IFITM3 蛋白序列。生物信息学分析发现,该位点为可变位点,位于蛋白质的跨膜螺旋(TMhelix2)中,其抗病毒的重要程度可能更高。

表6 禽类IFITM3 基因正选择分析结果

2.5.2 鸡基因SNP 的群体选择压力分析 商业鸡种过于关注鸡肉生长速度和产蛋等商业性状,自身的免疫能力存在不足;地方鸡种通常存在比较丰富的SNP变异,其遗传的多样性能提升机体抗病原的能力。免疫基因的SNP 位点很可能在2 种类型的群体中存在分化,即对测序3 个鸡种分类为地方鸡种和商业鸡种。由图6 可知,本研究测序发现的基因5 个SNP位点,除SNP1 位点已经固定,其余4 个SNP 位点都被预测为中性突变。这表明鸡IFITM3 蛋白序列在种内的进化十分保守。

图6 鸡 IFITM3 基因SNPs 的群体选择压力结果

3 讨 论

基因家族是一类具有广谱性抗病毒功能的免疫分子,在调控机体免疫、炎症效应及抗增殖等过程中发挥着重要作用。其中,是家族的重要免疫成员之一,在禽类的抗病毒通路中发挥着显著作用。潘阳等发现的rs12252 位点CC 基因型与新冠肺炎重症感染存在强关联;这与Kim 等发现的结果相印证。近些年,基因的SNP 多态性的研究逐渐热门,主要集中在哺乳动物特别是人类中,在禽类物种的研究相对较少。

本研究得到了鸡基因的CDS 区为414 bp,共编码137 个氨基酸。分析发现,该蛋白具有的CD225结构域和2 个TMhelix 区域都与先前研究相印证,表明鸡IFITM3 蛋白具有较高的保守性。Yount 等发现人IFITM3 蛋白半胱氨酸位点的棕榈酰化能增强蛋白与脂膜的亲和力,提高蛋白的抗病毒活性。本研究预测发现2 个棕榈酰化位点,推测该位点可能影响蛋白的抗病毒功能。本研究对鸡IFTM3 的nsSNPs 位点进行生物信息学分析,发现V103I 预测为中性的非保守位点,且突变前后氢键数目和种类无改变;这说明此位点的突变对蛋白结构的影响较低。H126P 位点位于胞外区属于非保守性位点,被SNAP 软件预测为有害性;且其突变导致该位点失去4 个氢键。丁吉勇研究发现p53蛋白的Y220C 突变会导致分子内氢键数目减少,降低Y220C 簇的稳定性,破坏蛋白原有的Beta-折叠结构。这暗示着H126P 位点的突变极有可能减弱该位点分子间的作用力,降低蛋白质空间结构的稳定性。有趣的是,126 位点在测序3 个鸡种群体中都为突变前的组氨酸,这可能是优势基因型的累积效应造成的结果。

禽类的选择压力分析中,只检测到120V 正选择位点,位于跨膜螺旋区;测序鸡种内的选择压力分析中,位点都位于中性进化压力下。这表明的编码区序列相当保守,受到强烈的负选择压力;也有可能是本研究选择的鸡种和序列样本量不够丰富,导致正选位点被淹没在常见的负选择和中性选择位点中,但具体机制有待于进一步探索。

4 结 论

本研究发现鸡的nsSNPs 和正选择位点数量较少,序列在种间/种内的进化水平都十分保守,蛋白受到强烈的负选择压力。本研究可为地方鸡种遗传资源的开发提供理论基础,分析发现H126P 位点可作为优良鸡种免疫分子选育的标记位点。

猜你喜欢

多态性位点测序
多环境下玉米保绿相关性状遗传位点的挖掘
PSORA:一种基于高通量测序的T-DNA插入位点分析方法
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
APOE基因多态性与老年动脉粥样硬化性脑梗死严重程度及预后相关性分析
生物测序走在前
相信科学!DNA追凶是如何实现的?
基因测序技术研究进展
一种改进的多聚腺苷酸化位点提取方法
基因多态性与老年高血压的研究进展