APP下载

71个Y-SNP位点在西北汉族人群的多态性及法医学应用价值

2019-03-22张立男宋雨桐姜磊朱如心李莉

法医学杂志 2019年1期
关键词:华东信息量华南

张立男 ,宋雨桐 ,姜磊 ,朱如心 ,李莉

(1.司法鉴定科学研究院 上海市法医学重点实验室 上海市司法鉴定专业技术服务平台,上海 200063;2.华东政法大学,上海 200063)

单核苷酸多态性(single nucleotide polymorphism,SNP)是指在基因组水平上由单个核苷酸变异引起的DNA序列多态性,是人类可遗传变异中最常见的一种,占所有已知多态性的90%以上。SNP具有突变率低、可稳定遗传、部分位点与个体外观表现有关[1]、有利于降解检材分析[2]、便于高通量自动化分型检测等优点[3]。

Y染色体为男性特有的性染色体,除非发生突变,否则同一父系的男性后代均具有相同的单倍型,故可以用来揭示不同人群的起源、迁徙及亲缘关系等。Y染色体上SNP位点(Y-SNP)分型检测方法的建立,可以辅助现有的Y-STR检测体系,协助进行疑难案件的鉴定。本研究采用多重PCR联合基质辅助激光解吸/电离-飞行时间质谱(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF-MS)技术对西北汉族人群71个Y-SNP位点进行多态性调查,并结合前期研究所得,筛选同时适用于西北、华南和华东汉族群体的位点,旨在为法医学应用提供基础数据。

1 材料与方法

1.1 样本

在知情同意原则下,收集西北新疆地区汉族男性无关个体血样202份,每份样本取200μL。

1.2 主要试剂和仪器

DNA抽提试剂盒QIAamp DNA Blood Mini试剂盒(德国Qiagen公司),基因分型系统Complete iPLEX®Gold Genotyping Reagent Sets(96 Format,美国 Agena公司),9700型PCR仪(美国AB公司),MassARRAY®飞行时间质谱仪、MassARRAY®纳升点样仪RS1000(美国Agena公司),MassARRAY Typer 4.0软件(美国Agena公司)。

1.3 位点的选择、优化及引物设计

通过Y染色体系统树、Hapmap数据库[4]、美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)数据库[5]进行检索,结合《法医SNP分型与应用规范》(SF/Z JD0105003—2015)的要求,从Y染色体上筛选出在东亚人群中具有多态性的71个SNP位点,用Agena Bioscience公司的在线工具[6]设计用于PCR扩增的引物和单碱基延伸反应的引物。

依据各个位点之间的距离并避免引物之间的相互干扰,将71个位点分成W1、W2、W3复合体系(表1)进行检测,PCR扩增子的大小为80~120bp,单碱基延伸产物的相对分子质量为4429~8710。

表1 3个复合扩增体系所包含的Y-SNP位点

1.4 PCR扩增和产物纯化

用QIAamp DNA Blood Mini试剂盒进行DNA抽提。扩增体系为5 μL,含10×PCR缓冲液0.5 μL、25 mmol/L MgCl20.4 μL、PCR 引物混合液 0.5 μL、25mmol/L dNTP混合液0.1μL、5U/μL PCR酶0.1μL、纯水 1.4 μL、模板DNA 溶液 2 μL。PCR 循环参数:95℃ 2 min;95℃ 30 s,56℃ 30 s,72℃ 60 s,45个循环;72℃ 5 min。PCR扩增结束后,加入1.7 U/μL虾碱性磷酸酶(shrimp alkaline phosphatase,SAP)0.30 μL、SAP 缓冲液0.17 μL 和超纯水 1.53 μL,按下述条件进行酶切反应:37℃ 40min,85℃ 5min。

1.5 单碱基延伸反应

在纯化后的产物中加入10×iPLEX®缓冲液0.20μL、单碱基延伸引物混合液0.94μL、10×iPLEX®终止 混合物 0.20 μL、iPLEX®酶 0.04 μL、超纯水0.62μL,按下列条件进行单碱基延伸反应:94℃ 5s;52℃ 5s,80℃ 5s,5次小循环;40次大循环。

1.6 产物检测

按参考文献[7]中的方法对产物脱盐后,使用Mass-ARRAY®纳升点样仪RS1000将反应产物点样至芯片上(点样量控制在8~12nL),将点样完毕的芯片放入MassARRAY®飞行时间质谱仪进行质谱检测,用Mass-ARRAY Typer 4.0软件查看分型结果。

1.7 统计学分析

用直接计数法计算各Y-SNP位点在西北汉族无关男性人群中的等位基因频率,基因多样性(gene di-versity,GD)计算公式:

式中,n为样本数,fi为第i个等位基因的分布频率。单倍型多样性(haplotype diversity,HD)[8]计算公式:

式中,n为单倍型数,Pi为第i个单倍型的频率。用Arlequin v3.5软件[9]计算单倍型频率、Fst值和P值,并进行群体遗传学比较。Fst是种群分化和遗传距离的一种衡量方法,WRIGHT[10]建议:Fst为 0~0.05,群体间遗传分化可以不考虑;Fst为0.05~0.15,群体间存在中等程度的遗传分化;Fst为0.15~0.25,群体间遗传分化较大;Fst>0.25,则群体间有很大的遗传分化。

2 结 果

2.1 西北汉族群体Y-SNP位点多态性分析

经过实验和统计,得到西北地区汉族无关男性人群71个Y-SNP位点的等位基因频率数据和GD值,有67个位点在西北汉族人群中呈多态性分布,详见表2。

表2 西北汉族无关男性人群71个Y-SNP位点的等位基因频率和GD值 (n=202)

表2显示,在所选择的位点中除M148、rs2032645、rs9306841、SRY8299外,其余67个位点都具有多态性,GD值在0.0100(rs11575897和rs9341278)~0.5022(rs17276358)。中度信息量(0.2≤GD<0.3)的位点有22个(M117、M119、rs2032631、rs2032652、rs2032678、rs2075181、 rs35284970、 rs16980391、 rs16980396、rs3900、rs4589047、rs52812045、rs7067458、rs17174528、rs17250121、rs9306845、rs9306848、rs9785908、rs17276777、rs9786502、rs9786707、rs17842387),高度信息量(GD≥0.3)的位点有25个(M122、M134、rs2032674、rs11096432、rs2196155、rs13447361、rs2267801、rs16980363、rs3853054、rs16980426、rs16980601、rs16980610、rs16980641、rs16981290、rs917759、rs17269396、rs17269816、rs17269928、rs17286338、rs17276358、rs9786394、rs17316007、rs17316543、rs17316592、rs17323322)。

使用Arlequin v3.5统计软件分析71个Y-SNP位点的单倍型发现,本群体共有170种单倍型,其中频率最高的为0.034 8(7/202),频率最低的只有0.005 0(1/202)。经计算,HD为0.9930。

2.2 华东、华南和西北汉族群体比较

结合前期的实验结果[7,11],用 Arlequin v3.5 软件计算Fst值和P值,对华东、华南和西北汉族无关男性人群的等位基因分布进行比对分析(表3)。

表3 71个Y-SNP位点在华东、华南和西北汉族无关男性人群的等位基因分布差异

续表3

表3数据显示:华东与西北汉族无关男性群体之间有7个位点存在中等程度以上的分化,华东与华南之间只有4个位点存在中等程度以上的分化,西北与华南之间有15个位点存在中等程度以上的分化。

71个位点中,分别有11个位点在华东与西北汉族群体的差异具有统计学意义(P<0.05)、8个位点在华东与华南汉族群体的差异具有统计学意义(P<0.05)、36个位点在华南与西北汉族群体的差异具有统计学意义(P<0.05)。

2.3 筛选在三个地域汉族群体均具有应用价值的位点

结合本实验结果与前期研究取得的华南、华东汉族群体的遗传学数据[7,11],通过评价GD值,筛选出在西北、华南和华东群体具有较高信息量的Y-SNP位点。统计结果表明,在西北、华东和华南3个地域群体均具有应用价值的Y-SNP位点共有26个(表4)。

表4 在西北、华东和华南汉族群体中具有中、高度信息量的位点

续表4

3 讨 论

3.1 多态性分析

观察本实验结果,分析检测的71个Y-SNP位点在西北汉族无关男性人群的多态性及等位基因分布频率,可知有67个Y-SNP在西北汉族男性人群中呈多态性分布,GD值在0.010 0~0.502 2,中度信息量(0.2≤GD<0.3)的位点有22个,高度信息量(GD≥0.3)的位点有25个。本课题组前期研究结果[7,11]显示,华南和华东汉族人群中分别有66、67个位点存在遗传多样性,中度信息量的分别有18、31个,高度信息量的分别有13、18个,整合本研究结果可知,同时适用于西北、华南和华东群体的中高度信息量的位点有26个。他们在亲权鉴定和个体识别中具有一定的应用价值,可以作为STR、Y-STR检测的补充。

3.2 群体分布差异分析

经比较分析P值,发现华南和西北汉族群体之间的差异最大,华东与西北汉族群体之间的差异次之,华东与华南汉族群体之间的差异最小。分析比较Fst值发现,西北与华南之间分化的程度最高,华东与西北汉族无关男性群体之间分化程度居中,华东与华南之间分化程度最低。由此可见,Y染色体上SNP标记的等位基因分布具有一定的地域差异,用于法医学鉴定时,需要使用相应区域的群体遗传学数据。

3.3 法医学应用价值评估

目前,SNP在法医学中的研究主要有两个方面:(1)对SNP位点进行筛选,获得不同人群的分布频率,建立数据库,用于个体识别和亲权鉴定;(2)对SNP位点的功能进行分析,通过对现场遗留的生物检材的部分位点进行分型,提供嫌疑人的一些特征,如毛发颜色、眼睛颜色等[12]。

本研究对西北汉族男性无关个体的71个Y-SNP位点进行分析,共检测出170种单倍型,其中频率最高的为0.034 8(7/202),频率最低的只有0.005 0(1/202)。HD为0.993 0,得到了较大的群体遗传信息,可应用于涉及男性的个体识别和亲权鉴定的案例中。例如,在进行父系关系检验的时候,某些情况下仅仅凭借Y-STR分型的结果难以出具鉴定意见,不能因为几个STR的分型结果不同而否定父系关系[13],针对这种案例,对高信息量的Y-SNP位点进行分型检测可以视为一种补充鉴定的手段。

同时,本实验也比对了华南、华东地区汉族男性Y-SNP位点的分布特点,筛选出26个在西北、华南和华东汉族具有普适性的位点,这将有助于完善法医DNA检验手段。

猜你喜欢

华东信息量华南
华东销售在一线
相华东:走在欣欣向荣的田野上
华南风采
基于GIS和信息量法的四川峨眉山市地质灾害易发性定量评价
记华南女院前三任校长
华南掠影
苏萌娜 初心不渝 情牵华南
基于信息理论的交通信息量度量
如何增加地方电视台时政新闻的信息量
多丝量新品种华东×春晨的引进推广