APP下载

常熟地区人群Y染色体STR和SNP遗传结构分析

2020-10-12

法医学杂志 2020年4期
关键词:家系人群个体

(1.复旦大学生命科学学院,上海 200438;2.常熟市公安局,江苏 常熟 215500)

常熟简称虞,因“土壤膏沃,岁无水旱之灾”得名“常熟”,位于江苏省南部,地处江南水乡,地势低平,水网交织,自古都是适宜聚居生息的沃土。明清时期,常熟农业和手工业商品经济发达,市镇数量飞速增长,促使人口流动变得更加频繁[1]。目前,常熟作为我国经济最发达的百强县之一,吸引了大量外来人口,外来人口与本地世居人口的融合,使得常熟地区人口结构复杂,而常用的法医学数据库单一,缺乏具有地域特色的高排查效率Y染色体库。目前基于YSTR单倍型建立的法医学数据库系统中,筛选了部分高突变STR遗传标记,在进行家系排查过程中会出现一定的假阳性[2]。因此,我们希望可以寻找到更具地域特征或家系特色的Y-SNP单倍群,将其与Y-STR单倍型数据结合,从而更精准高效地定位嫌疑人相关的男性家系。

本研究对常熟地区14个乡镇1 702名男性进行Y-STR分型、Y-SNP推断,并联系Y-STR单倍型和Y-SNP核心家系单倍群,进一步分析常熟地区家系特异性核心单倍群和区域特异性的遗传结构,为构建特定地区的Y染色体数据库提供一定的理论基础。

1 材料与方法

1.1 样本

采集常熟地区14个乡镇(碧溪街道、大义管理区、东南经济开发区、董滨镇、古里镇、海虞镇、梅李镇、莫城街道、沙家浜镇、尚湖镇、谢桥管理区、辛庄镇、虞山镇、支塘镇)1702名汉族男性无关个体的末梢血样本,保存于FTA采血卡。样本采集遵照知情同意原则。

1.2 DNA提取

采用复鉴蓝盾DNA提取纯化试剂盒(上海复鉴生物科技有限公司)对FTA卡进行血卡DNA的提取。

1.3 PCR扩增

按照YfilerTMPlus PCR扩增试剂盒(美国Applied Biosystems公司)说明书,对制备好的DNA模板在9700型PCR仪(美国Applied Biosystems公司)上进行扩增。反应体系为10μL,包含引物4μL、PCR预混液2μL、ddH2O 2μL、DNA模板(500pg/μL)2μL。PCR程序:95℃变性1 min;94℃ 4 s,61.5℃ 1 min,60℃22min,共28个循环;60℃延伸22min;4℃保存。

1.4 电泳与分型检测

高度去离子甲酰胺(highly deionized-formamide,HiDi) 970 μL+荧光分子内标(GeneScanTM600 LIZTMdye Size Standard v2.0)30μL配制HiDi-Liz混合液,分装时每孔加入10 μL预混液+1 μL PCR产物,在3500xL基因分析仪(美国Applied Biosystems公司)上进行毛细管电泳检测。使用GeneMapperTMID-Xv1.4软件分析遗传图谱。

1.5 数据分析

采用直接计数法计算各基因座的等位基因频率和单倍型频率。基因多样性(gene diversity,GD)和单倍型多样性(haplotype diversity,HD)计算公式[3]如下:

其中n为样本数,pi为等位基因频率。HD计算公式同公式(1),式中pi为单倍型频率。

采用本实验室开发的Y-Predictor软件,根据27个Y-STR数据推测各样本的Y-SNP单倍群。Y-Predictor软件是基于千人基因组计划Ⅲ期样本经二代测序得到的Y-SNP数据及其对应的Y-STR数据,通过计算待测样本的Y-STR单倍型与数据库中已有的Y-STR之间的遗传距离,能判别待测样本在系统发育树上的位置。

使用Network 5.0.1.1软件中的median-joining算法,利用Y-STR数据构建区域人群结构网络图。

1.6 Y-SNP实验验证

为了验证软件推测出的Y-SNP的准确度,随机选择94份样本(来自除东南经济开发区外的13个乡镇),使用扩增受阻突变系统聚合酶链反应(amplification refractory mutation system-polymerase chain reaction,ARMS-PCR)对其M96、JST021355、M231、M130、P186、M119、M122、M268、M176、M117、M7、M46、KL1、N1、P164、P201、P47、M9、M217、M45、M522、M201、M429、M170共24个SNP位点进行检验。反应体系为25 μL,包含引物5 μL、Master预混液 10 μL,ddH2O 10μL,血卡直径1.2mm。PCR程序:95℃变性5min;94℃ 20s,59℃ 40s,共28个循环;60℃延伸30min;4℃保存。

2 结 果

本研究对来自常熟地区14个乡镇的1 702名汉族男性无关个体样本进行检测,共发现1 556种单倍型,其中1 464种是单一个体特有的,其余92种为多人共用。经计算,该人群样本的HD为0.999 827。27个Y-STR基因座的等位基因频率如表1所示,除基因座DYS385a/b和DYF387S1a/b以外的23个单拷贝Y-STR基因座共检出等位基因229种,各基因座检出5~19个等位基因,频率分布0.0006~0.7966。多拷贝Y-STR基因座(DYS385a/b、DYF387S1a/b)的基因型频率范围分别为0.0006~0.3715、0.0006~0.3105。

表1 1702名常熟地区汉族人群27个Y-STR基因座的等位基因频率Tab.1 Allele frequencies of 27 Y-STR loci in 1702 Han population in Changshu (n=1702)

续表1Continued tab.1

本研究中27个Y-STR基因座的GD值如表2所示,所有基因座的GD值在0.409~0.933,其中GD值最高的基因座是DYS385(0.933),GD值最低的基因座是DYS438(0.409)。除基因座DYS438外,其余基因座的GD值均高于0.5,在常熟地区男性人群中体现出较高的多态性。

用Y-Predictor软件对获得的常熟地区1702名汉族男性人群27个Y-STR基因座的数据进行分析计算,推测其各自的Y-SNP单倍群,得到来自C、D、N、O、Q和R下游162种不同的单倍群,分布如表3所示。

表2 1702名常熟地区汉族人群27个Y-STR基因座的GD值Tab.2 GD value of 27 Y-STR loci in 1702 Han population in Changshu (n=1702)

表3 常熟地区14个乡镇汉族人群的Y-SNP单倍群分布Tab.3 Y-SNP haplogroup distribution of Han population in 14 townships in Changshu (例)

从表3可以看出,14个乡镇汉族男性人群中绝大多数个体来自O单倍群,占总人数的79.08%,与东亚人群的分布[4-6]基本符合。每个区域单倍群的分布基本相同,O单倍群的比例在70.21%(莫城街道)至97.14%(东南经济开发区);除碧溪街道中Oβ占最高比例(19.51%)外,其余13个镇区中均为O1占比最高。此外,Oα、Oβ和Oγ在各镇中也占有6.38%(莫城街道)至19.51%(碧溪街道),而C所占比例在2.86%(东南经济开发区)至18.02%(海虞镇),N的比例在1.01%(辛庄镇)至13.56%(董浜镇),在各镇中的占比有较明显的差异,而D、Q和R单倍群占比分别在0~8.51%。

为了验证Y-Predictor软件预测的准确性,随机挑选94个样本进行ARMS-PCR验证,得到15个单倍群(C、C2、D1a1a1、N、N1a1、O1a、O1b、O1b2、O2、O2a1、O2a2、O2a2a1a2、O2a2b、O2a2b1a1和 QR)的分型结果,其中90个样本与预测单倍型大支完全相同,预测正确率达95.74%。预测结果与验证结果一致的样本中,对O单倍群的预测准确率可达92.22%。另外4个样本的预测结果与验证结果不一致,其中3例的YSNP单倍群大支完全不同:A样本的预测结果为C1a1,实验结果为O1a;B样本的预测结果为C2b1,实验结果为O1b;C样本的预测结果为O1a1,实验结果为N1a1。另1个D样本的预测结果为D1a1a2b,实验结果为D1a1a1,属于在Y-SNP单倍群下游细分支上有所不同。总体来说,Y-Predictor软件的预测准确性较高,预测结果对实际应用有较高的参考价值。

本研究发现,在常熟地区,O1a1a1a1a*是最核心的单倍群,1 702名个体中有173个样本属于这个核心单倍群,具体分布如表4所示。进一步分析发现,常熟地区的O1a1a1a1a*单倍群由O1a1a1a1a*-F794和O1a1a1a1a*-F4149两个分支组成,因此,根据O1a1a1a1a*-F794和O1a1a1a1a*-F4149绘制常熟地区O1a1a1a1a*单倍群27个Y-STR的网络图(图1),由图可知,即使被划分到相同的细分支O1a1a1a1a*单倍群下,不同的SNP还是会呈现不同的聚簇。

表4 常熟地区O1a1a1a1a*单倍群的样本分布情况Tab.4 Sample distribution of O1a1a1a1a*haplogroup in Changshu (例)

图1 常熟地区O1a1a1a1a*单倍群27个Y-STR的网络图Fig.1 27 Y-STR network diagram of O1a1a1a1a*haplogroup in Changshu

3 讨 论

本研究获得了常熟地区14个乡镇1 702名汉族男性无关个体样本完整的27个Y-STR基因型。结果显示,除基因座DYS438外,其余基因座的GD值均高于0.5,表明这27个Y-STR基因座在常熟地区人群中有较高的多态性,具备良好的个体识别和亲权鉴定能力。本研究共发现1556种单倍型,其中1464种是单一个体特有的,HD值为0.999 827,可以认为这27个Y-STR基因座在常熟地区男性无关个体的鉴别中具有很高的应用价值。

Y-SNP由于突变率极低(约为1/3×10-8)[5]、几乎没有往复突变的特点而具有很强的群体特异性,是定位男性家系的特异性遗传标记[6]。由于人类走出非洲后形成了不同的迁徙路线[7],Y-SNP单倍群在地域上也有着鲜明的特异性分布。我国大部分地区汉族人群的单倍群分布与东亚地区基本保持一致,即人群中80%~90%都属于单倍群O[8-12]。

为提高Y-STR技术的群体溯源和家系排查能力,本研究基于Y-Predictor软件,引入了Y-SNP这一遗传标记对家系进一步细分,结果表明,C、D、N、O、Q和R等单倍群在各乡镇人群中均有分布但差异明显,其中以O单倍群为主,而D、Q和R单倍群则分布极少。从预测出的Y-SNP单倍群可以看出,常熟地区人群大部分已经可以被细分到O单倍群下很细的分支中,以我们找到的核心单倍群为例,即使处于相同的细分单倍群O1a1a1a1a*里,不同的SNP也会显示出不同的聚类,说明Y-SNP单倍群的精细划分对于人群结构的区分具有一定的参考价值,需要更进一步地挖掘Y-SNP单倍群与区域或家系的潜在关系。

本研究随机选取94个样本通过ARMS-PCR对预测的Y-SNP单倍群进行验证。验证结果显示,YPredictor软件的预测准确率达到95.74%,说明预测得到的Y-SNP数据具有较高的真实性,运用其分析的结果也有较高的参考意义。但目前通过ARMS-PCR所测得Y-SNP位点得到的单倍群分型还是属于比较粗的分支,应该倾向加入更多测定O单倍群下游细分分支的位点,进一步挖掘人群遗传信息,构建更精细、准确的人群结构分析模型。在后续的研究中,我们将筛选出具有典型区域特征的高分辨率SNP位点,对这些SNP的个体或家系的区分价值进行量化,从而构建具有地区特征的更有效的Y染色体数据库。

综上所述,本研究利用Y-STR与Y-SNP两种遗传标记的复合检测结果,对乡镇级别区域人群的遗传结构进行了初步分析,得到了区域核心单倍型。本研究方法和数据适用于法医学实践中的亲权鉴定和个体识别,为建设具有常熟地区特色的Y染色体数据库提供了一定的理论依据和数据支持。

猜你喜欢

家系人群个体
Ⅰ型肢根型点状软骨发育不良家系的遗传学分析
发育性癫痫性脑病75型家系的遗传学分析
红花香椿不同家系测定及优良家系选择
糖尿病早预防、早控制
关注个体防护装备
明确“因材施教” 促进个体发展
长白落叶松生长变异及优良家系选择研究
我走进人群
财富焦虑人群
How Cats See the World