APP下载

47个常染色体InDel位点在中国5个民族中的遗传多态性及法医学应用

2020-10-12

法医学杂志 2020年4期
关键词:仫佬族京族等位基因

(1.中山大学中山医学院法医学系,广东 广州 510080;2.广州市越秀区公安司法鉴定中心,广东 广州510080;3.广州市刑事科学技术研究所,广东 广州 510030;4.中德美联生物技术有限公司,江苏 无锡214174;5.南方医科大学法医学院,广东 广州 510515)

STR是目前法医学个体识别和亲子鉴定中最常用的多态性遗传标记,具有高灵敏度和快速检测的优势[1-2]。然而,随着STR的广泛应用,逐渐体现出其局限性:突变率相对较高[3],在亲子鉴定中可能导致误判;扩增子相对较长,限制了其在高度降解检材中的应用[4];在人类基因组的数量有限,限制了其在复杂遗传关系鉴定中的应用。相比之下,单核苷酸多态性(single nucleotide polymorphism,SNP)和插入/缺失(insertion/deletion,InDel)可以弥补这些局限性,其突变率低、扩增片段短、数量庞大且分布广泛,故而在法医学研究中受到越来越多的关注[5]。而相比SNP,InDel可以采用目前法医DNA鉴定领域常用的多重PCR复合扩增联合毛细管电泳分型技术进行检测,相对快速和经济,因而更受关注[6-7]。

目前,已有研究针对不同人群设计了多重InDel扩增体系并评估其法医学应用,结果表明具有良好的法医学应用价值[7-10]。其中,最常见的是德国Qiagen公司的商业试剂盒Investigator DIPplex,包含30个常染色体InDel位点和Amelogenin性别位点。已有多个研究验证了该试剂盒在欧洲人群的法医学应用效能[11-18],然而,在包括中国在内的几个亚洲人群中,由于数个InDel的多态性较低使其在亚洲人群的应用受到限制[19-24]。因此,LI等[25]根据中国汉族人群的等位基因频率设计了一个包含29个InDel位点的多重PCR复合扩增体系,验证发现该扩增体系在中国人群的累积个体识别率(cumulative discrimination power,CDP)为0.999999999990867,非父排除率为0.9930,可用于个体识别或亲子鉴定。

考虑到纳入更多InDel位点可提高法医学应用效能,我们在前期研究中基于中国北京汉族人群的等位基因频率构建了AGCU InDel 50试剂盒,其包含47个常染色体InDel位点、2个Y-InDel位点和Amelogenin性别位点[26]。本研究拟应用该试剂盒对中国广东汉族、广西壮族、广西瑶族、广西京族和广西仫佬族5个民族共768名无关个体进行遗传多态性调查,并评估该试剂盒的法医学应用效能,为其在个体识别和亲权鉴定中的应用提供基础数据。

1 材料与方法

1.1 样本收集和DNA提取

所有参与实验者均经知情同意后自愿参加。采集768名无关个体外周血样,包括广东汉族163例、广西壮族162例、广西瑶族128例、广西京族155例、广西仫佬族160例。采用5%Chelex-100快速提取法提取基因组DNA[27]。

本实验符合《世界医学协会赫尔辛基宣言》,并获得中山大学伦理委员会批准。

1.2 PCR扩增

采用AGCU InDel 50试剂盒(无锡中德美联生物技术有限公司)在ProFlexTMPCR扩增仪(美国Applied Biosystems公司)上进行复合扩增,方法同文献[26]。

1.3 毛细管电泳和数据分析

在3500xL基因分析仪(美国Applied Biosystems公司)上使用6 Dye Matrix标准品(无锡中德美联生物技术有限公司)进行光谱校正,使用36 cm毛细管和POP-4®分离胶(美国Applied Biosystems公司)检测扩增产物。

将扩增产物以离心半径7.3cm,3000r/min,离心5 min 后 ,取 1 μL 扩增产物 与 0.5 μL AGCU Marker SIZ-500(无锡中德美联生物技术有限公司)和12μL Hi-DiTMFormamide(美国Applied Biosystems公司)混合,95℃变性3min后立即冰浴3min,然后电泳检测。

用GeneMapper®ID-Xv1.4软件(美国Applied Biosystems公司)对电泳原始数据进行分析。InDel位点中的插入(insertion)等位基因和缺失(deletion)等位基因分别命名为I和D,Amelogenin基因座的两个等位基因分别为X和Y。

1.4 质量控制

每批实验样本检测均采用标准品9948(0.5ng/μL,美国Promega公司)和超纯水分别作为扩增的阳性对照和阴性对照。

1.5 统计分析

运用PowerStats v12软件(美国Promega公司)统计分析47个常染色体InDel位点的等位基因频率、个体识别率(discrimination power,DP)、三联体非父排除率(probability of exclusion of trios-testing,PEtrio)、多态信息含量(polymorphic information content,PIC)和典型亲权指数(typical paternity index,TPI)等群体遗传学参数。

采用GENEPOP v4.2软件(http://genepop.curtin.edu.au/)检验Hardy-Weinberg平衡。用SNPAnalyzer 2.0软件[28]分析连锁不平衡。

观察杂合度(observed heterozygosity,Ho)、期望杂合度(expected heterozygosity,He)及群体间遗传差异使用Arlequin v3.5软件[29]计算分析。

2 结 果

2.1 连锁不平衡分析

经Bonferroni校正,连锁不平衡分析结果显示,在5个民族中,47个常染色体InDel位点均不存在连锁不平衡现象。

2.2 等位基因频率及其分布差异

47个常染色体InDel位点在5个民族中的缺失等位基因频率分别为广东汉族0.224~0.699、广西壮族0.182~0.744、广西瑶族0.063~0.883、广西京族0.071~0.845、广西仫佬族 0.097~0.769。其中,rs139934789位点在广西瑶族、广西京族、广西仫佬族人群中的缺失等位基因频率极低,分别为0.063、0.071和0.097。经Bonferroni校正,Hardy-Weinberg平衡检验结果显示:47个常染色体InDel位点在广东汉族和广西壮族中的等位基因频率符合Hardy-Weinberg平衡分布;在广西瑶族、广西京族、广西仫佬族中,除了rs139934789位点(P=0.0000)外,其他46个常染色体InDel位点的等位基因频率符合Hardy-Weinberg平衡分布。详见表1。

经Bonferroni校正,等位基因频率比较结果显示:广东汉族和广西壮族之间差异无统计学意义,广东汉族和广西瑶族、广西京族、广西仫佬族之间分别有10、3、1个常染色体InDel位点差异具有统计学意义(P<0.05)。详见表2。

表1 47个常染色体InDel位点在5个民族中的等位基因频率Tab.1 Allele frequencies of the 47 autosomal InDel loci in 5 ethnic groups

续表1Continued tab.1

表2 广东汉族与其他4个民族的等位基因频率比较(P值)Tab.2 Comparisons of the allele frequencies between Guangdong Han nationality and the other 4 ethnic groups(P value)

群体间遗传差异分析结果显示,47个常染色体InDel位点在5个民族中的遗传差异有1.12%来自不同民族之间,有98.88%来自不同个体之间。

2.3 群体遗传学参数

在广东汉族和广西壮族人群中,Ho分别为0.350~0.564、0.284~0.568。在广西瑶族、广西京族和广西仫佬族人群中,rs139934789位点的Ho分别为0.000、0.000、0.006,其余位点的 Ho分别为 0.219~0.602、0.271~0.574和0.319~0.556,同时,该位点在这3个民族中的PIC较低,分别为0.110、0.123、0.160,详见表3。

在广东汉族和广西壮族人群中,DP值分别为0.514~0.648、0.463~0.648,PEtrio值分别为0.086~0.250、0.057~0.254。在广西瑶族、广西京族和广西仫佬族人群中,rs139934789位点的DP值分别为0.117、0.132、0.181,PEtrio值均为0.000;其余位点的DP值分别为0.354~0.653、0.423~0.655、0.479~0.662,PEtrio值分别为0.035~0.293、0.052~0.261、0.072~0.242。详见表3。

5个民族的CDP均高于0.999 999 999 999 999,累积三联体非父排除率(cumulative probability of exclusion of trios-testing,CPEtrio)分别为广东汉族0.99973216、广西壮族0.999 549 23、广西瑶族0.999 054 61、广西京族0.999 636 29、广西仫佬族0.99947179。详见表3。

2.4 Y-InDel位点检测结果

2个Y-InDel位点在所有男性个体中均被检出,而在所有女性个体中均未被检出。

表3 47个常染色体InDel位点在5个民族中的群体遗传学参数Tab.3 Population genetic parameters of 47 autosomal In Del markers in5 ethnicgroups

3 讨 论

本研究采用AGCU InDel 50试剂盒对广东汉族、广西壮族、广西瑶族、广西京族和广西仫佬族5个民族768名无关个体进行遗传多态性调查,并评估该试剂盒在5个民族中的法医学效能。结果表明,该试剂盒可以用于上述5个民族人群的法医学个体识别。与以往研究[21-25,30-31]的检测体系相比,该试剂盒包含的InDel位点数相对较多,所以CDP均高于0.999 999 999 999 999;但由于CPEtrio在5个民族中均小于0.9999,因此不适合单独用于亲权鉴定,只能作为常规STR分型试剂盒的有效补充。此外,该试剂盒包含的2个Y-InDel位点可以有效地提高Y染色体的识别度,可联合Amelogenin性别位点确定个体性别。

虽然多个InDel位点的等位基因频率分布在不同群体间存在差异,可能在一定程度上影响其在人群中的法医学应用,如rs151335218位点在广东汉族和广西京族人群中的等位基因频率差异具有统计学意义(P=0.0000),但DP值却相近(广东汉族0.613、广西京族0.592),因此,这种频率差异不影响该试剂盒在这5个民族中的适用。此外,群体间遗传差异分析结果显示,5个民族之间的遗传变异仅占总遗传多样性的1.12%,而主要的遗传变异是个体差异造成的,这也表明该试剂盒在这5个民族中具有适用性。

本研究47个常染色体InDel位点中,rs139934789在广西瑶族、广西京族和广西仫佬族人群中均缺乏多态性(Ho分别为0.000、0.000、0.006),且不符合Hardy-Weinberg平衡(P=0.0000),这可能是由于本研究47个InDel位点是基于数据库中汉族人群的数据筛选纳入的,因而可能存在个别位点的多态性在其他民族较汉族有差异。5个民族中除汉族来自广东外,其余4个民族均来自广西,因此,广东汉族与其余4个民族的差异除来自民族间的差异外,可能还存在广东与广西地区间的差异,而4个民族之间的差异,则主要来自民族间的差异。在今后的试剂盒优化中,可以考虑寻找其他适合中国人群的InDel位点来替代rs139934789位点,同时进一步增强该扩增体系的亲权鉴定效能。

本研究获得了47个常染色体InDel位点在5个民族人群中的等位基因频率及基因型分布数据,为建立中国人群InDel分布数据库及遗传关系的分析提供了良好的遗传背景数据,有助于将来群体遗传的多样性研究。

猜你喜欢

仫佬族京族等位基因
广西京族舞蹈语言的审美意韵
京族舞蹈的表演形式与风格赏析*
亲子鉴定中男性个体Amelogenin基因座异常1例
仫佬族师公调音乐的现状及传承
基于文化旅游资源开发的仫佬族特色村寨保护研究——以罗城大勒峒村为例
悠悠独弦琴 渺渺海上音
用数学思维分析遗传的基本规律
少数民族音乐
论京族舞蹈的原生态美学特征
爱笑不爱笑,基因早知道