APP下载

标准三联体非父排除率计算公式的推导和验证

2017-09-26张韩秋

法医学杂志 2017年4期
关键词:基因座单亲母子

周 密,张韩秋,汪 军

(1.芜湖市公安局,安徽 芜湖241000;2.安徽工程大学计算机与信息学院,安徽 芜湖241000)

标准三联体非父排除率计算公式的推导和验证

周 密1,张韩秋1,汪 军2

(1.芜湖市公安局,安徽 芜湖241000;2.安徽工程大学计算机与信息学院,安徽 芜湖241000)

目的 对标准三联体亲子鉴定的非父排除率(PE)进行公式推导和实验验证。 方法 基于PE定义自行推导公式:将该公式与前人报道的5个公式(1)~(5)进行对比,计算AGCU EX20系统19个常染色体STR基因座的PE值。根据1 000例单亲样本和1 000个无关个体样本设计真实实验,计算PE真实实验值。以随机模拟法产生1 000万对模拟亲母子和1 000万个随机个体,设计模拟实验计算PE模拟实验值。在19个基因座,统计各基因座的等位基因频率之和(S),将PE的公式值、真实实验值和模拟实验值进行对比。 结果 当S=1时,公式(1)、(2)、(5)、(6)计算结果完全一致,且符合真实和模拟双重实验验证。当S≠1时,公式(1)、(2)、(5)、(6)计算结果有较小误差。公式(3)、(4)的计算结果有较大误差。 结论 本研究推导的公式(6)与经典公式(1)、(2)、(5)均可用于标准三联体亲子鉴定。S值对PE公式计算有一定影响。

法医遗传学;亲子关系;非父排除率;三联体;计算公式

常规亲子鉴定多见于父子关系鉴定,即母子关系确定的前提下,要求鉴定假设父是否与孩子有亲生关系,习惯上称为标准三联体(假设父-母-子)鉴定,或称亲母疑父鉴定。非父排除率指不是小孩生父的男子能被遗传标记排除的概率,是衡量遗传标记系统在亲子鉴定中实用价值大小的指标[1]。标准三联体PE计算公式最早见于1965年Jamieson的理论推导[2],除此以外还有4个其他版本的公式,包括近似值公式[3,4]。经对各公式的精确性进行研究,本研究重新推导了标准三联体PE公式,与已报道的PE公式进行对比,并对公式计算结果进行双重实验验证。

1 方 法

1.1 真实样本

1.1.1 随机样本

从本实验室的样本库中随机抽取1 000名无关个体的血样,以Chelex-100法提取DNA,使用EX20试剂盒(无锡中德美联公司),利用9700型PCR仪(美国AB公司)扩增19个常染色体STR基因座,扩增产物用3130xl基因分析仪(美国Thermo Fisher Scientific公司)进行毛细管电泳,利用GeneMapper®ID软件(美国Thermo Fisher Scientific公司)判读样本基因型。

1.1.2 亲生母子样本

在实验室日常检案积累中随机抽取1 000组单亲案例样本,排除STR基因座突变,忽视性别作为1 000例亲生母子样本。实验方法同1.1.1。

1.2 模拟样本

1.2.1 随机个体

在单个基因座,自主研发软件以随机模拟法[5]产生2个等位基因,组成单个体在该基因座的基因型。等位基因的产生概率参考河南汉族人群基因频率[6]。同理模拟产生EX20系统的19个常染色体基因座STR分型,组成一个随机个体的分型。

1.2.2 随机子女

根据1.2.1,产生2个随机个体设为父亲和母亲。根据孟德尔遗传定律,在单个基因座,随机抽取父亲和母亲各1个等位基因,组成子女的基因型,抽取概率均为50%,获得单基因座单子女STR分型。同理模拟产生随机子女在19个基因座的完整STR分型。忽略父亲,即获得亲生母子完整的STR分型。

1.3 标准三联体PE经典公式

标准三联体PE有如下5个公式版本,其中公式(1)写入国家标准[7]:

1.4 标准三联体PE公式自行推导

参照朱运良等[8]对单亲PE公式进行推导,假设合并概率=父排除概率×子概率。因为标准三联体的母子之间必然共享1个等位基因,所以合并概率必须排除重复部分。因此本研究假设合并概率=父排除概率×子非来源母的基因概率×母子共享基因概率×母非遗传子的基因概率。设等位基因为A1、A2、……An,An为一个基因座的n个等位基因;等位基因分布频率为P1、P2、……Pn,Pn为第n个等位基因的频率。设i、j为1~n中任意值(i,j=1~n)且i<j。设r代表1~n全体,即Ar=A1+A2+…+An,则Pr=1。设s为非i的1~n全体(s≠i),即As=Ar-Ai,则Pt=1-Pi。设t为非j的1~n全体(t≠j),即At=Ar-Aj,则Pt=1-Pj。

根据母子基因组合分4种类型(表1)进行推导。

表1 标准三联体PE推导

(1)子基因型AiAi,母基因型AiAr

母子共享基因为Ai、母非遗传给子的基因为Ar、子非来源于母的基因为Ai时,母子共享的基因概率为Pi,母非遗传给子的基因概率为Pr=1,子非来源于母的基因概率为Pi。

不带Ai基因的父被排除,则父排除概率为(1-Pi)2,合并概率1=父排除概率×子非来源母的基因概率×母子共享基因概率×母非遗传子的基因概率=Pi2(1-Pi)2。

(2)子基因型AiAj,母基因型AjAs

母子共享基因为Aj、母非遗传给子的基因为As、子非来源于母的基因为Ai时,母子共享的基因概率为Pj,母非遗传给子的基因概率为Ps=1-Pi,子非来源于母的基因概率为Pi。

不带Ai基因的父被排除,则父概率为(1-Pi)2,合并概率2=父概率×子非来源母的基因概率×母子共享基因概率×母非遗传子的基因概率=PiPj(1-Pi)3。

(3)子基因型AiAj,母基因型AiAt

母子共享基因为Ai、母非遗传给子的基因为At、子非来源于母的基因为Aj时,母子共享的基因概率= Pi,母非遗传给子的基因概率=Pt=1-Pj,子非来源于母的基因概率=Pj。

不带Aj基因的父被排除,父概率=(1-Pj)2,则合并概率3=父概率×子非来源母的基因概率×母子共享基因概率×母非遗传子的基因概率=PiPj(1-Pj)3。

(4)子基因型AiAj,母基因型AiAj

不带Ai和Aj基因的父被排除,父概率=(1-Pi-Pj)2。

母子共享基因可能为Ai或Aj,1当母子共享基因为Ai时,母非遗传给子的基因为Aj,子非来源于母的基因为Aj,合并概率4.1=PiPj2(1-Pi-Pj)2;2当母子共享基因为Aj时,母非遗传给子的基因为Ai,子非来源于母的基因为Ai,合并概率4.2=Pi2Pj(1-Pi-Pj)2。合并概率4=合并概率4.1+合并概率4.2=PiPj(Pi+Pj)(1-Pi-Pj)2。

综上推导,标准三联体PE为:

1.5 标准三联体PE公式一致性的简单证明

以最简单的二等位基因的基因座(含P、Q两个等位基因,频率分别为p、q,且p+q=1)为例证明:

因此在二等位基因的基因座,公式(1)、(2)、(5)、(6)完全相等。

1.6 标准三联体PE公式实验验证

双亲关系判断标准:根据基因的分离和自由组合定律,在没有基因突变、分型错误的前提下,1孩子的等位基因必定一个来源于父亲,一个来源于母亲;2孩子不可能带有双亲均没有的等位基因[3]。

1.6.1 真实实验

将1 000名随机样本作为父,与1 000例亲生母子样本进行两两随机配对,得到1 000组随机父-亲母子。根据孟德尔定律,在单基因座对每组中的随机父-亲生母子进行双亲判断,设其中不符合双亲关系的组的数量为C。设标准三联体PE的真实实验值为PER,则PER=C/1 000。同理对19个基因座分别计算PER。

1.6.2 模拟实验

软件从PE概念出发,设计下列算法进行实验验证:在单基因座以随即模拟法模拟n组,每组包含1对亲生母子和1个随机个体。在每组中将随机个体作为父亲,与亲生母子进行双亲关系判断,设其中不符合双亲关系的组的数量为C。设标准三联体PE的模拟实验值为PES,则PES=C/n。设n=1 000万,同理对19个基因座分别计算PES。

1.6.3 公式计算

设PE1~PE6分别为根据公式(1)~(6)计算的PE。参考河南汉族人群基因频率,分别计算19个基因座的PE1~PE6。

2 结 果

2.1 真实实验和模拟实验对比

对照19个基因座的PER和PES(表2),绘制散点图(图1)。结果表明,PER和PES数值极为接近。因此真实实验和模拟实验的结果一致。

图1 19个基因座的PER与PES对比

2.2 PE公式实验验证

设S为单基因座的所有等位基因频率之和,统计各基因座S(表2)。结果发现部分基因座S≠1(0.999 8≤S≤1.000 1),有±0.002的误差。同时对比19个基因座的PE1~PE6、PER和PES(表2)。结果表明:

(1)在所有S=1的基因座(如D21S11、D5S818等),PE1=PE2=PE5=PE6。

(2)在所有S≠1的基因座(如D3S1358、TH01等),PE1≈PE2≈PE5≈PE6,有0.001 3%~0.042%的较小误差。

(3)在所有基因座,PE3和PE4与PE1、PE2、PE5、PE6,有0.1%~12.1%的较大误差。

(4)在所有基因座,PE1、PE2、PE5、PE6均与PER、PES结果一致,符合真实和模拟双重实验验证。

在表2中,所有S≠1的11个基因座,修改部分等位基因频率使所有基因座的S=1,而保持其他条件不变。重新计算PE1、PE2、PE5、PE6(表3)。结果表明,在修改后的基因座(S=1),PE1=PE2=PE5=PE6,误差消失。PE3和PE4仍有0.3%~12.3%的较大误差。

综上结果说明,当基因座S=1时,公式(1)、(2)、(5)、(6)计算结果完全一致,且符合真实和模拟双重实验验证。当基因座S≠1,公式(1)、(2)、(5)、(6)计算结果将产生较小误差,公式(3)、(4)的计算结果有较大误差。

表2 19个基因座的PE值与S值 (n=1 000)

表3 11个基因座修正后的PE与S值 (n=1 000)

3 讨论

对于标准三联体的PE公式,本研究进行了真实和模拟双重实验验证。因单亲案例的大量样本难以获得,本研究真实实验仅随机抽取1 000组单亲案例和样本库中的人员,而将真正的精确验证基于随机模拟法产生的1 000万单亲案例和随机人群。本研究以法医DNA计算器[5]基础平台,自主研发和实现了标准三联体PE验证算法,进行了上千万次双亲遗传规律判定。从实验结果看,模拟实验与真实实验结果完全一致,而且模拟实验的计算结果更精确,重复性更高。因此,模拟实验可在一定程度上代替真实实验,以充分体现随机模拟法在法医DNA领域的辅助科研作用。

朱运良等[8]通过重新推导单亲PE公式,发现在LEE等[9]发表的单亲PE公式第二项中“PiPj”前少了系数“2”,怀疑是原文出版过程中出现的错误。笔者整理文献时发现标准三联体PE公式至少有5种不同公式,而且同版本的公式间亦有细微的不同。本研究从标准三联体PE的定义出发,参照单亲PE公式推导,假设合并概率计算方法,自行推导出新公式(6)。经对比,公式(1)、(2)、(5)、(6)计算结果完全一致,而因为公式(1)为获得广泛认可的经典公式,所以从公式值对比的角度对公式(6)的合并概率假设和推导进行了证明,具有很高的说服力。本研究的推导方法简单明了,与单亲经典PE推导方法具有相当的一致性和连贯性。目前祖孙[10]案例有亲权指数计算方法报道,本研究PE推导方法可能对相应排除率计算方法具有一定启发作用。

本研究不仅提出了切实可行的公式推导方案,而且应用双重实验方法进行了验证。建立在一系列定律之上的数学理论体系是否正确,在于其理论体系所得出的结论能否被实验验证。本研究将6个公式的计算结果进行精确对比和双重实验验证,证明当基因座各等位基因频率之和(S)为1时,公式(1)、(2)、(5)、(6)计算结果完全一致,精确到小数点后8位;当S≠1时,公式(1)、(2)、(5)、(6)计算结果将产生一定误差。本研究针对最简单的基因座,从数学上证明了公式(1)、(2)、(5)、(6)的一致性,这与双重实验验证结果吻合。其他情形的公式一致性还有待进一步证明。

本研究还证明了S=1的必要性。从理论上来看,无论基因座有多少等位基因,其等位基因频率之和(S)均应绝对等于1。从本文1.4节的证明来看,p+q=1也是必要前提;如果p+q≠1,则必然导致PE1≠PE2≠PE5≠PE6。群体调查中S≠1的原因可能有:(1)基因频率多个四舍五入累积带来的误差;(2)统计、计算、抄写错误;(3)等位基因出现1次,但以5次计算基因频率。无论上述哪种原因,群体调查中均应极力避免。综上所述,本研究的公式推导法和实验验证法可能在法医DNA的理论研究中发挥推动作用。

本研究表明,公式(1)、(2)、(5)、(6)均可获得精确的标准三联体PE值。公式(3)被描述为近似计算公式,而公式(4)与公式(3)类似,均采用了杂合度概念,笔者推测也为近似值。表2结果可知,PE3和PE4与标准值(即PE1值)之间存在0.1%~12.1%的较大误差,因此将公式(3)、(4)称为近似公式也有一定的合理性。

[1]侯一平.法医物证司法鉴定实务[M].北京:法律出版社,2012:132-133.

[2]JAMIESON A.The genetics of transferrins in cattle[J]. Heredity(Edinb),1965,20(3):419-441.

[3]郑秀芬.法医DNA分析[M].北京:中国人民公安大学出版社,2002:424-425.

[4]BUTLER J M.法医DNA分型专论:方法学[M].侯一平,李成涛,译.3版.北京:科学出版社,2007:356-358.

[5]周密,张韩秋,韦帆,等.采用自主研发似然比率计算器进行ITO亲缘关系分析[J].中国法医学杂志,2011,26(5):365-367.

[6]刘亚举,郭利红,史绍杏,等.河南汉族人群39个STR基因座遗传多态性[J].法医学杂志,2014,30(3):217-220.

[7]中华人民共和国公安部.法庭科学DNA亲子鉴定规则:GA/T 965—2011[S].中国标准出版社,2011.

[8]朱运良,黄艳梅,伍新尧.单亲案亲权鉴定结果判定策略[J].法医学杂志,2006,22(4):281-284.

[9]LEE H S,LEE J W,HAN G R,et al.Motherless case in paternity testing[J].Forensic Sci Int,2000,114(2):57-65.

[10]中华人民共和国司法部司法鉴定管理局.亲权鉴定技术规范:SF/Z JD0105001-2016[S].2016.

Formula Derivation and Validation of Probability of Exclusion in the Cases of Standard Triplet Parentage Testing

ZHOU Mi1,ZHANG Han-qiu1,WANG Jun2
(1.Wuhu Public Security Bureau,Wuhu 241000,China;2.School of Computer&Information Science, Anhui Polytechnic University,Wuhu 241000,China)

Objective To derive and experiment validate the probability of exclusion(PE)formulas in the cases of standard triplet parentage testing.Methods The formulas were derived voluntarily based on the PE definition:PE=This formula was compared with the 5 formulas(1)-(5)reported previously,and the PE values of 19 autosomal STR loci in AGCU EX20 system were calculated.Based on 1 000 samples of single-parentage cases and 1 000 unrelated individuals,the real experiment was designed and the real experiment results of PE were calculated. Ten million pairs of simulated biological mother and son and 10 million random individuals were gained by random simulation method,and the simulated experiment was designed and the simulated values of PE were calculated.In 19 STR loci,the sum of all allele frequency(S)was calculated,and the formula values of PE were compared with the values of real and simulated experiments.Results If S=1,the calculation values of formula(1),(2),(5)and(6)were quite the same,which accord with the double verification of real and simulated experiments.If S≠1,there was a minor error in the calculation results of formula(1),(2),(5)and(6),while which had a large error in formula(3)and(4).Conclusion The formula(6)derived in present study and the classical formulas(1),(2)and(5)can be applied to the standard triplet parentage testing.The S value has a certain influence on PE calculation.

forensic genetics;parent-child relations;probability of paternity exclusion;triplet;formula

DF795.2

A

10.3969/j.issn.1004-5619.2017.04.006

1004-5619(2017)04-0363-05

2015-12-30)

(本文编辑:李 莉)

安徽省科技强警资助项目(1604d0802002)

周密(1982—),男,硕士,主检法医师,主要从事法医物证学研究;E-mail:523603361@qq.com

汪军,男,硕士,副教授,主要从事智能计算、图像处理与模式识别;E-mail:wangjun@ahpu.edu.cn

猜你喜欢

基因座单亲母子
单亲妈妈如何谋划未来
广东肇庆汉族人群20个STR基因座遗传多态性
母子相依
遭遇如此母子,我的婚姻好尴尬
单亲爸爸育儿经:军事化管理收服“公主心”
遭遇如此母子,我的婚姻好尴尬
单亲妈妈以爱的名义把女儿拉下水
单亲妈妈张柏芝
DYF387S1基因座分型异常现象
PowerPlex21系统在亲子鉴定中的应用评估