APP下载

中国不同语系人群的色素表型推断

2019-12-27梁鳅双刘明陶现明刘凡曾发明李彩霞赵雯婷

法医学杂志 2019年5期
关键词:肤色表型色素

梁鳅双 ,刘明 ,陶现明 ,刘凡 ,曾发明 ,李彩霞 ,赵雯婷

(1.公安部物证鉴定中心 现场物证溯源技术国家工程实验室 法医遗传学公安部重点实验室 北京市现场物证检验工程技术研究中心,北京 100038;2.广西玉林市公安局,广西 玉林 537000;3.昆明医科大学法医学院,云南 昆明 650500;4.中国科学院北京基因组研究所 中国科学院精准基因组医学重点实验室,北京 100101)

色素表型主要包括眼睛(虹膜)颜色、发色、肤色等,是一种具有显著人群差异性的外貌特征。根据法医人类学研究[1],东亚黄种人(蒙古人种)的眼睛颜色多呈深褐色或黑色,头发多为黑色,肤色在黄色的基础上存在深浅差异。欧洲白种人(高加索人种)的色素特征个体差异较大,头发包括浅金色、棕色、红色和黑色等,眼睛颜色包括蓝色、绿色、棕色等,肤色存在从极浅到较深的变化。非洲黑种人(尼格罗人种)的色素特征最为单一,眼睛颜色多为黑褐色,头发为黑色,肤色多呈黑色和深褐色。过渡人种同时具有两种及以上人种的色素特征。色素特征受到遗传背景、环境选择等多重影响[2],如人群的肤色特征具有明显的地理分布差异,与紫外线照射强度相关,距离赤道越远的人群肤色越浅[3-4]。

在法庭科学领域,色素表型不仅被用于法医人类学人种判别,也是法医遗传学推断现场生物物证DNA来源人外貌特征的重要组成信息[5-7]。色素特征的遗传推断研究主要基于单核苷酸多态性(single nucleotide polymorphism,SNP)。2010年,通过对欧洲人群的遗传研究,荷兰的Kayser实验室研发了由6个SNP位点构成的IrisPlex眼睛颜色推断体系[8]。随后,他们在此基础上添加了18个头发颜色相关位点,构建了包含24个SNP位点的HIrisPlex眼睛及头发颜色推断体系[9]。通过对全球59个人群的肤色遗传学研究[10],CHAITANYA等[11]在2018年又建立了基于41个SNP位点的HIrisPlex-S系统,在HIrisPlex系统中添加了ANKRD11、OCA2、SLC24A4等7个肤色相关基因中的17个SNP位点,可实现对三类眼睛颜色、四类头发颜色和五类皮肤颜色的推断。这三个色素表型体系在欧美人群中表现出很高的推断准确性[12-16]。国际上针对东亚人群尤其是中国人群的色素遗传研究较少。

中国人群绝大多数属于蒙古人种。按照语系划分,分属汉藏、阿尔泰、印欧、南亚、侗台、苗瑶、南岛语系[17],各语系人群呈现出地域分布和色素特征的差异。已有研究[18]表明,东亚人群的遗传结构与语系分布具有对应关系。本研究利用HIrisPlex-S体系,对分布在中国7大地理区域的6个语系的17个人群进行眼睛、头发、皮肤颜色相关SNP位点的分型检验和表型推断分析,旨在为我国法医人类学提供各语系人群的色素表型参考数据,并为法医遗传学的外貌推断技术提供人群及色素表型的划分依据。

1 对象与方法

1.1 研究人群

中国汉族(广东、河北、四川)、哈萨克族、蒙古族等共17个人群2666份男性DNA样本,生物样本来源于公安部物证鉴定中心国家科技资源共享服务平台计划项目(YCZYPT[2017]01-3)的人群样本库,所有志愿者均依照公安部物证鉴定中心伦理委员会规定签署知情同意书。2666份样本的人群和语系等信息见表1。

17个人群样本分属六大语系七大地理区域:西北地区印欧语系的塔吉克族、阿尔泰语系的维吾尔族、哈萨克族;东北地区阿尔泰语系的蒙古族、锡伯族;华南地区苗瑶语系的苗族、瑶族,侗台语系的侗族、壮族以及汉藏语系的广东汉族;华东地区苗瑶语系的畲族;华北地区汉藏语系的河北汉族;西南地区汉藏语系的四川汉族、藏族、彝族以及南亚语系的佤族。

表1 17个人群的样本信息

1.2 DNA提取、定量

采用QIAamp DNA Blood Mini试剂盒(德国Qiagen公司)提取DNA,使用NanoDrop 2000c分光光度计(美国Thermo Scientific公司)进行DNA定量。以去离子灭菌水调整DNA质量浓度至5ng/μL。

1.3 HIrisPlex-S复合体系的构建

根据已报道的引物序列和体系构建方法[11,19],在实验室构建HIrisPlex-S复合扩增体系用于DNA样本的分型检验。41个SNP位点分为24和17两个体系(图1),其中S1-EX、S3-EX、S4-EX、S10-EX、S21-EX、S22-EX、S24-EX共7个位点的延伸引物改变了多聚t数目。

图1 HIrisPlex-S的41个SNP位点基因分型图谱

1.4 人群样本的DNA分型检测

PCR扩增使用ABI PRISM®SNaPshotTMMultiplex试剂盒(美国Thermo Fisher Scientific公司),5 μL反应体系包含:10×PCR缓冲液(15mmol/L Mg2+)0.5μL、MgCl2(25 mmol/L Mg2+) 0.7 μL、dNTP(10 mmol/L)0.05 μL、PCR 引物混合物 0.5 μL、HotstarTaq plus(5 U/μL)(德国 Qiagen 公司) 0.2 μL、DNA(5 ng/μL)2 μL、ddH2O 1.05 μL。在 96 孔 PCR 仪 Mastercycler Pro Eppendorf®热循环仪(德国Eppendorf公司)上进行热循环实验,条件为:95℃ 5 min;94℃ 30 s,55℃30s,72℃ 1min,40个循环;72℃ 10min。PCR扩增结束后,将核酸外切酶Ⅰ(Exo Ⅰ)(10U/μL)0.2μL、虾碱性磷酸酶(shrimp alkaline phosphatase,SAP;美国 Affymetrix公司)(1 U/μL) 1 μL、10×SAP 缓冲液0.3μL、去离子水1.5μL加入2μL PCR产物中。将混合物37℃孵育30 min,96℃酶纯化10 min,去除过量引物和未结合脱氧核苷酸。

纯化后的产物进行延伸反应,在5 μL反应体系下,用单碱基延伸(single base extension,SBE)实现SNP基因座的微测序。包括2.5 μL的反应混合物、1.5 μL纯化PCR纯化产物、0.3 μL SBE引物混合物、0.7 μL ddH2O。热循环参数:96 ℃ 2 min;50℃ 5 s,60℃ 30 s,25个循环。延伸产物需经SAP纯化。用0.5 μL SAP在37℃孵育60 min,再用75℃的酶灭活15min,灭活过量荧光标记的dNTPs。

V(内标LIZ 120)∶V(甲酰胺)为30∶1000的混合液9μL与1μL的DNA产物混合,在3130xl基因分析仪(美国AB公司)上进行电泳,结果采用GeneMapper®IDv3.2软件(美国Thermo Fisher Scientific公司)进行基因分型。分型图谱如图1所示。采用Modified-PowerStates软件[20]计算Hardy-Weinberg平衡检验。

1.5 色素表型在线推断

将检测出的SNP分型按照色素表型在线推断模型(https://HIrisPlex.erasmusmc.nl/)要求的格式整理上传,计算后得到每个样本眼睛颜色(蓝色、中间色、棕色)、头发颜色(红色、金色、棕色、黑色)、肤色(极白色、白色、中等色、深色、较黑-黑色)的概率。参照推断模型使用说明及相关文献[9,11,21],对眼睛、头发颜色、肤色进行判读。

眼睛颜色推断:输入分型后,模型会对每个样本输出3种眼睛颜色概率数据(P值)。选取P值最大的表型为推断结果。

头发颜色推断:输入分型后,模型会对每个样本输出4种头发颜色概率数据(P值)和头发深浅概率数据(P值)。使用分步推断法,综合4种颜色中的最大P值和颜色深浅P值进行判读。

皮肤颜色推断:输入分型后,模型会对每个样本输出5种皮肤颜色的概率数据(P值)。肤色颜色判读比较复杂,需要使用分步推断法,综合较大的前两位肤色P值进行综合推断。一般来说,当第二位P值肤色比第一位P值肤色更深时,会对结果产生影响;第二位P值肤色较浅时不对第一位P值肤色产生影响。对于中等及更浅的肤色,第二位P值是否大于0.15也会对判读结果有影响。

采用SPSS 17.0软件分别对阿图什和伊宁的维吾尔族头发颜色以及对于不同人群、语系、地域的皮肤颜色进行χ2检验。检验水准α=0.01。

2 结 果

2.1 眼睛颜色的推断结果

运用自主构建的HIrisPlex-S复合扩增体系检测2666份样本。41个SNP位点基因型分布均符合Hardy-Weinberg平衡(P>0.05),共获得109 306个SNP位点的分型结果,上传至HIrisPlex-S在线推断模型。参照色素表型分类标准对输出的数据进行分析判读,获得所有个体的色素表型推断结果。从眼睛颜色的推断结果(表2)来看:印欧语系和阿尔泰语系突厥语族的4个亚欧混合人群(塔吉克族、阿图什维吾尔族、伊宁维吾尔族和哈萨克族)有18个蓝色眼睛的个体,占1.917%;其他人群眼睛均为棕色,没有表型差异。

表2 眼睛颜色表型推断结果 (例)

2.2 头发颜色的推断结果

从头发颜色的推断结果(表3)来看,只有亚欧混合人群具有头发颜色表型多样性,除了蒙古族人群有2个深棕色-黑色头发个体,其他人群的头发颜色均为黑色。从图2可以看出4个亚欧混合人群的头发颜色分类比例。塔吉克族黑色头发个体最少,约占41.414%,棕色、深棕色(包括深棕色-黑色和棕色-深棕色两类)约占57.576%,金色、深金色约占1.010%;阿图什维吾尔族黑色头发约占75.758%,棕色、深棕色约占24.242%;伊宁维吾尔族黑色头发约占72.052%,棕色、深棕约占27.948%;哈萨克族黑色头发个体最多,约占84.615%,棕色、深棕色约占14.835%,金色、深金色约占0.549%。南疆(阿图什)和北疆(伊宁)的维吾尔族人群头发颜色表型分类没有差异(χ2=0.819,P=0.366)。

图2 4个亚欧混合人群的头发颜色分类比例

表3 头发颜色表型预测分类结果 (例)

2.3 皮肤颜色的推断结果

从皮肤颜色推断结果(表4)来看,中国不同人群的肤色具有明显的表型多样性(图3),塔吉克族、阿图什维吾尔族、伊宁维吾尔族、哈萨克族有白色至中等偏浅肤色个体,其他各人群自中等肤色至较黑-黑肤色个体均有一定的分布比例。结果呈现出显著的人群、语系和地域的差异分布(P<0.01)。

在本研究的2 666个样本中,白肤色个体共有5例,来自塔吉克族和伊宁维吾尔族。从17个人群的肤色分类比例柱状图来看(图3A),只有4个亚欧混合人群存在浅肤色(白+中等偏浅肤色)个体,且呈现出典型的混合人群特点:各类皮肤颜色的个体都占有一定比例,分布较为平均。苗、畲、瑶、侗、壮族及不同地区的3个汉族人群都以中等+中等偏深肤色为主,占人群总数的56.768%,深肤色占比较低。藏、彝、佤族人群肤色较深,以较黑-黑肤色为主;其中佤族的较黑-黑肤色比例占到57.426%。蒙古族人群中等+中等偏深、深+深-较黑肤色和较黑-黑肤色人群为38.519%、30.000%和31.481%,约各占1/3;锡伯族人群肤色分布比例与蒙古族相似,但中等肤色比例略高,为49.444%。

从语系和地理分布上来看(图3B、3C),西北地区的印欧语系白+中等偏浅肤色个体最多(9.091%),较黑-黑肤色个体比例与浅肤色相近(11.448%);同属西北地区亚欧混合人群的阿尔泰语系突厥语族有少数浅肤色个体(5.296%),肤色整体更深,与印欧语系之间差异具有统计学意义(χ2=19.437,P=0.002)。阿尔泰语系的通古斯与蒙语族同属东北地区,肤色比例差异无统计学意义(χ2=0.819,P=0.366)。生活在华南地区及华东南部的苗瑶语系和侗台语系中等肤色比例过半,是整体肤色较浅的两个群体。同为汉藏语系的藏缅语族与汉语族差异具有统计学意义(χ2=179.189,P<0.001),汉语族多数人为中等肤色(53.823%),而藏缅语族以深肤色、深-较黑肤色和较黑-黑肤色为主(83.186%)。藏缅语族(藏族、彝族)和南亚语系(佤族)所生活的四川、西藏、云南等地同属于西南地区。南亚语系人群肤色更深,以较黑-黑肤色个体居多(57.426%),与藏缅语族肤色比例差异具有统计学意义(χ2=16.510,P=0.002)。17个人群之间的卡方检验结果为χ2=667.506,P<0.001;六大语系人群之间的χ2检验结果为χ2=615.558,P<0.001;七大地理区域人群之间的χ2检验结果为χ2=570.975,P<0.001。

表4 肤色表型预测分类结果 (例)

图3 各人群肤色推断表型分布

3 讨 论

国际上已有的关于色素表型的研究大多基于欧洲人群,对于东亚人群的研究较少。本研究通过构建包含41个色素表型相关位点的HIrisPlex-S体系,对中国7大地理区域6个语系17个人群样本进行了DNA分型检测和色素表型推断。研究结果较全面地呈现了中国各语系人群的色素表型分布及差异情况,为我国法医人类学和法医遗传学表型推断研究提供了人群的色素表型参考信息。

根据本研究的结果,通过HIrisPlex-S体系推断出的人群色素表型与对各人群色素特征的常识认知、法医人类学对各人群色素特征的描述基本一致。中国仅有印欧语系和阿尔泰语系中的亚欧混合人群在眼睛和头发颜色方面存在明显分类差异,其中塔吉克族的欧源成分最高,其黑发个体占比最少,浅肤色个体占比最多。哈萨克族的欧源成分最低,黑发个体最多,没有白肤色个体。通常认为南疆和北疆的维吾尔族人群存在外貌表型的差异,本研究中北疆伊宁维吾尔族推断为棕色头发个体更多且有白肤色个体,但总体而言与南疆阿图什维吾尔族人群的色素表型十分接近。其他语系、语族的人群仅有肤色表型的多样性,眼睛和头发颜色没有明显差异。以上结果表明,眼睛、头发颜色主要与遗传背景及族源成分相关。

中国人群的肤色表型比较复杂,不仅与遗传背景相关,还与中国独特的地理环境相关。中国地区的全球水平辐照度(global horizontal irradiation,GHI)[22]显示,喜马拉雅山脉及与之紧邻的青藏高原是平均辐照度最高的地方,其次是云贵高原及内蒙古高原,华东、华南地区辐照度较低,四川盆地则是全国辐照度最低的地区。本研究结果与肤色是紫外线辐照的适应性进化理论一致[23],即生活在高辐照地区的人群肤色深,生活在低辐照地区的人群肤色浅。阿尔泰语系的蒙古族和锡伯族的肤色、遗传背景和地理区域都比较相近,但生活在内蒙古高原的蒙古族人群深肤色的比例更高。汉藏语系中藏族、彝族两个人群的采集地都位于川藏高原,以深肤色为主,居住海拔更高区域的藏族人群肤色更深。低辐照区域的四川及广东汉族比华北地区的河北汉族肤色浅,华南地区的苗瑶、侗台语系人群的肤色也较为白皙。南亚语系的佤族人在17个人群中肤色最深,除了其居住区域为云贵高原,也与南亚语系人群的族源历史相关。

本研究结果证实,HIrisPlex-S色素推断体系在中国人群中具有一定的适用性,中国不同语系和地域人群的色素表型有一定差异,其中肤色表型的差异更大。由于眼睛和头发颜色相关位点是基于欧洲人群挖掘的,对亚欧混合人群有一定应用价值,但在东亚人群中的应用受限。后续研究基础上需要进一步筛选和验证中国人群色素相关的遗传位点,确定适合中国人群的色素分类标准,优化预测模型,使该技术可以更广泛地用于我国的法医物证学鉴定实践。

猜你喜欢

肤色表型色素
色素热舞
“听话”的色素
肤色(外一首)
Conversation in a house
人的肤色为什么不同
为什么人有不同的肤色?
建兰、寒兰花表型分析
甜油的生产及色素控制
天然色素及红色素的研究进展
GABABR2基因遗传变异与肥胖及代谢相关表型的关系