APP下载

基于全基因组测序筛选腰椎管狭窄症易感基因突变位点

2021-12-01SuriP,StanawayIB,ZhangY

中国疼痛医学杂志 2021年7期
关键词:表型位点基因组

腰痛 (low back pain, LBP) 是美国公民就医的第五大病因,也是致残的主要原因。LBP 发病率高,社会影响大,但病因尚未明确。有效识别LBP 的遗传易感因素将是探索发病机制和探究新疗法的一种有效途径。LBP 的广义遗传力高达40%,显示其与遗传因素密切相关。基于两项全基因组关联分析(GWAS)数据确定了LBP 相关易感基因突变位点,表明遗传因素是LBP 的生物-心理-社会模式的基础,开启了LBP 遗传机制研究的大门。在医学上LBP作为一种临床症状,而非一项诊断。临床上被普遍接受的两种常用诊断分别为腰骶神经根性疼痛或腰骶神经根综合征(LSRS)和腰椎管狭窄症 (LSS),其他诊断缺乏诊断标准。因此,LBP 的研究多集中在“非特异性(原发性)腰痛”方向,并未考虑潜在的外周致病因素,忽略了与LBP 相关疾病的表型异质性可能会降低通过GWAS 探索致病基因统计学效力。临床上也可通过疾病特定的“内在表型”进行诊断,例如公认的LSRS 和LSS 临床综合征。通常在病人自诉不清的情况下可在规范化临床诊疗中通过电子病历 (EHR) 关联的遗传生物库数据进行诊断。该遗传生物数据库可提供病人及受试者较为全面的病史,进而实现更准确的疼痛表型分型。

本项研究中,利用EHR 生物库数据资源探讨了LBP 和腰椎疾病的潜在遗传学发病机制。首次发现LBP 相关易感基因突变位点,同时确定与LSRS和LSS 相关的易感基因突变位点,最后利用EHR生物库数据进行GWAS 分析确定了LBP 和腰椎疾病相关的易感基因突变位点的表现型。

1. 研究方法

(1)概述:GWAS 被称为“不可预知的”或“没有假设的”基因筛选方法。对两项独立的来源于电子病历、基因组学网络和格伊辛格卫生系统的GWAS 数据进行荟萃分析筛选易感突变基因,并在UKB 的独立样本中对筛选的有显著差异的突变基因进行了体外验证。

(2)腰痛和腰椎疾病的分型:该研究严格按照EHR数据库和国际通用疾病分类编码第9版 (ICD-9)中对腰痛和腰椎疾病的定义将纳入病例分为病例组和对照组。其中病例组包括:①需医疗干预的腰痛(LBP-HC 型);②腰骶神经根综合征(LSRS 型);③腰椎管狭窄症(LSS 型);④腰椎源性神经病理性疼痛(LSRS/LSS 型)。为确保所有观察者的有效随访时间,纳入年满18 岁且规律接受医疗服务随访满1 年的受试者。需医疗干预的LBP-HC 型病人临床上伴或不伴有下肢神经性疼痛,在疾病分类中属于非特异性(原发性)腰痛,很难划分到其他分型亚组中。可基于EHR 的层次化分类算法来区分LSRS 型和LSS 型,LSRS 型病人通常合并有坐骨神经病变、梨状肌综合征、骶髂关节疼痛等症状;LSS 型病人主要表现为神经源性跛行和腰椎管狭窄为主的症状。

(3)基因分型:eMERGE 网络数据主要使用Illumina 平台和Affymetrix 83 数组芯片技术对样本进行基因分型。单核苷酸突变位点 (SNVs) 的检测由密歇根基因插补网页工具完成。所有受试者均签署知情同意书,同时批准可获取eMERGE3 数据库信息。

(4)疾病表型和基因分型的体外验证:初步探索显著差异的突变基因,随后通过UKB 进行大样本体外验证,UKB 中研究人群与英国普通人群在疼痛发病率及相关社会人口和心理因素关系具有相似性。UKB 的腰骶神经根综合征(LSR-UKB)是指有一个或多个ICD-10 诊断编码提示LSR 或“坐骨神经痛”或“椎间盘突出/滑脱”的病例;将没有ICD-10 诊断编码提示LSR 和“坐骨神经痛”或“椎间盘突出/滑脱”的病例划分到对照组;LSS 和LSS/LSRS 型的对照组和病例组使用相似的方法进行分组。

(5)统计学分析:参与者种族限于欧洲人群以便最大可能降低遗传异质性,其中三级亲属和近亲参与者排除在外。在eMERGE3 数据库样本的GWAS 分析中,设置过滤阈值如下:次等位基因频率 (MAF) < 0.005,插补系数r2< 0.3,哈迪温伯格平衡检验 (HWE)P< 10-6,基因分型率 < 0.98,个体率 < 0.98。在Geisinger 数据库样本的GWAS 分析中,设置过滤阈值如下:MAF < 0.01、插补系数r2< 0.3或 < 0.4(根据阵列来确定),HWEP< 10-15,基因分型率 < 0.90,个体率 < 0.90。在PLINK 1.9 中,对性别、年龄、特异性位点和种族自1~10 进行了调整,并采用基因型加性模型对插补的SNVs 进行Logistic 回归分析。通过设置SNVs 的滤过阈值进行了质量控制,滤过参数如下:MAF < 0.01,插补系数r2< 0.03,HWEP< 10-6,BETA ≥10,SE ≤0或≥10,预期次等位基因计数≤100。

荟萃分析使用METAL 软件,P< 5×10-8作为在全基因组分析中具有统计学意义的标准。利用连锁不平衡评分回归方法计算遗传性。根据文献报道LBP 的患病率 (84%) 和因LBP 而寻求医疗干预比率(58%),推算普通人一生中因LBP 寻求医疗干预的患病率为48.7%,以此代表LBP-HC 的遗传易感性。同样,基于LSRS 和LSS 的患病率 (26%和11%) 进而估计LSRS 和LSS 和LSRS/LSS 的遗传易感性。暂无关于以人群为基础的LSRS/LSS 患病率数据,因此推测其患病率略高于LSRS 的患病率 (29%)。为了量化疾病表型之间的总体共有遗传因素,利用连锁不平衡得分回归计算了LBP-HC、LSRS 和LSS之间的基于SNV 的遗传相关性 (rg),鉴于LSRS 和LSS 分型是LBP-HC 中的两个亚组。使用圣克鲁斯大学的基因组浏览器检验了全基因组范围内的重要SNVs 位点。通过LocusZoom 可视化方式来识别独立的SNVs,同时使用全基因组复杂性状分析软件包的汇总数据联合分析方法来检测显著变异的突变位点。为了鉴定已筛SNVs 位点的功能性,在GTEx 中对其进行检测,并确定了与相邻基因差异表达相关的变异。

为了描述全基因组显著SNVs 对其他性状的潜在共有遗传影响,使用Pheno Scanner 数据库第2 版检测了主要的SNVs 与其他性状的关系 (P< 1×10-5),并在eMERGE3 中的主要SNVs 进行了全表型组关联研究。PheWASs 能系统地检测一种基因突变相关的所有表型。PheWAS 包含所有的eMERGE3 EA参与者的表型和"phecodes"定义的表型。研究了主要的SNV 和890 个具有至少2 个ICD 编码的phecodes 之间的关联性,P< 5.6×10-5(0.05/890)作为每个主要SNV 显著性的阈值。

体外研究验证显示有3 个SNVs 突变位点(rs12310519 [SOX5],rs7814941 [CCDC26/GSDMC]和rs3180 [SPOCK2/CHST3])与腰痛有关。另外一项研究发现一个与冰岛人LSRS 相关的SNV (rs7831174),其所采用的筛选阈值为P< 0.05 (0.05/1)。

2.结果

(1)腰痛和腰椎疾病在eMERGE3 及Geisinger数据库中的GWAS:荟萃分析研究显示LBP-HC 的患病率为48.8%,LSRS 为19.8%,LSS 为7.9%,LSRS/LSS 为22.1%。全基因组水平研究显示LBP-HC无显著相关的SNV 位点,LBP-HC 的全基因组SNV遗传率结果为观测尺度遗传力为3.1% (±0.5%),易感性尺度的遗传力为4.9% (±0.8%)。

LSRS 的SNV 遗传率在观察量表上为4.2%(±0.5%),在责任量表上为9.4% (±1.0%)。研究发现3 个突变位点与LSRS 显著相关。差异最显著的突变位点位于9 号染色体上NXNL2 基因(变异在5'402 KB 处)和C9orf47/S1PR3/SHC3 基因(变异在3'15 KB 处)区域间,该基因位点为rs146153280:C > G(G 等位基因比值比OR= 1.17,P= 2.1×10-9,G 等位基因频率为0.04),其中基因C9orf47, S1PR3以及SHC3 彼此紧密排列和/或部分重叠。另2 个突变位点位于该区域rs146153280 两侧,与之呈线性关系,但在以rs146153280 为主的条件性分析中并无显著差异。

研究显示LSS 的观测尺度遗传力为2.2%(±0.5%),易感性尺度的遗传力为8.0% (±2.0%)。研究发现4 个突变位点与LSS 显著相关。其中差异最显著的突变位点位于2 号染色体上AAK1 基因的5'端非编码区,该基因位点为rs13427243:G > A(A 等位基因OR= 1.10,P= 4.3×10-8,G 等位基因频率为0.40)。这4 个突变位点位于基因GFPT1、NFU1 以及AAK1 片段上共计131, 465 对碱基,余3 个显著差异突变位点与rs13427243 呈线性关联,但在以rs13427243 为主的条件性分析中并无显著差异。

LSRS/LSS的观察尺度遗传力为4.4% (±0.5%),易感性尺度的遗传力为9.3% (±1.0%)。GWAS 结果显示显著突变位点与LSRS 型研究结果相同,均为位于9 号染色体上的rs146153280 (OR= 1.17,P=1.4×10-9)。另2 个突变位点在以rs146153280 为主的条件性分析中也无显著差异。

研究显示腰痛与LSRS 的遗传相关系数 (rg) 为1.00,与LSS 的相关系数为0.86。LSRS 和LSS 的遗传相关系数为0.67。

(2)突变位点的基因型-组织表达 (genotypetissue expression, GTEx) 特征:LSRS 和LSRS/LSS的基因型-组织表达研究结果未发现与显著差异基因突变位点(rs146153280)显著相关的数量性状位点(eQTL)。研究显示LSS 型中的显著差异突变位点rs13427243 在包括肌肉和神经等20 种组织中在GFPT1 和NFU1 基因上具有显著相关的表达数量性状位点(P= 1.8×10-20-7.4×10-5)。

(3)突变位点的表型特征:研究显示与LSRS型相关的位于9 号染色体上的显著差异位点rs146153280与蛋白Semaphorin-4D和C9orf47基因的表达显著相关。与LSS 相关的位于2 号染色体上的差异位点rs13427243 与GFPT,NFU1和ANXA4的基因表达以及DNA 甲基化和组蛋白修饰表观遗传特征显著相关。全表型关联研究结果表明显著差异突变位点在校正统计检验后发现与其他表型并无显著关联。

(4)显著突变基因的外部验证:在UKB 中研究结果显示LSRS、LSS 和LSRS/LSS 的患病率分别为5.8%、1.2%和6.4%,明显低于在eMERGE/Geisinger 数据库中相应的患病率 (19.8%、7.9%和22.1%)。上述在LSRS 和LSRS/LSS 疾病中发现的显著差异突变位点rs146153280 在UKB 中未得到重复验证。然而,LSS 相关差异突变位点rs13427243 在该数据库中得到重复验证 (OR= 1.11,P= 5.4×10-5)。

(5)腰痛和腰骶神经根综合征相关显著差异突变位点的外部验证:在UKB 中得到验证的LBP-HC相关显著差异位点rs12310519:C > T (SOX5) (OR=1.05)在eMERGE/Geisinger 数据库中同样得到验证(T 等位基因的OR= 1.05,P= 0.011)。此外,同样在UKB 中得到验证的LBP 相关显著差异位点rs7814941: G > A (CCDC26/GSDMC) (OR= 1.04)在eMERGE/Geisinger 数据库中也同样得到验证(A等位基因的OR= 1.03,P= 0.005)。但在UKB 中得到验证的LBP 相关性突变位点rs3180 (SPOCK2/CHST3) (OR= 0.98,P= 0.09)在eMERGE/Geisinger数据库中无法重复验证。

3. 讨论

本项GWAS 研究结果主要通过利用多中心的EHR 临床数据来识别需医疗干预的LBP (LBP-HC)和两种腰椎疾病 (LSRS和LSS) 相关的遗传标志物。研究纳入的样本量超过10 万,但全基因组分析未发现与LBP-HC 具有显著关联的基因突变位点。虽LSRS 和LSS 型参与者病例数相对较少,但全基因组研究新发现了与之相关的易感基因突变位点,包括LSS 相关的1 个易感突变位点及LSRS 相关的1个易感突变位点。随后在UKB 中进行表型验证,重复验证了突变位点rs13427243 与LSS 的显著关联性,另外发现的突变位点未得到重复验证。

两项研究均报告了LSS 相关遗传位点(遗传力67%~81%),但在全基因组分析中未证实存在易感突变位点。本研究证实LSS 相关显著易感突变基因位点rs13427243: G > A [A 的OR= 1.10,P= 4.3×10-8]可在独立样本中重复验证 (ORA = 1.11,P= 5.4×10-5),该位点主要影响GFPT1,NFU1和AAK1基因编码,进而影响多种组织中GFPT1和NFU1的表达。目前AAK1抑制剂治疗神经痛的研究已通过动物实验验证,并完成了1 期临床试验,针对糖尿病周围神经痛的2 期临床试验正在进行中。LSS 是腰椎相关神经性疼痛的常见病因,通过在人类GWAS 和以动物为模型的药物研发方面的结果均显示AAK1突变与LSS 相关。临床上通常使用针对周围神经性疼痛的药物(如加巴喷丁和普瑞巴林)来控制LSS 症状。如果将来AAK1抑制剂可安全有效地治疗糖尿病周围神经痛,则可考虑AAK1抑制剂是否可用于治疗LSS 引起的神经病理性疼痛。GFPT1 基因可编码谷氨酰胺-果糖-6-磷酸转氨酶-1,该限速酶在蛋白质和脂质糖基化过程中发挥重要作用。研究显示GFPT1 基因的突变与先天性肌无力综合征有关,临床表现为眼肌和延髓肌无力。NFU1基因编码的蛋白质在铁硫簇生成过程中发挥重要作用,NFU1基因的突变可引起线粒体功能障碍综合征。

本项全基因组荟萃分析研究显示在9 号染色体NXRS2与C9orf47基因之间区域中的突变位点rs146153280 与LSRS 和LSRS/LSS 表型显著相关。但在UKB 中未得到重复验证,可能因该数据库中对腰椎疾病定义的差异而导致。但并未影响LSS 型中易感突变位点rs13427243 的验证。UKB 中疾病的代码主要来自住院系统,代码获得途径差异也造成独立样本重复验证中的不一致结果。鉴于LSS 病人更多的接受住院手术治疗,LSRS 病人更多的接受保守治疗,所以实际纳入的LSS病人数量较LSRS病人多。因此使用一致的疾病代码对rs146153280 与LSRS 的关联性进行重复验证。

本项全基因组荟萃研究结果验证了已报道的LBP 相关易感基因位点:SOX5基因中的rs12310519 及CCDC26/GSDMC基因间区域中的rs7814941。这些突变位点在eMERGE/Geisinger 数据库中和UKB 数据库中均得到验证,但另已报道的LBP 相关易感基因SPOCK2/CHST3未超过显著性阈值,但具有一定关联性。本研究同样验证了LSRS 表型中易感突变基因位点rs6651255 与需要减压手术的腰椎间盘突出症之间的关联性,但在eMERGE/Geisinger 数据库中关联性相对小(C等位基因OR= 0.95)。研究已证实LBP-HC 易感突变基因位点rs12310519 和rs7814941 以及位于CCDC26/GSDMC区域的LBP-HC 易感突变基因位点rs7814941,通过GWASs 分析发现LBP 易感突变位点与该疾病严重程度同样具有关联性。本研究结果有效阐明了遗传因素在腰椎疾病的发病机制方面的重要作用。

本研究结果有效表明基于EHR 的特定腰椎相关诊断(如LSRS 和LSS)表型的个体变异的遗传发现率更高,这一发现可在临床上更好指导疾病型的诊断。在临床上可有效对LBP 病人进行亚组诊断,同时提供个体化诊治。例如,LSRS 或LSS 引起的顽固性神经性下肢疼痛或肌无力的病人可优选腰椎减压手术,但该术式不适用于下肢无神经性症状/体征的轴性LBP 病人。同时,全基因组显著突变基因关联性分析显示LSRS 和LBP 的遗传力基本相同 (rg~1.0),LSS 和LBP-HC 的遗传力高度相似(rg= 0.86),LSRS 和LSS 的遗传力基本相同 (rg= 0.68)。LSS 与LBP 或LSRS 之间的遗传力与已报道的不同部位的肌肉骨骼疼痛的遗传力相似。例如,颈部疼痛和髋关节疼痛具有相似遗传力 (rg= 0.83),颈部疼痛和膝关节疼痛具有相似遗传力 (rg= 0.64),但全基因组研究发现LSRS 和LBP 的遗传力关联性更强。综上所述,研究发现的易感突变位点与疼痛基因组学的研究结果一致,即遗传因素在疼痛表型分类发挥重要决定作用,特定的疼痛表型对应特定的遗传因素。

本研究存在一定局限性。首先LSRS 和LSS 临床诊断代码的差异。其中LSRS 或LSS 的诊断可通过影像学表现(如腰椎间盘突出或腰椎管狭窄),也可以通过该疾病的临床综合征诊断。因此脊柱疾病的分类越具体将直接影响研究结果的可靠性。本项全基因组研究发现的特定易感突变基因位点不一定是致病突变基因,仅代表增加该疾病风险的可能。研究发现的位于基因GFPT1,NFU1和AAK1区域与LSS 相关的突变位点在多种组织类型的基因GFPT1和NFU1功能性eQTL 表达中发挥多种功能效应。尽管未发现AAK1 基因表达与LSS 有显著相关性,可能是由于组织范围有限(不包括LSS 中央椎管的形态学特征)或样本量有限影响。目前,虽研究已证实AAK1,GFPT1和NFU1中的突变位点与LSS 密切相关,但具体作用机制仍未可知,推测可能是相邻基因的差异表达产生一定的功能效应。本研究结果可作为LSS 遗传机制探索的开端,未来仍需进一步探索验证突变位点与疾病的相关性。尽管本研究发现的基因突变位点与LSS 的关联性较小(rs13427243: G > A,初次发现时关联性为 10%,验证阶段为11%),随着对基因突变位点的进一步深入研究,预计遗传效力会有所增加。本研究纳入的对象为欧洲人群,研究结果具有一定种族局限性。

猜你喜欢

表型位点基因组
基于电子病历的表型分析方法及应用综述
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
DNA脱碱基位点的检测方法及其生物学研究进展
“植物界大熊猫”完整基因组图谱首次发布
基于衰老相关分泌表型理论探讨老年慢性阻塞性肺疾病患者衰弱发生机制
我国小麦基因组编辑抗病育种取得突破
高通量植物表型平台综述
第一代基因组设计的杂交马铃薯问世
牛参考基因组中发现被忽视基因
作物表型组学和高通量表型技术最新进展(2020.2.2 Plant Biotechnology Journal)