APP下载

基于lncRNA相关ceRNA网络预测冠心病血瘀证分子调控轴

2022-12-28王念王博冷媛媛祁轶斐李兵张莹莹雷蕾王忠刘骏

中国中医药信息杂志 2022年12期
关键词:靶标血瘀调控

王念,王博,冷媛媛,祁轶斐,李兵,张莹莹,雷蕾,王忠,刘骏

1.中国中医科学院中医临床基础医学研究所,北京 100700;2.中国中医科学院中药研究所,北京 100700;3.北京中医药大学东直门医院,北京 100700;4.中国中医科学院中医药信息研究所,北京 100700

冠心病是影响全球人口的主要心血管疾病之一[1],属中医学“胸痹”范畴,依据劳倦、寒邪、情志、饮食等致病因素,可以辨为寒凝、痰浊、阴虚、阳虚、血瘀等不同证候[2]。现代研究表明,血瘀证患者冠脉病变及血管内皮损伤程度较其他证型重,不仅因为该病的发病关键在于心血瘀阻,也因为其他证型的冠心病在病情进展的过程中同样会出现血瘀的病理特征,即血液凝滞等现象[2]。竞争性内源RNA(competing endogenous RNA,ceRNA)包括信使RNA(mRNA)、长链非编码RNA(lncRNA)、环状RNA(cirRNA)、假基因等[3],能够通过应答元件(MREs)相互作用,构成ceRNA调控网络,如微小RNA(miRNA)能够结合mRNA导致基因沉默,ceRNA可以通过MREs与miRNA竞争性结合而解除其对基因的抑制作用,ceRNA调控机制存在于冠心病发生发展过程中。

中医证候生物学机制是目前研究的热点,但基于ceRNA调控网络的研究仍然缺乏,网络科学的进步促进了生物网络中发现重要生物标志物及治疗靶标的过程,能够帮助分析复杂的疾病过程,以功能模块的信息流变化体现生物反应,更加全面理解多种生物分子之间的相互作用[4]。模块药理学是在系统生物学指导下,对复杂生物网络进行模块化分析,能够度量和整合模块对网络干预的特征[5]。从模块药理学角度分析ceRNA网络是研究证候生物学机制的新思路,从而揭示血瘀证的复杂性和系统性。本研究通过构建lncRNA相关ceRNA网络,即lncRNA-miRNA-mRNA网络,利用公共数据库发表的冠心病血瘀证相关基因,以模块药理学方法寻找网络中的关键节点,通过文献预测关键节点之间的调控关系,形成调控轴,并进行序列验证,从转录组学水平揭示冠心病血瘀证的潜在机制。

1 资料和方法

1.1 数据来源

1.1.1 冠心病相关基因

以“coronary artery disease”为关键词,分别通过HMDD3.2(http://www.cuilab.cn/hmdd/)[6-8]查找冠心病相关miRNA,通过DisGeNET7.0[9](https://www.disgenet.org/)、OMIM(http://www.omim.org/)、GeneCards 5.1(https://www.genecards.org/)、TTD[10](http://db.idrblab.net/ttd/)数据库查找冠心病相关mRNA,通过lncRNADisease2.0(http://www.rnanut.net/lncrnadisease/index.php/)数据库查找冠心病相关lncRNA。

1.1.2 血瘀证相关基因

以中国中西医结合学会活血化瘀专业委员会制定的《冠心病血瘀证诊断标准》[11]的主要指标及次要指标为依据,选择血瘀证检索词。以“chest pain”(胸痛)、“oppression in chest”(胸闷)、“ecchymosis on tongue”(舌生瘀斑)、“palpitation”(心悸)为关键词[12],通过OMIM数据库检索血瘀证症状表型的相关mRNA。

1.2 冠心病血瘀证相关基因获取

比较上述方法获取的冠心病相关mRNA与血瘀证相关mRNA,以二者相同基因作为冠心病血瘀证基因。

1.3 ceRNA网络构建与拓扑结构分析

利用starBase3.0[13](http://starbase.sysu.edu.cn/)平台的miRNA-target interactions模块、miRNAlncRNA interactions模块、lncRNA-ceRNA interactions模块预测lncRNA-miRNA-mRNA之间的靶标关系,建立相互作用网络。

1.4 功能模块识别与优化

使用Cytoscape3.7.0软件clusterMaker插件中的3种算法MCODE(molecular complex detection)、马尔可夫聚类(Markov cluster,MCL)及GLay算法(均以默认参数)对上述整合的冠心病血瘀证ceRNA网络进行功能模块识别。为得到相对稳定可靠的结果,采用课题组前期提出的最小网络结构熵的方法[14]对以上3种模块划分方式进行比较,从而确定本研究所使用的模块识别方法。计算公式:。式中,N为网络中节点数目,Ii为第i个节点的重要度(节点的重要度定义为每个节点连接度占所有节点连接度总和的比例)[14]。

1.5 功能富集分析

利用WebGestalt[15](http://www.webgestalt.org/)分析平台对冠心病血瘀证ceRNA网络中的mRNA进行GO及KEGG通路富集分析。

1.6 基于文献预测调控轴

ceRNA调控轴预测条件:①miRNA、mRNA、lncRNA存在于同一模块中;②检索中文数据库中国知识资源总库(CNKI)、中文科技期刊数据库(维普网)、万方数据知识服务平台,以及英文数据库PubMed、Web of Science,检索时间范围为建库至2021年4月,中文检索词为miRNA、mRNA、lncRNA的基因symbol(如“UCA1”)与“冠心病”,英文检索词为基因symbol与“Coronary Artery Disease”“Coronary Heart Disease”。③筛选条件为单个节点冠心病生理病理相关文献数量≥5篇,报道lncRNA-miRNAmRNA三者之间关系(检索词为lncRNA and miRNA and mRNA,如“UCA1 and miR-1 and G6PD”)的文献数量≥5篇;如果没有直接阐述三者之间调控关系的文章,则选择分别报道lncRNA-miRNA、miRNAmRNA调控关系的文献(检索词为lncRNA and miRNA,miRNA and mRNA,如“UCA1 and miR-1”“miR-1 and G6PD”),纳入文献数量≥5篇的靶标关系对。④阅读文献全文,筛选符合标准的节点及调控关系,纳入进行组学检测并验证的临床研究性文献,记录文献中验证的靶标关系。

1.7 序列验证

MRE是ceRNA网络发生相互作用的关键因素,是构成调控作用的基础[16]。starBase平台中的miRNATarget版块及lncRNA-ceRNA版块能够分别基于CLIPsep对miRNA-mRNA、miRNA-lncRNA互作关系进行挖掘,并提供PITA、RNA22、miRmap、DIANAmicroT、miRanda、PicTar和TargetScan等数据库中的MRE序列比对。在miRNA-Target版块输入miRNA与mRNA的名称,以默认参数检索两者相互作用的MRE,在lncRNA-ceRNA版 块 中 输 入miRNA与lncRNA的名称,以默认参数检索相互作用的MRE,验证miRNA-lncRNA与miRNA-mRNA两者的MRE是否相同,从而确定调控轴能否存在。

2 结果

2.1 冠心病及血瘀证相关基因

以“coronary artery disease”为关键词在HMDD数据库检索得到73个冠心病相关miRNA;在DisGeNET、GeneCards、OMIM、TTD数据库分别检索得到1 709、6 998、1 038、21个mRNA,去除重复后共得到8 158个mRNA;在lncRNADisease数据库检索得到冠心病相关lncRNA 130个。通过OMIM数据库分别检索得到16(chest pain)、2 713(oppression in chest)、521(ecchymosis on tongue)、2 343(palpitation)个血瘀证相关mRNA,去除重复后共得到5 197个mRNA。

2.2 冠心病血瘀证相关基因

冠心病相关基因及血瘀证相关基因共有1 211个相同的mRNA,作为冠心病血瘀证相关基因。

2.3 ceRNA网络构建与拓扑结构分析

通过starBase筛选由HMDD数据库预测出的73个miRNA相关的mRNA及lncRNA,即冠心病相关基因之间所有的靶标关系对(miRNA-lncRNA,miRNAmRNA,lncRNA-mRNA)。HMDD数 据 库 未 对miRNA的“-3p”“-5p”端臂加以区分,starBase数据库对此加以区分,最终73个miRNA(不区分“-3p”“-5p”端臂)在starBase数据库中共有72个miRNA(区分“-3p”“-5p”端臂)实现预测。此外,在ceRNA网络构建过程中,补充了lncRNA-mRNA之间的靶标关系,使网络更加全面、稳定。

由72个miRNA预测共得到miRNA-mRNA靶标关系271 817对,miRNA-lncRNA靶标关系82 616对,lncRNA-mRNA靶标关系58 761对。筛选同时存在于冠心病血瘀证中的mRNA及miRNA-mRNA、lncRNAmRNA靶标关系中的mRNA,交集结果见图1。共有182个mRNA同时存在于以上三者之中,以此作为构建冠心病血瘀证ceRNA网络的mRNA,并在预测的靶标关系对中筛选与之有靶标关系的lncRNA、miRNA,得到72个miRNA、29个lncRNA。以上述步骤筛选出的182个mRNA、72个miRNA、29个lncRNA构 建ceRNA网络。通过Cytoscape3.7.0对网络进行可视化处理(见图2),并进行网络拓扑结构分析,包括节点、度、紧密度中心性、介数中心性以及平均最短路径长度等。该网络共有283个节点、4 990条边,网络中节点最大度值为154,其中有26个节点度值≥80。节点的拓扑参数见表1。

图2 冠心病血瘀证ceRNA网络

通过网络拓扑分析可以看出,lncRNANEAT1(核旁斑点组装转录本1)在网络中度值最大,表明与之相连的节点数最多,NEAT1在乳腺癌等妇科癌症中大量表达,其可通过抑制相应的miRNA或与调节蛋白相互作用促进肿瘤的发展,是一种重要的生物标志物,亦是有前景的治疗靶点[17]。在冠心病患者中,NEAT1通过激活miR-140-3p/MAPK1通路增加细胞活力并抑制冠心病细胞凋亡,能够作为冠心病的潜在治疗靶点[18]。度值≥80的节点中有23个节点是miRNA,这不仅反映miRNA与冠心病的关系密切,同时也在ceRNA网络中起到重要的连接作用。如hsa-miR-340-5p在冠心病患者的血小板中表达上调[19],hsa-miR-106-5p可作为炎症标志物、hsa-miR-137可作为细胞损伤标志物,帮助诊断不稳定型心绞痛患者心肌缺血并对缺血的严重程度进行分层[20]。

2.4 功能模块识别与优化

网络结构熵值能够有效刻画无尺度网络的无序性。从大网络中识别出功能模块的过程是系统从无序到有序的变化,是系统能量分布从均匀到不均匀的变化,是一个熵减的过程,且熵越小,系统越稳定。模块识别的最终目的是要找到一种稳定的模块化状态,这种状态具有最小的不确定性[21]。

分别计算MCODE、MCL、GLay模块划分的熵值,结果见表2。

表2 冠心病血瘀证ceRNA网络3种模块划分方法比较

根据熵值最低原则,选择MCODE作为模块划分方式。MCODE算法共识别出11个模块(节点数≥3),见图3。根据MCODE评分排序,最大模块有31个节点和107条边,评分7.133分;最小模块有4个节点和4条边,评分2.667分。

图3 MCODE划分出的冠心病血瘀证ceRNA网络11个模块

2.5 功能富集分析结果

GO注释包含生物过程(BP)、细胞组分(CC)、和分子功能(MF),对冠心病血瘀证ceRNA网络富集分析共识别出211个RNA,其中BP涉及生物调节、代谢、细胞增殖、细胞复制等过程,CC显示分布在20个细胞组分中,MF主要集中在蛋白质结合、离子束缚、核酸结合、核苷酸结合等功能。FDR<0.05的前10个条目见图4。KEGG分析显示冠心病血瘀证ceRNA网络富集到62条通路(FDR<0.05),集中在肿瘤、局部黏附、PI3K-Akt信号通路等方面,前10条通路见图5。

图4 冠心病血瘀证ceRNA网络mRNA的GO富集分析

图5 冠心病血瘀证ceRNA网络mRNA的KEGG通路富集分析

2.6 基于模块预测调控轴

模 块1、2、6、7同 时 包 含3种RNA,因 此lncRNA-miRNA-mRNA调控轴可能存在于以上4个模块中。对4个模块中的基因分别进行文献检索,基于5个数据库的检索结果发现,模块1、2、7的节点未在文献中发现冠心病生理病理相关的上下游调控关系,模块6中节点具有调控关系,且符合调控轴预测原则。模块1中节点PVT1、hsa-miR-370-5p、hsa-miR-16-5p、

hsa-miR-15b-5p、hsa-miR-23a-3p、TGFBR1、MTRR、MTHFR、OLR1、GCLC、APC、RAP1A均报道与冠心病生理相关,但并无文献报道节点之间的调控关系;模 块2中 节 点hsa-miR-130a-5p、CD46、CXCL12、CAV1、H19均报道与冠心病生理相关,但根据文献报道的调控关系与冠心病无关;模块7中节点HOTAIR、hsa-miR-19b-3p、hsa-miR-214-3p均报道与冠心病生理相关,但其之间存在的调控关系与冠心病生理病理无关。只有模块6中UCA1、miR-1、G6PD3个节点符合调控轴预测条件,其中UCA1冠心病生理病理相关文献报道5篇,miR-1文献报道44篇,G6PD文献报道5篇。UCA1-miR-1-G6PD三者之间相关关系的文献共报道17篇,与冠心病生理病理相关的文献5篇,符合调控轴预测要求,其中有4篇文献经过验证。该轴靶向关系体现如下:miR-1能够抑制G6PD的表达,导致心肌梗死、心肌缺血等冠状动脉疾病的发生,而UCA1能够通过解除miR-1的抑制恢复G6PD的正常表达。验证三者之间关系的文献报道见表3。

表3 UCA1-mir-1-G6PD与冠心病血瘀证实验验证

2.7 序列验证

MRE是RNA的重要组成部分,在ceRNA网络基因调控中发挥重要作用,具有相同的MRE的mRNA、lncRNA、miRNA存在ceRNA调控机制,而不具有相同MRE,则不能发生调控。StarBase数据库提示lncRNA UCA1、mRNA G6PD分别与miRNA miR-1具有共同的MRE(见图6),为通过网络筛选调控轴提供了生物学依据。

图6 冠心病血瘀证ceRNA网络MRE验证

3 讨论

中医证候宜使用复杂系统方法学探究其生物学基础,现有研究在质量和数量上均无法满足需求,其方法也尚未形成体系[26]。构建ceRNA网络,以模块药理学的方式挖掘证候的生物学基础是分析病证结合机制的新方法之一,目前已有多项研究通过构建无向的共表达网络[27]或有向的基因调控网络[28]、蛋白相互作用网络[29]等探讨证候与疾病的共同生物学机制,但基于构建的整体网络进行分析,难以直接找到其中的关键靶点及调控关系。模块药理学认为,复杂疾病的研究需要一种模块化的靶点研究模式,强调对复杂生物网络进行模块化分析,用于度量和整合药物干预网络的特征。其中,靶点-靶点相互作用及动态平衡规律不仅是影响模块化功能的关键结构因素,也是疾病影响因素扰动的体现[30]。本研究在探讨冠心病血瘀证生物学基础过程中,考虑到lncRNA能够直接作用于mRNA,补充了lncRNA与mRNA之间的相互作用关系,不仅丰富了ceRNA网络,且使网络结构在空间上更加稳定;对ceRNA网络进行功能模块划分,依据熵值法筛选模块划分的最佳方法,确保网络的有序性和功能性;利用功能模块筛选出潜在调控轴,能够基于已有的数据库实验数据快速筛选关键靶点及靶点之间的作用关系,为开展证候生物学机制研究提供新思路。

模块6涉及 的lncRNA UCA1、miRNA miR-1、mRNA G6PD临床报道较多。miR-1在心肌梗死患者中的表达水平显著高于非心肌梗死患者,在急性胸痛发作3 h内具有诊断价值,是心肌梗死预后的独立危险因素,此外还参与心肌缺血再灌注损伤的治疗过程中[31-32]。UCA1(尿路上皮癌相关蛋白1)能够通过MAPK通路减少心肌梗死患者由于缺血缺氧引起的细胞凋亡和损伤,在成年人心脏中特异性表达,心肌梗死患者中表达量显著降低[22-23,33]。G6PD参与冠状动脉和肺动脉收缩和舒张的调节,在冠心病中表达水平显著降低[34],且能作为冠心病诊断的关键基因[35]。三者之间存在密切的调节关系:G6PD抑制或敲低时,血管平滑肌细胞限制性收缩蛋白、心肌蛋白及miR-1的表达增加[24]。miR-1能够通过抗氧化网络的转录后修饰加重心脏氧化应激,其过表达时能够表现出较高的心肌细胞活性氧水平和对H2O2诱导的氧化应激的较低抵抗力,证实G6PD是miR-1转录后抑制的新型靶标[25]。

冠心病血瘀证ceRNA网络富集分析得到多条通路,如PI3K-Akt信号通路、ErbB信号通路、GnRH信号通路、P53信号通路、MAPK信号通路、雌激素信号通路等。活化的PI3K-Akt途径中,PI3K和Akt表达及磷酸化水平显著提高,可抑制磷酸酶和张力蛋白同源物对血管平滑肌细胞存活的抑制作用,使细胞增殖率增加,细胞凋亡水平降低,从而保护心肌细胞[36]。miRNA-26a-5p能够通过靶向PTEN激活PI3K-Akt通路,影响内皮细胞的增殖和凋亡[37]。动脉粥样硬化中上皮脂肪组织p53表达水平较高,能够通过mRNA和蛋白水平观察到Sirt-1和p53之间存在负相关,Sirt1-p53轴可能通过促进细胞凋亡参与动脉粥样硬化[38]。

除相关通路外,KEGG还富集到18条癌症相关通路,占富集通路总数的29%,考虑可能由于冠状动脉疾病和癌症通常通过共同的生物学途径和危险因素在同一患者体内发生[39],此外,也有通过生物信息学方式探讨乳腺癌与冠心病共享生物标志物的筛选,发现NLN、POSTN、MAPT、MYO6、MAP1B、FBXO31、KIT、PIK3R等18个mRNA可作为检测乳腺癌诱导冠心病的潜在标志物。模块1中的PVT1是新发现的致癌因子,参与胃癌、胆囊癌等多种癌症的发生过程,同时也能通过miR-128-3p-SP1-TGF-β1-Smad轴促进心房纤维化[40]。模块2中的H19在正常动脉中检测不到,但在损伤的血管和动脉粥样硬化病变后的内膜中高度表达[41],高表达H19会促进肝癌细胞的增殖,下调会抑制肿瘤细胞增殖[42]。同样,模块6中的UCA1不仅参与到UCA1-miR-1-G6PD轴,也能够通过miR-143/MYO6轴促进大肠癌的发生,且UCA1还能作为结直肠癌的治疗靶标[43]。

ceRNA调控理论代表了广泛的基因表达转录后的调控模式,筛选冠心病血瘀证相关lncRNA、miRNA、mRNA,构建基因间调控网络,从转录组学机制层面研究冠心病血瘀证物质基础和病理机制,可为中医证型相关研究提供一定的科学基础。功能模块识别很好地解决了生物网络过于复杂难以分析的问题。通过构建网络,能够更高效整合人体和疾病生物分子层面的数据,从空间结构层面找到关键调控节点,有助于阐释疾病发生的机制,预测疾病的发生与发展,为早筛早检早治疗提供可能。本研究在构建冠心病血瘀证相关ceRNA网络时,补充了lncRNA与mRNA之间的联系,并通过模块药理学理论划分模块,从模块中筛选潜在lncRNA-miRNA-mRNA调控轴,可在一定程度上为挖掘冠心病血瘀证潜在的生物学基础提供重要参考。

猜你喜欢

靶标血瘀调控
张淑芬辨治血瘀型崩漏的临床经验
话说血瘀证
“百灵”一号超音速大机动靶标
如何调控困意
经济稳中有进 调控托而不举
纳米除草剂和靶标生物的相互作用
血瘀体质知多少
复杂场景中航天器靶标的快速识别
顺势而导 灵活调控
前列腺特异性膜抗原为靶标的放射免疫治疗进展