APP下载

国外临床数据挖掘研究热点的文献计量学分析

2015-03-13钟秀梅

医学信息学杂志 2015年5期
关键词:数据挖掘聚类矩阵

钟秀梅 崔 雷

(中国医科大学医学信息学系 沈阳 110013)



国外临床数据挖掘研究热点的文献计量学分析

钟秀梅 崔 雷

(中国医科大学医学信息学系 沈阳 110013)

为了解近年国外临床数据挖掘领域的研究热点,以Web of Science收录的文献为研究对象,采用文献计量学方法对“最新高被引文献-施引文献”引文网络进行聚类和分析,总结出国外临床数据挖掘的研究热点,以期对我国相关领域研究有所借鉴。

临床数据挖掘;研究热点;文献计量学

1 引言

数据挖掘是在大型数据存储库中智能地发现有用信息的技术,经过近些年的快速发展,如今已在商务领域和互联网领域得到了很好的应用,逐步扩展向更多领域。紧跟大数据时代的步伐,医疗领域数据的数量和质量不断攀升(尤其是电子病历数据),这些数据蕴涵着丰富的信息,发掘潜藏于海量数据之中的知识和规律,将会极大地推动医学创新的开展,因此越来越多的学者对临床数据的挖掘研究产生了浓厚的兴趣。临床数据挖掘是将数据挖掘的理念和方法运用于临床数据,包括对临床数据的概念化、信息提取、数据分析及结果解读等,以期获取和补充医药学领域知识,支持知识库构建、临床决策和临床实践[1]。为了解近年国外临床数据挖掘领域的研究热点,本文对国外研究学者在该领域发表的文献进行分析,以认识和把握该领域的科研状况。

2 资料与方法

2.1 样本数据获取

在Web of Science数据库中进行检索,“临床数据挖掘”相关检索词,见表1。检索策略:主题字段=“临床数据”相关检索词 AND “数据挖掘”相关检索词,限定文献类型为“Article”,限定时间为2000-2014年,检索数据库SCI-Expanded、CCR-Expanded、IC。数据截止至2014年7月15日。共检索到3 405条记录,下载其全记录与参考引文格式数据作为样本集A。

按系统抽样法,将3 405条记录顺序分为7份(前6份每份500条,后1份405条),各抽取50条记录作为样本集Bi,i∈{1,2,3,4,5,6,7}。对各样本集Bi进行人工评判,手工检验查准率(查准率即检出的相关文献占总检出数的百分比),总结误匹配的原因。除数据库检索系统原因外,根据其他误匹配原因,手工筛除样本集A的文献记录。最后,剩余3 356条记录,形成研究样本集C。

2.2 引文网络构建

运用BICOMB2.1[2],对研究样本集C进行数据处理和特征提取。步骤:(1)导入数据并提取和统计引文。(2)截取被引频次≥11次的引文作为高被引文献,获得131×883“高被引文献-施引文献”矩阵a。(3)以2008年后发表的引文作为最新引文,删除矩阵a中2008年以前的高被引文献数据,随后删除原矩阵中施引总次数为0的施引文献数据,获得49×315“最新高被引文献-施引文献”矩阵b。

2.3 引文网络聚类

运用gCLUTO1.0[3],对矩阵b进行聚类分析。步骤:(1)导入数据并聚类:重复二分法、余弦相似函数、I2标准函数。(2)调整聚类类群数,选择类内相似度(Isim)较高而类间相似度(Esim)较低的聚类结果。(3)文献内容较基础或较综合时,往往会引用多方面内容,在聚类结果中的表现是:以高描述度文献和高区分度文献出现在多个类群中,进而降低类内相似性,提高类间相似性,即削弱各类的特异性。为此本研究提出,若同一施引文献在一半以上类群的高描述度文献或高区分度文献中出现,则视为基础性或综合性施引文献;以此为矩阵精简条件,将这类文献从矩阵b中删除。(4)对矩阵c循环执行步骤(1)~(3),至无基础性或综合性施引文献为止。(5)最终为49×312矩阵c聚类。其中,高描述度文献是指使各个类群类内相似性较高的特征性施引文献;高区分度文献是指使各个类群类间差异度较高的特征性施引文献。

2.4 引文网络分析

根据聚类结果,以最新高被引论文为临床数据挖掘领域的知识基础,将高描述度及高区分度的施引文献作为该领域的研究前沿,总结其研究主旨,进而获得领域内研究热点。

3 结果与分析

3.1 数据有效性检验

检验各样本集Bi的查准率,结果分别为98%(49/50)、92%(46/50)、96%(48/50)、100%(50/50)、98%(49/50)、100%(50/50)、98%(49/50),均值为97.42%(341/350)。因此,检索结果具有较高查准率。分析影响查准率的原因包括:(1)数据库检索系统错误,在所有错误中占比为37.5%(3/8)。(2)医学意义上的“PACS”与其他缩写意义的误匹配,在所有错误中占比为62.5%(5/8)。故剔除“PACS”误匹配文献条目,形成新样本集C用于研究是较为有效的。此外,在各样本集Bi中发现缩写词均会同全称一并出现在摘要中,故以全称检索医院信息系统(HIS)等的相关文献是可行的。

3.2 矩阵精简条件合理性探查

本研究以“同一施引文献在一半以上类群的高描述度文献或高区分度文献中出现,视为基础性或综合性施引文献,将这类文献从矩阵b中删除”为矩阵精简条件。结果显示满足此条件的有3篇。了解具体内容后发现,其主题或基础、或宏观、或综合,广泛涉及临床数据挖掘的各方面。此结果说明,本研究采取的矩阵精简条件是合理的。

3.3 引文网络聚类

以“2008年后发表且样本集C中被引频次>11次”为筛选条件,共获得49篇最新高被引文献。以这49篇最新高被引文献为基础,构建出矩阵c并进行聚类,最终聚为6类,其结果见表2、图1。

表2 49×312矩阵c聚类情况

注:RPHC为最新高被引文献;D&D为高描述度文献和高区分度文献。

图1 49×312矩阵c聚类结果 注:a图中,山丘的高度越高代表类内相似性越高,体积越大代表类群包含对象越多。

3.4 引文网络分析

3.4.1 概述 引文网络聚类分析结果显示近年该领域研究分为6个方向,见表3。

表3 近年国外临床数据挖掘领域6大研究热点

3.4.2 增强临床数据挖掘样本的可获取性和可用性 美国是卫生信息技术(Health Information Technology,HIT)发展的前沿阵地,代表着电子病历(Electronic Medical Records, EMR)推广与使用的先进水平。DesRoches等[4]和Jha等[5]分别在医师个体水平和医院水平调查了美国EMR系统的应用现状,其结果表明功能不齐全、互操作性不好及技术支持人员不够是阻碍其应用的基本原因,直接影响用户接受度和满意度,也影响EMR使用的利弊比较和书写质量,进而造成临床数据挖掘样本获取不易、质量不高。2010年美国提出《卫生信息技术促进经济和临床健康法案》(Health Informatiom Technology for Economic and Clinical Health,HITECH)并施行,以期促进HIT的全面推广以及EMR的格式规范化[6-7]。随着HITECH的实施与推进,美国公众逐渐认可EMR系统的使用,认为其使用益处大于隐私风险,这更加激励研究者对HIT的完善,进而提高临床数据挖掘样本的可获取性和可用性[8-12]。

3.4.3 自然语言处理技术作为临床数据挖掘工具的方法学研究 临床数据包含大量自由文本,如临床医嘱、出院小结等,因此自然语言处理(Natural Language Processing, NLP)技术成为临床数据挖掘的必要工具。对临床文本这一特定领域信息载体进行分析,需将NLP一般方法进行领域具象化,即要具体适应特定领域,如MetaMap、生物学信息与临床信息整合(i2b2)工作台、cTAKES、ConText算法及特定用于结肠镜检查信息提取的算法等都是用于临床文本处理的NLP工具[13-20]。这些NLP工具大多采用基于规则的机器学习型算法[16-20]。此外这些工具在命名体识别上表现较好,但在否定识别、词义消歧以及时序判定上仍有待提高[13,16,18,21]。

3.4.4 自然语言处理技术作为临床数据挖掘工具的可行性研究 基于临床自由文本的NLP工具日渐成熟,将NLP用于临床数据挖掘的应用研究也日益增多。从i2b2工作台的应用中可窥其一二:2008-2013年,有多位学者致力于从临床文本中自动识别和分析患者吸烟状况[22-23]、肥胖症及其并发症[24]、手术后并发症[25]等信息,也有学者致力于研究受保护健康信息的自动识别和自动去标识化(即去除患者身份信息,以防患者信息泄露)[26-28]。由此看出NLP技术作为临床数据挖掘工具的可行性研究主要处在识别阶段,而在关系提取上的研究相对较少。此外,Chapman等[29]总结NLP处理临床文本的障碍,Fan等[30]提出临床文本句法解析不适当时的指导思想。

3.4.5 面向遗传学关联发现和表型关联发现的临床数据挖掘研究 遗传学数据不属于临床数据,将患者的临床数据和遗传学数据结合起来进行挖掘是当前转化医学研究的一个突破口。2007年美国启动电子病历与基因组学网络项目[31],旨在“结合生物资料库与EMR系统进行大规模、高通量的遗传学研究”。自此一大批研究[32-39]致力于结合EMR数据和大型生物资料库进行遗传学关联的分析与发现。早前重在找寻或建立合适的可与EMR相链接的生物资料库[31-32]。近年主要转向以下3方面研究:(1)结合EMR与生物资料库进行全基因组关联研究(GWAS)[31,33-37,39-40]。(2)结合EMR与生物资料库,进行全表型组关联研究(PheWAS),也称“反GWAS”[41-43]。(3)结合EMR与药学及药物基因组学,构建用药适应症资源库[44-45]。这些研究在时间上是相互交叉的,在理念上也存在相互继承和借鉴。

3.4.6 面向用药信息提取的临床数据挖掘研究 药物治疗是医疗活动的重要组成部分,在疾病诊疗过程中具有重要作用。早前,多位学者分别运用BioMedLEE和MedLEE系统、商业化NLP工具、MedEx系统、SecTag算法等工具从临床文本中自动提取用药信息,以期探索疾病的用药知识,进而构建疾病用药知识库[46-49]。近年i2b2项目组织了20个团队开展临床文本的用药信息提取工具方面的研究,取得一定成果。研发出的这些工具在识别和提取药品名称、用药剂量、用药途径和用药频率上均具有较好表现,在识别和提取用药持续时间和用药原因上却表现不佳[50-52]。但EMR在用药信息提取上仍具有巨大潜力,如Wilke等[44]指出EMR在药物基因组学中扮演着新的重要角色。

3.4.7 面向药品安全性信号检测的临床数据挖掘研究 2004年后i2b2项目[53]、欧盟药品不良反应监测(EU-ADR)项目[54]、观察医疗结果合作组织项目[55]等相继启动。随后欧美各国组织大量研究者参与,其中应用电子健康档案(Electronic Health Records,EHR)或EMR挖掘药品安全性信号便是其研究方向之一。已有研究证明,将其作为除药品不良事件自发报告外的另一补充数据源,用于药物警戒是可行的[56-57]。近年许多研究人员采用不同的信息平台、自然语言处理工具、药物领域本体和知识库、挖掘模式,将其用于“药品-不良事件”间关联和“药物间相互作用-不良事件”间关联的挖掘[58-59];也有研究人员将自发报告与EHR联合使用进行药品安全信号挖掘[60]。但EHR或EMR信息的错综复杂性,使这类研究不可避免受混杂因素影响,最近(2014年)的研究开始寻找应对办法,以控制混杂因素对利用EHR检测药品不良反应的影响[61]。

4 结语

本研究特色与创新在于:(1)抽取样本进行误匹配调查和修正。(2)以最新高被引论文构建引文网络。(3)将出现在多个类群中的特征性施引文献作为基础性或综合性文献并删除。本研究结果显示,2008年以来临床数据挖掘的发展总体呈现如下特点:(1)挖掘样本以文本为主。主要包括EMR、EHR、生物医学文献数据库中的文本信息,但同时也注重与其他类型信息的结合,如基因组数据以及药品不良事件自发申报系统中信息。(2)挖掘工具以NLP工具为主。由于样本主要是文本,因此首要工具是NLP工具。(3)面向领域以药物为主。主要包括用药信息提取以及药品不良事件和药物间相互信号发现等。

在对临床数据挖掘研究热点的分析中,笔者发现以领域本体、词表或特征词汇为基础,借助NLP等工具,识别和提取临床信息,以发现潜在信息或关联,是临床数据挖掘的常规方法。研究和深入理解临床各领域的表达特点对临床数据挖掘是非常重要的。为此希望能就此展开相关研究,运用已有本体和词表或构建新的相关本体或词表,进行临床信息识别和提取。

1 Epstein I.Clinical Data Mining:integrating practice and research[M].USA:Oxford University Press,2009.

2 崔雷,刘伟,闫雷,等.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008,(8):70-75.

3 Rasmussen M,Karypis G.gCLUTO-an interactive clustering, visualization, and analysis system[EB/OL].[2014-07-28].http://glaros.dtc.umn.edu/gkhome/node/174.

4 DesRoches CM,Campbell EG,Rao SR,et al.Electronic Health Records in Ambulatory Care——a national survey of physicians[J].N Engl J Med,2008,359(1):50-60.

5 Jha AK,DesRoches CM,Campbell EG,et al.Use of Electronic Health Records in U.S. Hospitals[J].N Engl J Med,2009,360(16):1628-1638.

6 Blumenthal D,Tavenner M.The “Meaningful Use” Regulation for Electronic Health Records[J].N Engl J Med,2010,363(6):501-504.

7 Blumenthal D.Launching HITECH[J].N Engl J Med,2010,362(5):382-385.

8 Kho AN,Pacheco JA,Peissig PL,et al.Electronic Medical Records for Genetic Research: results of the eMERGE consortium[J].Sci Transl Med,2011,3(79):79re1.

9 Gaylin DS,Moiduddin A,Mohamoud S,et al.Public Attitudes about Health Information Technology, and Its Relationship to Health Care Quality, Costs, and Privacy[J].Health Serv Res,2011,46(3):920-938.

10 Zhang M,Shubina M,Morrison F,et al.Following the Money: copy-paste of lifestyle counseling documentation and provider billing[J].BMC Health Serv Res,2013,(13):377.

11 Blavin FE,Buntin MJ,Friedman CP.Alternative Measures of Electronic Health Record Adoption Among Hospitals[J].Am J Manag Care,2010,16(12S HIT):293-301.

12 Frimpong JA,Jackson BE,Stewart LM,et al.Health Information Technology Capacity at Federally Qualified Health Centers: a mechanism for improving quality of care[J].BMC Health Serv Res,2013,(13):35.

13 Aronson AR,Lang FM.An Overview of MetaMap: historical perspective and recent advances[J].J Am Med Inform Assoc,2010,17(3):229-236.

14 Uzuner O,Solti I,Cadag E.Extracting Medication Information from Clinical Text[J].J Am Med Inform Assoc,2010,17(5):514-518.

15 Patrick J,Li M.High Accuracy Information Extraction of Medication Information from Clinical Notes: 2009 i2b2 medication extraction challenge[J].J Am Med Inform Assoc,2010,17(5):524-527.

16 de Bruijn B,Cherry C,Kiritchenko S,et al.Machine-learned Solutions for Three Stages of Clinical Information Extraction: the state of the art at i2b2 2010[J].J Am Med Inform Assoc,2011,18(5):557-562.

17 Savova GK,Masanz JJ,Ogren PV,et al.Mayo Clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications[J].J Am Med Inform Assoc, 2010,17(5):507-513.

18 Harkema H,Dowling JN,Thornblade T,et al.ConText: an algorithm for determining negation, experiencer, and temporal status from clinical reports[J].J Biomed Inform,2009,42(5):839-851.

19 Denny JC,Peterson JF,Choma NN,et al.Extracting Timing and Status Descriptors for Colonoscopy Testing from Electronic Medical Records[J].J Am Med Inform Assoc,2010,17(4):383-388.

20 Harkema H,Chapman WW,Saul M,et al.Developing a Natural Language Processing Application for Measuring the Quality of Colonoscopy Procedures[J].J Am Med Inform Assoc,2011,18(S1):150-156.

21 Garla VN,Brandt C.Knowledge-based Biomedical Word Sense Disambiguation: an evaluation and application to clinical document classification[J].J Am Med Inform Assoc,2013,20(5):882-886.

22 Uzuner O,Goldstein I,Luo Y,et al.Identifying Patient Smoking Status from Medical Discharge Records[J].J Am Med Inform Assoc,2008,15(1):14-24.

23 Savova GK,Ogren PV,Duffy PH,et al.Mayo Clinic NLP System for Patient Smoking Status Identification[J].J Am Med Inform Assoc,2008,15(1):25-28.

24 Uzuner O.Recognizing Obesity and Comorbidities in Sparse Data[J].J Am Med Inform Assoc,2009,16(4):561-570.

25 Murff HJ,FitzHenry F,Matheny ME,et al.Automated Identification of Postoperative Complications within an Electronic Medical Record Using Natural Language Processing[J].J Am Med Assoc,2011,306(8):848-855.

26 Ferrández O,South BR,Shen S,et al.Evaluating Current Automatic De-identification Methods with Veteran's Health Administration Clinical Documents[J].BMC Med Res Methodol,2012,(12):109.

27 Neamatullah I,Douglass MM,Lehman LW,et al.Automated De-identification of Free-text Medical Records[J].BMC Med Inform Decis Mak,2008,(8):32.

28 McMurry AJ,Fitch B,Savova G,et al.Improved De-identification of Physician Notes Through Integrative Modeling of Both Public and Private Medical Text[J].BMC Med Inform Decis Mak,2013,(13):112.

29 Chapman WW,Nadkarni PM,Hirschman L,et al.Overcoming Barriers to NLP for Clinical Text: the role of shared tasks and the need for additional creative solutions[J].J Am Med Inform Assoc,2011,18(5):540-543.

30 Fan JW,Yang EW,Jiang M,et al.Syntactic Parsing of Clinical Text: guideline and corpus development with handling ill-formed sentences[J].J Am Med Inform Assoc,2013,20(6):1168-1177.

31 McCarty CA,Chisholm RL,Chute CG,et al.The eMERGE Network: a consortium of biorepositories linked to electronic medical records data for conducting genomic studies[J].BMC Med Genomics,2011,26:4-13.

32 Roden DM,Pulley JM,Basford MA,et al.Development of a Large-scale De-identified DNA Biobank to Enable Personalized Medicine[J].Clin Pharmacol Ther,2008,84(3):362-369.

33 Ritchie MD,Denny JC,Crawford DC,et al.Robust Replication of Genotype-phenotype Associations Across Multiple Diseases in an Electronic Medical Record[J].Am J Hum Genet,2010,86(4):560-572.

34 Kullo IJ, Fan J,Pathak J,et al.Leveraging Informatics for Genetic Studies: use of the electronic medical record to enable a genome-wide association study of peripheral arterial disease[J]. J Am Med Inform Assoc,2010,17(5):568-574.

35 Kohane IS.Using Electronic Health Records to Drive Discovery in Disease Genomics[J].Nat Rev Genet,2011,12(6):417-428.

36 Denny JC, Ritchie MD, Crawford DC,et al.Identification of Genomic Predictors of Atrioventricular Conduction: using electronic medical records as a tool for genome science[J].Circulation,2010,122(20):2016-2021.

37 Kho AN,Hayes MG,Rasmussen-Torvik L,et al.Use of Diverse Electronic Medical Record Systems to Identify Genetic Risk for Type 2 Diabetes within a Genome-wide Association Study[J].J Am Med Inform Assoc,2012,19(2):212-218.

38 Carroll RJ,Thompson WK,Eyler AE,et al.Portability of an Algorithm to Identify Rheumatoid Arthritis in Electronic Health Records[J].J Am Med Inform Assoc,2012,19(e1):162-169.

39 Kullo IJ,Ding K,Jouni H,A Genome-wide Association Study of Red Blood Cell Traits Using he Electronic Medical Record[J].PLoS One,2010,5(9):13011.

40 Denny JC,Crawford DC,Ritchie MD,et al.Variants Near FOXE1 are Associated with Hypothyroidism and Other Thyroid Conditions: using electronic medical records for genome- and phenome-wide studies[J].Am J Hum Genet,2011,89(4):529-542.

41 Denny JC,Ritchie MD,Basford MA,et al.PheWAS: demonstrating the feasibility of a phenome-wide scan to discover gene-disease associations[J].Bioinformatics,2010,26(9):1205-1210.

42 Heatherly RD,Loukides G,Denny JC,et al.Enabling Genomic-phenomic Association Discovery Without Sacrificing Anonymity[J].PLoS One,2013,8(2):53875.

43 Denny JC,Bastarache L,Ritchie MD,et al.Systematic Comparison of Phenome-wide Association Study of Electronic Medical Record Data and Genome-wide Association Study Data[J].Nat Biotechnol,2013,31(12):1102-1110.

44 Wilke RA,Xu H,Denny JC,et al.The Emerging Role of Electronic Medical Records in Pharmacogenomics[J].Clin Pharmacol Ther,2011,89(3):379-386.

45 Wei WQ,Cronin RM,Xu H,et al.Development and Evaluation of an Ensemble Resource Linking Medications to Their Indications[J].J Am Med Inform Assoc, 2013,20(5):954-961.

46 Chen ES,Hripcsak G,Xu H,et al.Automated Acquisition of Disease Drug Knowledge from Biomedical and Clinical Documents: an initial study[J].J Am Med Inform Assoc,2008,15(1):87-98.

47 Jagannathan V,Mullett CJ,Arbogast JG,et al.Assessment of Commercial NLP Engines for Medication Information Extraction from Dictated Clinical Notes[J].Int J Med Inform,2009,78(4):284-291.

48 Xu H,Stenner SP,Doan S,et al.MedEx: a medication information extraction system for clinical narratives[J].J Am Med Inform Assoc,2010,17(1):19-24.

49 Denny JC,Spickard A,Johnson KB,et al.Evaluation of a method to identify and categorize section headers in clinical documents[J].J Am Med Inform Assoc,2009,16(6):806-815.

50 Doan S,Bastarache L,Klimkowski S,et al.Integrating Existing Natural Language Processing Tools for Medication Extraction from Discharge Summaries[J].J Am Med Inform Assoc,2010,17(5):528-531.

51 Hamon T,Grabar N.Linguistic Approach for Identification of Medication Names and Related Information in Clinical Narratives[J].J Am Med Inform Assoc,2010,17(5):549-554.

52 Deléger L,Grouin C,Zweigenbaum P.Extracting Medical Information from Narrative Patient Records: the case of medication-related information[J].J Am Med Inform Assoc,2010,17(5):555-558.

53 Murphy SN,Weber G,Mendis M,et al.Serving the Enterprise and Beyond with Informatics for Integrating Biology and the Bedside (i2b2)[J].J Am Med Inform Assoc,2010,17(2):124-130.

54 Trifirò G,Pariente A,Coloma PM,et al.Data Mining on Electronic Health Record Databases for Signal Detection in Pharmacovigilance: which events to monitor?[J]Pharmacoepidemiol Drug Saf,2009,18(12):1176-1184.

55 Stang PE,Ryan PB,Racoosin JA,et al.Advancing the Science for Active Surveillance: rationale and design for the observational medical outcomes partnership[J].Ann Intern Med,2010,153(9):600-606.

56 Wang X,Hripcsak G,Markatou M,et al.Active Computerized Pharmacovigilance Using Natural Language Processing, Statistics, and Electronic Health Records: a feasibility study[J].J Am Med Inform Assoc,2009,16(3):328-337.

57 Tatonetti NP,Denny JC,Murphy SN,et al.Detecting Drug Interactions from Adverse-event Reports: interaction between paroxetine and pravastatin increases blood glucose levels[J].Clin Pharmacol Ther,2011,90(1):133-142.

58 Sittig DF,Hazlehurst BL,Brown J,et al.A Survey of Informatics Platforms that Enable Distributed Comparative Effectiveness Research Using Multi-institutional Heterogenous clinical Data[J].Med Care,2012,(50S):S49-59.

59 Haerian K,Varn D,Vaidya S,et al.Detection of Pharmacovigilance-related Adverse Events Using Electronic Health Records and Automated Methods[J].Clin Pharmacol Ther,2012,92(2):228-234.

60 Harpaz R,Vilar S,Dumouchel W,et al.Combing signals from Spontaneous Reports and Electronic Health Records for Detection of Adverse drug Reactions[J].J Am Med Inform Assoc,2013,20(3):413-419.

61 Li Y,Salmasian H,Vilar S,et al.A Method for Controlling Complex Confounding Effects in the Detection of Adverse Drug Reactions Vsing Electronic Health Records[J].J Am Med Inform Assoc,2014,21(2):308-314.

Bibliometrics Analysis on the Hot Spots of Foreign Clinical Data Mining Research

ZHONGXiu-mei,CUILei,

DepartmentofMedicalInformatics,ChinaMedicalUniversity,Shenyang110013,China

In order to find out the hot spots of foreign clinical data mining research in recent years, the paper carries out bibliometric analysis on the literatures included in Web of Science, “the latest high cited literatures-citing literature” citation network is clustered and analyzed, the research hot spots of foreign clinical data mining are summarized, so as to provide references for related research in China.

Clinical data mining; Research hot spots; Bibliometrics

2014-12-31

钟秀梅,在读硕士研究生,发表论文2篇;通讯作者:崔雷,教授,博士生导师。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2015.05.012

猜你喜欢

数据挖掘聚类矩阵
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
初等行变换与初等列变换并用求逆矩阵
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
矩阵
矩阵
矩阵