APP下载

原发骨肿瘤流行病学数据库的建立与使用

2015-12-01单华超徐海荣李远牛晓辉

中国骨与关节杂志 2015年9期
关键词:数据库系统流行病学软骨

单华超 徐海荣 李远 牛晓辉

原发骨肿瘤流行病学数据库的建立与使用

单华超 徐海荣 李远 牛晓辉

目的 研究原发骨肿瘤流行病学在线数据库的建立和使用方法。方法 原始资料来自于北京积水潭医院骨与软组织肿瘤数据库共 14 617 个骨与软组织肿瘤病例,选择其中 9200 例原发骨肿瘤,提取年龄、性别、部位和诊断作为参数,数据库系统采用 Word Press 开源系统,网页基于 PHP 语言,数据存储是基于 MySQL 数据库系统。结果 建立了原发骨肿瘤流行病学在线数据库系统 ( http://www.sarcoma-jst.org ),包含4 个搜索模块,设计按诊断、按年龄、按部位 3 个单参数搜索模块,以及按年龄、部位、性别和诊断 4 个参数组合的综合搜索模块。结论 本数据库可以为骨肿瘤相关工作者提供一个免费实用的流行病学研究工具。本研究描述的方法也可以给建立其它类似数据库提供借鉴。

骨肿瘤;流行病学;数据库 ( 主题 );联机系统;骨肿瘤,原发性

原发骨肿瘤虽然种类比较多,但非常罕见,年发病率仅约 9 / 100 万,仅为乳腺癌这一单一恶性肿瘤的 1 / 80[1]。同时,由于其临床表现和影像学表现也缺乏特异性,因此,即使是骨肿瘤专科大夫,想单纯依靠影像学表现,获得准确的诊断也并不容易。但是,原发骨肿瘤也有其自身的特点,不同的肿瘤有自身的好发年龄、好发性别及好发部位[2-3]。例如,就好发年龄而言,在 10~20 岁年龄段,良性肿瘤最常见的是骨软骨瘤,而恶性肿瘤最常见的是骨肉瘤,40 岁以上年龄段,软骨肉瘤、骨髓瘤和淋巴瘤的发病率要明显高于 40 岁以内[4]。

在实际临床工作中,医生往往需要结合流行病学特点、临床表现和影像学表现进行综合分析,以获得诊断和鉴别诊断的初步信息,再行病理学检查,最后综合分析临床、影像和病理表现,获得最终诊断[5-6]。到目前为止,还没有理想的原发骨肿瘤流行病学数据库查询系统。本研究的目的是:描述如何建立一个免费的在线原发骨肿瘤数据库网站,并着重介绍其使用方法。

材料与方法

北京积水潭医院骨肿瘤科拥有独立的骨与软组织肿瘤数据库,从 1973 年至 2012 年,共有 14 617个病例,其中原发骨肿瘤有 9200 例,原始数据包括患者入院时的年龄、性别等人口统计学信息,以及患者的诊断、治疗情况、随访信息。首先从独立的骨与软组织肿瘤数据库中提取 9200 例原发骨肿瘤病例的相关流行性病学信息,包括年龄、性别、部位和诊断,将数据存储在 Excel 表格中。

一、数据库设计

数据库系统采用开源工具 Word Press 进行构建,Word Press 的门户网站含有大量免费的主题、插件及工具,可以节省数据库网站开发的费用。本数据库的主页采用由 Cyper Chimps 开发的“Responsive”主题。考虑到数据的安全性和网站的访问质量对于数据库的使用体验的重要性,尽管数据库系统是免费构建的,但网站的域名和空间仍然由商业网站提供服务。

二、搜索模块设计

Word Press 采用的是 Php 语言和 MySQL 数据库,前面提取的 Excel 数据,通过网站的数据库管理后台,可以很方便地导入到 MySQL 数据库。年龄和性别分别定义为连续性数据变量和二分类变量,部位和疾病诊断定义为字符型变量。部位包括:股骨、胫骨、腓骨、肱骨等长骨,以及骨盆、肩胛骨等扁平骨。对于长骨,进一步分为近端 ( prox )、骨干 ( shaft ) 和远端 ( dist )。根据 4 个参数,设计按诊断、按年龄、按部位 3 个单参数搜索模块,以及按年龄、部位、性别和诊断 4 个参数组合的综合搜索模块。

结 果

根据以上描述的方法,北京积水潭医院建立了原发骨肿瘤流行病学在线数据库系统 ( http: //www. sarcoma-jst.org,图 1 )。为了适应对数据库信息查询的需求,该网站设计为可以为 Windows 平台电脑、Apple 电脑,不同型号的平板电脑和智能手机友好地进行访问。

图 1 原发骨肿瘤网站主页面,显示肿瘤的整体构成情况Fig.1 Homepage of primary bone tumor website, showing the overall composition of tumors

一、按诊断搜索

可以在搜索框里输入英文诊断名称 ( WHO2002年骨肿瘤诊断名称 ),为了避免拼写错误,网站提供了全部原发骨肿瘤的英文诊断名称供查询。举例来说,如果在搜索框里输入“osteosarcoma”,数据库会返回一共搜索到多少骨肉瘤病例,并以图表形式展示这些病例的年龄、性别和部位分布( 图 2,3 )。特别的是,如果需要搜索某个骨肉瘤的亚型,如经典型骨肉瘤,可以输入“conventional osteosarcoma”。

图 2 数据库系统显示的年龄和性别分布图Fig.2 Age and gender distribution of the database

图 3 数据库系统显示的部位分布图Fig.3 Location distribution of the database

二、按年龄搜索

对于年龄搜索,设计为搜索输入年龄±5 岁的所有病例。例如,在年龄框里输入 17 岁,数据库会显示 12~22 岁的所有病例。同样,系统会首先显示总共搜索到多少病例,然后显示性别、部位及诊断的分布情况 ( 图 4 )。

三、按部位搜索

对于部位搜索,系统设计了下拉菜单,通过下拉菜单选择不同的解剖部位,对于长骨,选择解剖部位后还会自动再出现一个下拉框,供选择是近端、骨干或远端 ( 图 5 )。例如,选择股骨,然后选择远端,数据库会显示共搜索到 2207 个病例,并在下面显示年龄、性别和诊断的分布情况。

图 4 数据库系统显示的诊断分布图Fig.4 Diagnosis distribution of the database

图 5 按部位搜索的模块是以下拉框进行选择Fig.5 Drop-down box selection of location distribution

四、综合搜索

综合搜索模块是为了分析一组特殊的病例集合而设计的,由于年龄、性别、部位和诊断均可以被定义 ( 图 6 ),因此其功能最为广泛。例如,如图所示,选择“股骨,远端”作为第一个条件,“股骨,近端”作为第二个条件,“股骨,骨干”作为第三个条件,其它选项留空,系统会搜索“发生于整个股骨”的所有原发骨肿瘤病例,显示其流行病学特点。通过这个搜索模块,几乎可以完成大多数条件的检索。

图 6 综合搜索的数据搜索形式Fig.6 Data search module of comprehensive search

五、实际使用举例

患者,53 岁,就诊时主诉右腹股沟区疼痛,行X 线、CT 及 MRI 检查提示右髋臼溶骨性病变,周围有硬化缘,考虑良性或侵袭性病变可能性大。进行穿刺活检,病理结果提示:内生软骨瘤。为了解骨盆部位内生软骨瘤的流行病学特点,选用部位检索策略,检索位于骨盆部位的肿瘤,共 724 例,诊断分布结果显示:192 例为原发软骨肉瘤,62 例为骨软骨瘤,18 例为软骨母细胞瘤,仅有 1 例为内生软骨瘤,占 0.14%。因此,流行病学研究显示骨盆部位的内生软骨瘤非常罕见,须再次进行病理活检,获得更多组织。再次病理结果显示为原发性软骨肉瘤 II 级。对于有症状的内生软骨瘤一般采用刮除术治疗,而骨盆软骨肉瘤 II 级则需要切除术,治疗方法是完全不同的。回顾性分析本病例,笔者认为:( 1 ) 因为穿刺活检取材有限,存在固有的局限性,有可能导致诊断的偏差;( 2 ) 内生软骨瘤和软骨肉瘤在病理上区分也存在一定的难度,须结合疾病的流行病学特点、临床和影像学特征综合分析。因此,本病例说明流行病学数据库网站可以作为一个很好的工具辅助诊断过程。

讨 论

疾病的流行病学特点在原发骨肿瘤的临床、影像和病理三结合诊断过程中具有重要的地位,但是,由于原发骨肿瘤其相对罕见,目前公开发表的超过 5000 例的大宗病例,仅有美国 Mayo Clinic 的《Dahlin's Bone Tumors》 ( 最新版是 2009 年出版的第 6 版 )[6],但是由于是以书的形式出版,在实际使用中并不方便。而且,美国的患者主要是以白人和黑人为主,而我国主要是黄色人种,其流行病学的数据特点是否符合我国人群特点,尚未可知。本研究采用了我国的 9200 例原发骨肿瘤数据,并且以免费在线数据库的形式提供给广大骨肿瘤工作者,则克服了以上两个缺点。

随着科技的发展和进步,数据库已经成为一个强大的工具服务于各个领域。在线数据库的重要作用在于它能够很好地收集、存储和查询相关医学信息[7-9]。就肿瘤类数据库而言,很重要的是基于某个目的,选择和定义恰当的参数。这就意味着参数并不是越多越好,也不是越少越好,不相关的额外信息会降低搜索效率,信息量不够也起不到应有的作用。本研究建立的原发骨肿瘤流行病学数据库,选择了年龄、性别、部位和诊断作为基本参数,这 4 个参数是最重要的流行病学特征,能够反映原发骨肿瘤的相关流行病学特征。这也是最初建立该在线数据库时,删除相关治疗和预后等相关参数的原因。

由于是数据库,数据量必然是很大的,数据的建立和添加如果不能很高效地进行,显然是一项很繁杂的工作。本研究 MySQL 数据库所需的数据可以通过 Excel 数据导入,而 Excel 数据则可以通过大多数途径获得,如 Sybase,DB2,Access 及 FoxPro等数据库转换[10-12],还可在特殊情况下手工输入。另外,虽然 MySQL 数据库本身存储信息是随机无序的,但在后台可以进行定义,获得信息按照某种特定的顺序进行排列[13],这为数据的预览提供了方便。选择 Word Press 作为数据库系统设计工具[14],优势为:( 1 ) 由于是免费的,可以节省大量的开发成本;( 2 ) 有很多非常友好的主题、插件可以使用,因此其可以提供一个简单有效的数据库管理平台,即使是非专业的数据库工作人员也可以操作。

尽管大多数数据库查询操作会在 Apple 或Windows 电脑进行,但由于平板电脑和智能手机的便携性,目前其应用范围已经非常广泛。因此,在设计过程中,需要考虑到这一点,整个系统应该兼容移动设备的使用。在本数据库的建立中,采用了免费的“Responsive”主题,则可以完全解决这个问题[15-16]。

截止 2014 年底,已经有 9200 例原发骨肿瘤数据信息被导入到在线数据库中,本在线数据库设定为每季度更新一次。相信本研究报告可以为需要建立免费在线数据库的读者提供一种数据库建立方法;更重要的是,该数据库可以为骨肿瘤相关工作者,提供一个重要的流行病学工具,在临床和研究工作中,免费使用。

[1] Siegel R, Naishadham D, Jemal A. Cancer statistics, 2013. CA Cancer J Clin, 2013, 63(1):11-30.

[2] Campanacci M. Bone and soft tissue tumors: clinical features, imaging, pathology and treatment. Springer Verlag Wien. 1999: 99-142.

[3] Unni KK, Inwards CY. Dahlin's bone tumors: general aspects and data on 10,165 cases. Lippincott Williams & Wilkins. 2010: 441-492.

[4] Anfinsen KP, Devesa SS, Bray F, et al. Age-period-cohort analysis of primary bone cancer incidence rates in the United States (1976-2005). Cancer Epidemiol Biomarkers Prev, 2011, 20(8):1770-1777.

[5] Wu JS, Hochman M. Bone tumors: A practical guide to imaging. Springer New York Dordrecht Heidelberg London. 2012: 1-50.

[6] Davies AM, Sundaram M, James SLJ. Imaging of bone tumors and tumor-like lesions: techniques and applications. Springer-Verlag Erlin Heidelberg. 2009: 31-52.

[7] Junghans TB, Sevin IF, Ionin B, et al. Cancer information resources: digital and online sources. Toxicology, 2004, 198(1-3):177-193.

[8] Lawrence DW, Laflamme L. Using online databases to find journal articles on injury prevention and safety promotion topics: How do Safety Lit subscribers use other databases? Safety Science, 2009, 47(1):1-8.

[9] Blamey RW, Hornmark-Stenstam B, Ball G, et al. ONCOPOOL -a European database for 16,944 cases of breast cancer. Eur J Cancer, 2010, 46(1):56-71.

[10] Saracco CM, Roth MA, Wolfson DC. Enabling distributed enterprise integration with WebSphere and DB2 Information Integrator. IBM Systems, 2004, 43(2):255-269.

[11] Taylor B, Adurty N, Bradley S, et al. The official new features guide to Sybase ASE 15. Wordware Publishing, Inc. 2010: 53-72.

[12] Baranyi J, Tamplin ML. Com Base: a common database on microbialresponses to food environments. J Food Prot, 2004, 67(9):1967-1971.

[13] Zawodny JD, Balling DJ. High performance MySQL: optimization, backups, replication. O'Reilly, 2008: 102-143.

[14] Jones KM, Farrington P-A. Using Word Press as a Library Content Management System. American Library Association, 2011: 8-15.

[15] Marcotte E. Responsive web design. A Book Apart, 2011: 46-78.

[16] Frain B. Responsive web design with HTML5 and CSS3. Packt Publishing, 2012: 8-34.

( 本文编辑:李贵存 )

Establishment and application of an epidemiological database of primary bone tumors


SHAN Hua-chao, XU Hai-rong, LI Yuan, NIU Xiao-hui.
Department of Oncology, Beijing Jishuitan Hospital, Beijing, 100035, PRC
Corresponding author: NIU Xiao-hui, Email: niuxiaohui@263.net

Objective To investigate the establishment and application of an online epidemiological database of primary bone tumors. Methods Original data were retrieved from the database of bone and soft tissue belonging to Beijing Jishuitan Hosptial. Database included 9200 cases of histologically confirmed primary bone tumors out of 14 617 bone and soft tissue tumors, which was featured with open source system ( Word Press ), web-based PHP language, MySQL database system-based data storage. Parameters as age, sex, location and diagnosis were collected. Results An online epidemiological database of primary bone tumors ( http://www.sarcoma-jst.org ) included 4 search modules. Three modules of one parameter were designed according to diagnosis, age, and location. One comprehensive module of four parameters was designed according to age, location, gender and diagnosis. Conclusions Database designed above is free and useful for epidemiological investigation of primary bone tumors. It can also serve as a reference for the establishment of similar tumor database.

Bone neoplasms; Epidemiology; Databases as topic; Online systems; Bone neoplasms, primary

10.3969/j.issn.2095-252X.2015.09.009

R738.1

100035 北京积水潭医院骨肿瘤科

牛晓辉,Email: niuxiaohui@263.net

2015-03-18 )

猜你喜欢

数据库系统流行病学软骨
昆明市院前急救患者流行病学的调查
SOX9在SD大鼠胚胎发育髁突软骨与胫骨生长板软骨中的时间表达研究
儿童医院临床分离多重耐药菌的流行病学分析
健康体检常见慢性病及指标异常流行病学分析
新型冠状病毒及其流行病学特征认识
基于Oracle数据库系统的备份和恢复技术
鞍区软骨黏液纤维瘤1例
髓外硬膜内软骨母细胞瘤1例
Oracle数据库系统的性能优化研究
江苏省ETC数据库系统改造升级方案探讨