APP下载

中医膝痹病临床文献的数字化保存与挖掘研究

2020-06-12程学荣李木清张月娟刘黎李成丽杨振武姜雄杜攀攀

湖南中医药大学学报 2020年2期
关键词:数据挖掘文献数据库

程学荣 李木清 张月娟 刘黎 李成丽 杨振武 姜雄 杜攀攀

〔摘要〕 信息时代,科学技术的发展突飞猛进。以信息技术为基础,以中医药膝痹知识为资源,建立中医膝痹病数据库,能为中医膝痹病教学、临床与科研提供知识发现的基础设施,有利于中医知识传播共享与增值利用。探析中医骨伤科膝痹病文献数字化保存数据库建立的步骤、方法、功能、内容、数据库维护,数字化保存与挖掘中医膝痹病临床文献,为临床实现中医膝痹病证治的标准化、数据化提供行之有效的思路与方法。

〔关键词〕 膝痹病;数据库;文献;数据挖掘

〔Abstract〕 In the information age, the development of science and technology has made rapid progress. Complying with the development of the times, based on information technology and using traditional Chinese medicine knee biliary knowledge as a resource, a database of Chinese knee biliary disease can be established, which can provide infrastructure for knowledge discovery for teaching, clinical and scientific research of knee biliary disease, which is conducive to the sharing and promotion of traditional Chinese medicine knowledge and the use of added value. To analyze the steps, methods, functions, contents, database maintenance of the traditional Chinese medicine orthopaedics knee paralysis literature database, to digitally save and explore the medicine knee paralysis clinical literature, can provide effective ideas and methods for the clinical realization of the standardization, and scientific decision-making of the Chinese medicine diagnosis and treatment of knee paralysis in clinical practice.

〔Keywords〕 knee paralysis; database; literature; data mining

膝痹病又稱膝骨关节炎(knee osteoarthritis, KOA),是一种常见的以膝关节软骨的变性、破坏及骨质增生为特征的慢性关节病,属中医学“骨痹”范畴,是临床较为多见的慢性骨关节性疾病,此种疾病不仅患病率较高且病变的范围较为广泛,后期严重影响肢体功能,甚至致残。缓解KOA病人疼痛,恢复患膝功能,改善生活质量,一直是骨伤科临床的重要研究课题。本课题拟建立膝痹病专题数据库,目的是通过对中医膝痹病古今文献进行挖掘、分析,总结前人对中医膝痹病证治思想,发现诊疗规律,系统总结中医膝痹病的理论和辨证论治体系,从而提高膝痹病中医诊疗与服务水平。其作用突出表现在三个方面:一是为临床治疗疾病提供一定依据,提高医疗质量、提高医疗效率;二是传承中医治病经验和传统特色方法;三是便于临床教学和科研使用[1-2]。

1 数据库建设

1.1  文献来源

膝痹数据库是为国家临床重点专科重点病种膝痹病服务的专题数据库。研究收集较为规范的膝痹病古今文献,较为全面地收集中医院士、国医大师、全国名中医、国家级名老中医药专家及近现代具有重要影响力的中医骨科专家的膝痹经验。数据库文献来源主要包括:(1)纸质版书籍。以“痹”或者“关节炎”为关键词项检索词,在中国国家图书馆·中国国家数字图书馆检索发现膝痹专著,或者包含膝痹论述的专著书目。购买膝痹病古籍、近现代名老中医关于膝痹病的著作。(2)数字化文献。整合湖南中医药大学图书馆的数字资源,纳入中国知网、万方数据资源、中国生物医学文献数据库、超星期刊、维普中文期刊服务平台、PubMed、Medline Complete等中文、外文文献数据库。数据库中涵盖了关于膝痹病的期刊论文、会议论文、博士论文、硕士论文、报纸、标准、专利、成果等多种学术资源。(3)网络资源。采集关于膝痹病的网络信息资源,如新药、科研奖励、新技术研发等。

1.2  古籍整理

1.2.1  书目的分类  膝痹病古典专著较少,很多相关文字记录都是散见于各类中医医籍里,然而每本书籍论述的内容以及着重点均不相同,所以研究团队根据其侧重点将古典书籍进行分类,列为中医理论类、中草药类、方剂类、针灸推拿类、按摩导引类、临证医案类等。

1.2.2  资料的摘编  为了适应临床的实用和后期数据库的开发及维护等要求,摘编的基本原则设定如下:(1)内容在200字以下的一般应采取以文摘卡形式摘录;(2)内容在200字以上的采取扫描全文或者复印的方式,最后予以剪贴整理;(3)摘编的书名、版本、作者、出版社、疾病名或病证名、篇名、起止页码、出版时间、摘抄人、复核人等重要内容必须信息完备。

1.2.3  资料的分类整理  按时间(朝代及年份)的先后顺序、作者、成书年代、疾病或病证名、病因病机、治则治法、方药、调护等方面分类整理,待所有资料的录入全部完成后,再经二次校稿筛查整理完成。

1.2.4  中医膝痹病叙词表的建立  叙词,是一类经过特殊规范化处理的词或者词组,它具有以基本概念为基础能够表达出文献主题的特性或属性。而具有这类特性或属性的词或者词组的汇集就组成了叙词表,可以用于检索和标引,它还能体现概念之间的相互关系。故中医古籍叙词表的建立对后续进行中医古籍信息标引时主要起到能够自动(辅助)选择索引词的功能,及进行检索时的后控制,是提高查全率、查准率、实现多语检索和智能化概念检索的重要途径,是构建中医古籍知识库的基础[3]。借鉴以往构建中医古籍叙词表的方式方法,研究团队拟采用以下几步建立中医膝痹病文献叙词表:(1)参考GB13190-91汉语主题词表编制规则和GJB1776A-99军用主题词表编制规则制定词表的编制标准;(2)大量收集现有的与中医药相关的主题词表,包括已颁布的当前各种有关的国标、行标、参考以及各类中医药相关工具书。病名证名的制定和选取主要参考各类中医辞典、《中医病证名大辞典》以及《中医名词术语精华辞典》或者其他经典名籍文献中收录[4];(3)在类目层级设置上,尽量减少层级,对文献较多,检索频率较高的类目适当提高其列类等级,增强分类法的易用性和直观性[5]。

1.3  现代文献整理

1.3.1  文献的分类  现代膝痹病文献较多,包含各大数据资源,因此,研究团队可以根据文献的种类以及研究的方向来进行分类整理,分为学术期刊、会议论文、博硕士学位论文等。根据其研究方向的侧重点不同可以分类为:实验研究、临床观察、基础理论研究等。

1.3.2  资料的归类整理  按文献发表的先后时间顺序、期刊杂志类型、临床治疗、实验研究等归类整理, 待所有资料的录入全部完成后,再经二次校稿筛查整理完成。

1.4  数据库建设步骤

1.4.1  制定数据库检索关键词  根据临床研究及科研需求,结合文献库的特点,选定检索关键词,如病名、辨证分型、治疗方法等,设定规范的关键词语用于检索,检索关键词的制定参考中医诊断学、中医骨伤科常见疾病诊疗指南及我院制定的中医膝痹病诊疗规范,制定膝痹病叙词表。

1.4.2  文献信息采集与加工  主要是图文信息的采集,文本类的可以用高扫或者OCR识别,图像类的信息可以借助于数码摄像机或相关摄像工具;资源发布可以使用采编发布软件、动态发布软件系统或TRS管理员工具等有关系统软件进行发布。利用开发工具Microsoft Visual Studio、Dreamweaver、Photoshop设计。文献的整理分为四个方面:(1)按照历史年代延续的先后(先秦-两汉-晋-唐-宋-金-元-明-清),对历代先贤关于膝痹病的相关论述,追其溯源,知其由来,审其变迁;(2)整理目前现有的中医和西医所有关于膝痹病的诊治资料,含括其基本概念、发病机制、证候特点以及论治规律等;(3)按类归纳古今名家对膝痹病临床治疗的经验籍册,古代名家可按历史朝代先后分类,现代名家则按国家级和省级名老中医分类收录,研究了解不同时代医家们关于膝痹病的认识及其论治心得;(4)广泛整理收集中医从古至今治疗膝痹病的相关内服外敷的专方专药,或者敷贴、熏洗、针灸等治疗方法。

1.4.3  制定策略  校对文献原始资料,提取与中医膝痹病相关的章节内容,提炼检索词语。

1.4.4  检索数据库  将检索出来相关结果反馈给检索者进行筛选或者供其调整检索方式方法进行再次或多次检索。经检索后将符合要求的数据格式进行规范化处理后导入数据库。数据字段参考CBM的全字段标准。

1.4.5  文献分析与挖掘  在做到对“专而精”的文献资料系统规范化采集基础上,对文献资料分析与挖掘,使其能够对原始资料中“理-法-方-药”之间的关联规则进行统计分析,为形成系统理论体系提供资料支持。

1.4.6  数据库软件创建步骤  待研究团队完成了数据库创建的前期工作,研究团队最后一步就是如何将研究成果应用于临床实践,所以数据库的创建其实就是理论到实践的过程。研究团队将按以下步骤创建数据库软件:(1)安装MySQL数据库软件,并且配置信息(MySQL是一个关系型数据库管理系统,将数据保存在不同的表中,而不是将所有数据堆积在一个大的仓库内,于是就提高了数据库的运行速度和灵活性);(2)创建连接。创建一个数据库的连接,只有创建了数据库连接,才能在该数据库的方案中创建、更改对象或编辑表中的数据;(3)测试连接。填写对应的连接名、主机名、端口、用户名和密码,确定数据库连接无误;(4)新建数据库。根据前面创建的连接,在该连接下新建数据库,填写数据库的名称和字符编码(UTF-8);(5)新建表。在新建的数据库下建立本项目所使用的表,本项目建立的表主要为:搜索答案详情表(字段包括title,document,category等),搜索关键词详情表(字段包括number,search Word等)以及关键词与title的映射表(字段包括number,title等);(6)数据导入。在新建好的表中导入搜集到的数据;(7)数据验证。待数据导入结束,测试导入的正确性,通过SQL的相关查询语句验证表内数据的条数,以及抽样查看表中数据与导入数据的一致性(例如:select*from my Table where ds='20190222' and searchWord is not null,查询表中行数:select count(*) from myTable where ds='20190222')。見图1。

2 数据库内容与功能

中医膝痹病数据库,包括临证医案记录288条,临床经验378条,理论研究265条、针灸推拿126条、按摩导引56条等,数据库具备文献检索、信息统计、数据挖掘等功能。建成的专题数据库以统一格式存储中医膝痹病各类文献不同格式的信息,但依照资料类型分为古籍文献模块、名老中医病例模块、病案模块、期刊文献模块、学位论文模块、会议论文模块、研究进展模块。本数据库收集清及以前各医家、近现代名老中医文献资料,通过建立中医膝痹病古籍叙词表,归纳膝痹病的病名、证候诊断、中医治则治法、中药、方剂、辨证论治规律,同时对方剂和中药进行相关性分析,以了解治疗某证候的各味中药使用频率,达到运用这一数据库可以查到治疗膝痹病的某一方剂,再从方剂查到相关的中药材,对膝痹病复方及单味药进行深入研究。

数据库系统提供统一的检索界面,支持多种途径检索,如题名、朝代、著者、辨证分型、治疗方法等,也支持“=”“(”“)”及逻辑算符“或”“与”“非”等多种检索方式;可按缺省设置、全部字段或任选字段等模式自由显示检索结果,若该文献带有全文下载,按照要求点击后即可获取原文或相关章节;若该板块带有数据统计功能,则可按照需求进行相关数据统计[6]。

数据库的管理员在登录时需要先输入提前设定好的口令,登录成功后才能在系统中进行相关管理活动,例如对条文信息查阅、修改编辑以及对数据库中现有的条文进行删除等管理,管理员还具有对条文关键词的管理权限。

普通的用户则需要进入到数据库软件检索页面,然后输入所需要信息的关键词进行检索并浏览相关信息。

3 数据库维护

据库建设完成后,若在使用中发现数据错误、文献特征不准确或数据内容不全面时,可以及时修正。同时本数据库注重动态更新,能够及时补充和添加心得等相关内容资料,设定每间隔半年就进行一次数据的维护及更新。本数据库的建设理念不仅在数据内容上保证了全面性和连续性,而且在资源整合上充分体现了发展性和不间断性,使数据库在质量和生命力长久方面得以保证。

信息化社会,科技发展日新月异,新知识、新技术不断涌现,中医药数字化信息建设势在必行。中医膝痹病数据库以信息技术为基础,以中医药膝痹知识为资源,为开展中医膝痹病教学、科研与诊疗技术创新提供知识发现的基础设施。研究团队力求构建一个基本成型的膝痹病专题文献数据库,实现本领域文献的规范化、标准化及统一化管理,以建成高质量的特色文献数据库,通过“中医膝痹病临床文献”的网络传播,提高对中医膝痹病的学术研究水平,推进我国中医骨伤事业的发展。

参考文献

[1] 王  健,王耀光.基于数据挖掘的当代中医治疗慢性肾炎蛋白尿证治方药规律研究[J].上海中医药杂志,2019,53(4):17-21.

[2] 张  越,刘鸿燕,秦盼盼,等.我国中医药信息化基础标准发展现状研究[J].医学信息学杂志,2015,36(12):8-12.

[3] 韩其琛,赵亚伟,姚郑,等.基于叙词表的领域知识图谱初始种子集自动生成算法[J].中文信息学报,2018,32(8):1-8.

[4] 李  兵,张华敏,李莎莎,等.中医古籍知识深度利用方法与知识库构建[J].中国数字医学,2018,13(8):33-35.

[5] 劉  涛,舒红平.基于无监督学习的中医古籍文献本体构建方法研究[J].电子技术与软件工程,2016(12):169.

[6] 刘  梨,龚后武,张月娟,等.中医古籍四大经典中中医护理文献的整理与数据库的建立[J].护理研究,2017,31(13):1608-1610.

猜你喜欢

数据挖掘文献数据库
Hostile takeovers in China and Japan
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
数据挖掘综述
The Role and Significant of Professional Ethics in Accounting and Auditing
数据库
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
数据库
数据库