APP下载

医院信息系统患者主索引数据的管理方法研究*

2018-09-28王兴强

中国医学装备 2018年9期
关键词:排他性身份证号相似性

王兴强 孟 娜*

随着医疗信息化技术的发展,医院信息系统(hospital information system,HIS)中患者诊疗数据的质量和完整性越来越重要。患者主索引数据的大量冗余,导致以患者主索引数据为索引的诊疗数据的低可用性。目前,患者主索引数据的管理主要有患者主索引指数(enterprise master patient index,EMPI)系统[1-4]和医院信息集成平台[5]两种解决方案,其均为独立的系统,主索引数据能够在HIS、实验室信息系统(laboratory information system,LIS)以及影像归档及传输系统(picture archiving and communication systems,PACS)等多系统间交互,但实现复杂,且成本高。而指纹识别、人脸识别、虹膜识别及静脉识别等方式均可确定身份的唯一性,可以与患者主索引进行绑定用于识别和支付,但难以对当前大量患者主索引数据进行有效管理。为此,本研究提出了一种基于HIS本身的患者主索引数据的管理方法。

1 患者主索引数据分析

1.1 主索引数据来源

患者主索引数据产生于住院和门诊就诊两个环节。住院需要登记患者的姓名、性别、出生日期、身份证号、地址、联系人及电话等信息,要求信息完整而准确。住院登记患者信息通过患者手工登记或者从门诊医生站开具的住院单中提取。长期以来门诊患者信息登记都是采用手工登记的方式进行登记录入,其错误率和信息不完整率较高,在当前的HIS中已保存了大量的患者主索引数据[6-7]。

近年来,随着信息化技术的发展出现了读取患者身份证、社保卡及银行卡等身份凭证在自助机或人工窗口办理的方式,其准确率较高,但重复登记办理的情况比较多,尤其是很多医院都采用了门诊医卡通系统,患者若将就诊卡丢失或遗忘时会重新办理,从而造成患者信息重复登记的情况[8-9]。

1.2 主索引数据关键词

患者主索引信息中含有身份证号、社保卡号及护照号等唯一身份识别(identification card,ID)确认其身份,但HIS中存在大量一个ID信息多条主索引的情况;而对于主索引信息中不含有效ID信息的则很难确认其身份的唯一性,尤其是历史数据中的患者主索引信息不完整,直接导致了以不完整主索引数据为索引的诊疗数据的低利用率,在很大程度上造成医疗资源的浪费并延误患者的诊疗进程。

患者主索引关键词数据包括姓名、性别、出生日期、民族、身份证号、地址及联系人等,按其不同属性,可分为3类:①具有ID唯一性属性的身份证号、社保卡号及护照号等关键词, 患者主索引数据一般来源为住院患者登记或门诊患者通过读取有效身份凭证的方式登记,通过有效的ID可确定患者本人;②具有排他性属性的性别、民族及姓氏等关键词,患者信息只会出现信息登记的对或错,而不会出现相似等不确定的情况;③具有强相似性属性的名字、出生日期、地址及联系人等关键词,在进行患者信息登记时,患者姓名通过口述或患者手工登记人工录入时,存在录入成形似的字或者谐音字等情况,患者出生日期,存在只登记录入到年份或月份信息的情况,患者联系地址登记不全,存在只登记录入到区县,没有到街道门牌的情况。这些关键词对于判定多条患者主索引记录是否属于同一患者时具有不确定性。

2 患者主索引数据管理

在患者主索引数据中,患者ID是确定患者唯一性的标识,多条患者主索引记录即多个患者ID标识多位患者,但目前大量存在同一患者有多条患者主索引、多个患者ID的情况[10-13]。为解决上述问题,采用一种患者主索引数据管理方法,通过创建患者身份主索引表,计算主索引相似度来实现。

2.1 患者身份主索引表

患者身份主索引表,是指能够确立患者身份唯一性的索引表,是患者主索引数据的索引表,由身份ID和患者ID为主键,从而确定患者身份的唯一性,将患者主索引中的患者ID数据存入该表中。通过ID信息查询该表,可以得出该患者曾经使用过的患者ID,从而得出该患者的历史诊疗数据。ID信息可以是身份证号、社保卡号和护照号,也可生成一个系统中唯一序号作为ID信息。

2.2 患者主索引相似度计算

患者主索引相似度计算,是指将当前主索引数据中的关键词数据与其他主索引数据中的相应关键词数据进行相似性计算。第一类具有身份唯一性属性的关键词不参与计算,第二类具有排他性属性的关键词和第3类具有强相似性属性的关键词参与计算。

第二类具有排他性属性的关键词wi相似性系数计算为公式1:

式中Ek,i为第k条主索引数据中第二类具有排他性属性的关键词wi的相似性系数,w0,i为当前主索引数据中的关键词wi的值,wk,i为第k条主索引数据中的关键词wi的值;i的取值范围为0<i<m,m为第二类具有排他性属性的关键词的数量(见表1)。

表1 患者排他性关键词相似性计算

第三类具有强相似性属性的关键词wj相似性系数计算,采用关键词字符串匹配后长度比加权的方式,其计算为公式2:

式中Sk,j为第k条主索引数据中第三类具有强相似性属性的关键词wj的相似性系数,w0,j为当前主索引数据中的关键词wj的值,wk,j为第k条主索引数据中的关键词wj的值,match()为字符串匹配函数,len()为取字符串长度函数,cj为第三类具有强相似性属性的关键词wj的加权系数;j的取值范围为0<j<n,n为第三类具有强相似性属性的关键词的数量。

当前主索引数据与第k条主索引数据相似度Vk的计算为公式3:

3 患者主索引数据管理方法

3.1 患者数据唯一性管理

对患者主索引数据进行唯一性管理,需要以患者来院就诊为触发点,通过患者信息与HIS数据库中患者主索引表的数据进行相似性计算实现,并经患者确认为本人数据,患者主索引数据清洗流程如图1所示。

图1 患者主索引数据清洗流程图

患者主索引数据的管理步骤为:①患者就诊,获取患者ID;②根据患者ID,检索HIS数据库的患者主索引表中当前患者主索引信息,患者ID为患者主索引表中的主键,具有唯一性,检索结果不为空;③判断当前患者主索引信息中是否具有唯一ID,如果没有则跳到步骤“⑦”,否则如果唯一ID不为身份证号则跳到步骤“⑤”,否则如果唯一ID为有效的一代或二代身份证,则跳到步骤“④”进行分析处理;④如当前患者身份证号为15位一代身份证号码,则转换成18位二代身份证号码,如当前患者身份证号为18位二代身份证号码,则转换成15位一代身份证号码。将患者一、二代身份证号互转,便于获取该患者的历史主索引信息;⑤按照当前获取的所有唯一ID检索患者主索引表中的患者ID;⑥将当前患者唯一ID和检索的患者ID,添加保存至患者身份主索引表中,该表是能够确立患者身份唯一性的索引表,是患者主索引数据的索引表,主键由唯一ID和患者ID共同构成主键;⑦检索患者主索引表中的第二类具有排他性属性的关键词和第三类具有强相似性属性的关键词;⑧根据相似度计算公式计算当前患者主索引数据与其他主索引数据相似度V,剔除相似度小于预定阀值V0的数据,并按照相似度V由大到小的顺序对主索引列表排序;⑨就诊患者确认排序的主索引列表中本人的信息;⑩将经过就诊患者确认过的患者ID添加保存至患者身份主索引表中,结束。患者身份主索引表结构见表2。

表2 患者身份主索引表结构

3.2 患者身份主索引数据应用

在HIS中,可根据患者身份主索引数据,在门诊或住院的医生站、护士站或其他程序中,通过患者当前使用的患者ID检索患者身份主索引表,获取该患者的唯一身份ID,再通过唯一身份ID检索获取该患者所有使用过的患者ID,从而得到该患者任意时间轴上的历史诊疗数据。

4 结语

在患者正常就诊的过程中,根据患者当前主索引信息中的关键词,自动计算并过滤出与患者当前主索引信息高相似度的患者主索引列表,经过患者确认保存至患者身份主索引表中,实现患者主索引历史数据的有效管理。患者就诊过程中根据患者唯一身份ID,可得出该患者曾经使用过的患者ID,从而得到该患者的历史诊疗数据,提高患者历史诊疗数据的可用性,为医生提供更加完善的患者历史诊疗数据,提高患者就诊效率,缩短患者就诊流程。

猜你喜欢

排他性身份证号相似性
一类上三角算子矩阵的相似性与酉相似性
互联网平台排他性交易反垄断规制的若干思考
友情为什么有时会有排他性?
浅析当代中西方绘画的相似性
作品赏析(4)
老师情
作品赏析(3)
非排他性管辖条款的法律效力研究
低渗透黏土中氯离子弥散作用离心模拟相似性
V4国家经济的相似性与差异性