APP下载

基于BP神经网络和决策树的梅毒早期预警指标的模型构建

2021-05-06李娉彭海珍李宏徐旻博刘庭惠卢振环

广东医学 2021年4期
关键词:性工作者性行为梅毒

李娉, 彭海珍, 李宏, 徐旻博, 刘庭惠, 卢振环

深圳市盐田区人民医院 1科教部, 2公共卫生部, 3呼吸内科, 4护理部(广东深圳 518081)

梅毒是由梅毒螺旋体引起的一种慢性的性传播疾病。主要通过性途径传播,临床上可表现为一期梅毒、二期梅毒、三期梅毒、潜伏梅毒和先天性梅毒[1]。在《中华人民共和国传染病防治法》中被列为乙类防治病[2]。梅毒在世界范围内流行,据统计估计,每年新增病例约1 200万例,主要分布在南亚、东南亚和撒哈拉以南非洲地区[3]。最近几年,梅毒在中国已成为发展迅速的性病。在报告的梅毒病例中,潜伏梅毒占多数,其他类型的梅毒病例也较常见。梅毒患者的皮肤和黏膜中含有梅毒螺旋体,未感染本病的人在与梅毒患者性接触时,如果皮肤有微小破损,就会感染本病[4-5]。值得注意的是,该病可通过输血或其他方式传播。后天性梅毒患者是传染源,绝大多数是通过无保护的性行为传播,少数通过接吻、输血、污染源进行传播[6]。梅毒的胎传是由梅毒孕妇传染的,如果是一、二级梅毒和早期潜伏梅毒,传染给胎儿的几率相当大。本研究拟采用流行病学个案研究方法,收集某医院梅毒就诊情况,分别采用了BP神经网络算法模型和决策树算法模型建立模型,并确定临床预警指标,为进一步的梅毒预防工作奠定了坚实的基础。

1 资料与方法

1.1 一般资料 选择2010年1月1日至2020年9月30 d之内的梅毒就诊者,同时开展梅毒感染主动监测。本文采集了2010年1月1日至2020年9月30日348例梅毒病例资料,一期38例,二期43例,隐形梅毒267例。一期38例中:男24例,女14例;二期43例中:男23例,女20例;隐形病例中:男88例,女179例。其中调查的女性梅毒病例患者为暗娼(female sex worker,FSW),暗娼是指提供商业性服务的女性,是传染性病的高危人群。

1.2 观察指标 由经过专业培训的调查人员使用《国家艾滋病哨点监测暗娼调查问卷》[7]进行面对面调查,调查内容包括一般人口学和行为学资料,并采集3 mL静脉血进行血清学检测。然后对每个受试者采集的3~5 mL静脉血进行血清学检测:采用酶联免疫吸附试验进行梅毒抗体初筛,对阳性受试者采用甲苯胺红不加热血清试验进行再次检测。再次阳性者判断为梅毒抗体阳性。人类免疫缺陷病毒(HIV)抗体初筛采用酶联免疫吸附试验(ELISA),阳性者采用Western blot(WB)确诊,阳性者判断为HIV抗体阳性。丙型肝炎病毒(HCV)抗体先进行ELISA筛查和复检,两次阳性者判断为HCV抗体阳性。

研究变量如下:婚姻状况、年龄、户籍、民族、教育水平高低、性病知识知晓率、最近是否与暗娼发生性行为、最近是否与临时性伴发生性行为、最近是否注射毒品、最近是否与同性发生肛交性行为、最近一年是否诊断性病、是否感染HIV、是否感染HCV。

2 结果

2.1 决策树模型分析结果 男性梅毒患者的决策树第一个最佳分组变量是最近是否与暗娼发生性行为,以此形成二叉树,如果男性梅毒患者最近与暗娼发生性行为,且最近与临时性伴侣发生性行为,则该男性患梅毒的概率将大大增加;如果最近没有与暗娼发生性行为,但是与同性发生肛交行为,则男性患梅毒的概率也将大大增加。女性性工作者梅毒患者的决策树第一个最佳分组变量是性交易场所档次偏低,以此形成二叉树,如果该女性梅毒患者最近性交易场所档次偏低,且该女性性工作者文化程度偏低,则该女性患梅毒的概率将大大增加;如果最近没有去档次偏低的交易场所,但是艾滋病知识匮乏,则该女性性工作者患梅毒的概率也将大大增加。见图1。

图1 决策树树性图

在入选的6个自变量中,梅毒早期预警指标重要性依次为:最近是否与暗娼发生性行为、最近是否与临时性伴侣发生性行为、与同性发生肛交行为、场所档次偏低、文化程度偏低、艾滋病知识匮乏。314个训练样本中,286个实际值与预测值吻合,正确率为91.18%,28个错误,错误率为8.82%;34个测试样本中,预测正确率为87.64%,错误率为12.36%。见表1。

2.2 BP神经网络分析结果 根据BP神经网络模型最优网络结构发现梅毒早期预警指标重要性依次为:最近是否与暗娼发生性行为、最近是否与临时性伴侣发生性行为、与同性发生肛交行为、文化程度偏低、场所档次偏低、艾滋病知识匮乏。314个训练样本中,302个实际值与预测值吻合,正确率为96.27%,12个错误,错误率为3.73%;34个测试样本中,预测正确率为94.35%,错误率为5.65%。见表1。

表1 BP神经网络和决策树模型在训练集和验证集上的整体正确率和错误率

2.3 模型的对比 在训练样本中和测试样本中,BP神经网络算法模型的正确率均高于决策树算法模型,见表1。在训练样本中,BP神经网络模型的敏感度、特异度、约登指数与受试者工作特征(ROC)曲线下面积均高于决策树算法模型;测试样本中,BP神经网络模型的敏感度、特异度、约登指数与ROC曲线下面积均高于决策树算法模型。综合而言,BP神经网络模型预测能力优于决策树算法模型。见表2。

3 讨论

受不良生活习惯等因素的影响,梅毒成为我国国内常见的性传播疾病,梅毒的发病率每年都呈上升趋势,目前已成为一个严重的问题,亟待解决[8]。其中妊娠期发现的梅毒,严重可导致孕妇流产、胎儿死亡,严重威胁了孕妇和新生儿的身心健康[9]。自从国家开始对母婴传播重视以来,政府颁布了一系列预防梅毒的措施,推动了先天性梅毒的防治工作。但是一些医务人员缺乏主动服务的意识,孕期保健服务的安全性没有从根本上得到保障,同时因为性传播疾病的敏感性、个人可能会顾及到面子问题和患者自我保健意识还有待加强,不积极参加孕前检查,如果错过最佳治疗的时机,那结局的发生是不可逆转的。先天性梅毒的主要临床表现为皮肤和器官系统的损害,典型的皮肤病变为水疱、斑丘疹等;全身病变为肝肿大、贫血和血小板减少等[10-11]。神经梅毒是由于梅毒螺旋体侵入中枢神经系统,可导致脑脊液白细胞数量和蛋白水平异常[12]。有一个一直困扰着我们的问题,那就是梅毒阻断和先天性梅毒儿童到底应该在什么情况下才可以接种疫苗呢?还有等等一系列的问题,一直没有找到准确、详细、科学、合理的答案。

根据调查分析,女性性工作者梅毒感染的危险因素是低档场所、文化程度低、缺乏安全套推广和性疾病咨询服务[13]。因此,对女性性工作者的监测应特别关注低档场所、文化程度低、年龄偏大的人群,同时也要增加安全套推广发和性疾病咨询服务。根据文献调查中没有接受安全套推广发放和性疾病咨询服务的女性性工作者比接受干预的女性性工作者感染梅毒的风险更高[14]。这说明教育推广在一定程度上可以有效预防人群的梅毒感染,但是更需要注重实际干预。另外结果还显示,HIV和HCV的感染也会增加人群感染梅毒的风险,相关研究显示这可能与性传播疾病相互之间的协同作用有关[15],所以加强对HIV和HCV患者的早期有效预防和治疗至关重要,这是从源头上降低梅毒传染的风险,对梅毒的预防具有重要意义。

梅毒感染形势严峻,在该人群梅毒及其他性传播疾病的防控中,低档场所源、低学历、年龄相对较大的性工作者是重点。但是调查也存在它的局限性,由于人群流动性太大,加上实验研究的样本少,这就有一定的偶然因素掺杂在其中,说服力不是很强。对于性工作者人群,应进一步加强安全套预防的公众教育和性疾病咨询服务。同时,还应加大对梅毒、艾滋病等性传播疾病的安全预防措施。

梅毒是一种较复杂的多因素传染性疾病,国内外研究多采用数据挖掘的方式进行研究和分析[16-18]。在问题分析中,通常采用logistic回归分析法来研究变量,它能够较好地反映自变量与因变量之间的依赖关系,但约束条件太多。而BP神经网络和决策树算法属于非参数算法模型,不需要推断参数,可以通过对现有数据的学习来建立模型。从以上实验结果表明,BP神经网络模型的预测性能高于决策树算法模型,这是因为BP神经网路模型善于处理复杂的因素关系。最后,预防梅毒也是当下不容忽视的事情。在加强健康教育和宣传的同时,为了尽可能地避免危险性行为,应该采取如下措施:追查患者的性伴侣,找到患者的所有性接触者,进行全面检查,并进行相应的治疗;对所有疑似患者都要进行全面的仔细检查,发现患者要及时治疗;患有梅毒的孕妇应及时给予有效的治疗,防止梅毒感染给胎儿;如果需要献血,应先到正规的采血点进行全面的血液检查,然后再献血,防止感染,梅毒患者要注意进行一定的健康康复锻炼,保持良好的心态,梅毒患者在生活中要注意生活细节,防止传染给他人。

综上所述,本实验表明,与暗娼发生性行为、与临时性伴发生性行为、注射毒品、与同性发生肛交性行为、诊断性病、感染HIV、感染HCV是梅毒早期预警的重要指标。同时本研究的缺陷在于数据量小,没有分析出更多的梅毒发病的危险特征和因素,希望在未来的研究中得到完善。梅毒是流行性的传染病,建议根据疫情特点,加大梅毒防控资源投入,加大宣传教育措施的力度,完善梅毒的规范化诊断、治疗、报告和管理,注重传染源的早期治疗,实现梅毒的有效控制。同时也要制定女性性工作者梅毒防治策略,建立完善监测体系,降低传播风险。

猜你喜欢

性工作者性行为梅毒
“性”有更广泛的内涵!心理学家分析3种形式
昆明市不同性角色MSM的性行为特征分析
性工作者之家
高龄老年混合型神经梅毒1例
CERQ问卷在中国沈阳有性行为的中学生中的调查
梅毒螺旋体TpN17抗原的表达及纯化
IgM捕捉ELISA法对早期梅毒的诊断价值
1125例梅毒分析
人类性行为要受到约束吗