APP下载

城市居民冠心病数量化预测模型评价

2014-12-03王雪樵高红英温永顺李德栋尹汉明李梦军

中国老年学杂志 2014年12期
关键词:载脂蛋白训练样本预测值

黄 涛 王雪樵 高红英 温永顺 李德栋 尹汉明 李梦军 王 剑

(井冈山大学医学院,江西 吉安 343000)

冠心病(CHD)是供应心脏血液的血管发生狭窄,导致心肌缺血缺氧疾病,是导致心源性猝死的重要原因。我国冠心病的发病率呈逐年上升趋势〔1〕。CHD目前尚缺乏可靠的治疗方法,如何对CHD尽早发现和预警是亟待解决的问题。本研究旨在对影响CHD发生的主要因素进行整合,形成CHD的数量化预测模型,以期能对冠心病进行及时的预警预测,以便尽早采取针对性的措施,降低发病风险。

1 对象与方法

1.1 研究对象 从不同等级医院中选取2011年1月至2012年6月新发的 CHD住院患者228例,所有患者均符合WHO1997年制定的CHD诊断标准,并经冠状动脉造影证实。纳入标准:①符合上述诊断标准;②既往无冠状动脉介入治疗或冠状动脉搭桥术的患者。排除标准:①有严重感染患者;②有严重肝肾功能损害者;③有恶性肿瘤或全身系统免疫系统疾病者。从CHD患者所在医院的体检中心获取健康对照者500例,选取标准为不患任何器质性疾病。以上研究对象按2∶1随机分组后,得到训练样本478例(CHD患者148例,健康者330例),考核样本250例(CHD患者80例,健康者170例)。

1.2 研究方法 在文献评阅以往有关CHD危险因素的流行病学调研结果及系统评价结果的基础上,编制调查表,采用现场方式同步采集CHD患者及健康对照者的相关信息,内容包括人口学、既往史、临床及实验室检查结果等。分析前将资料按1∶2随机分为考核样本和训练样本两个部分。其中的训练样本用作进行病例对照研究,以训练样本用作病例对照研究资料,以其中的CHD患者为病例组,健康者为对照组,以是否CHD为因变量(有定义为1;无定义为0),各研究因素为自变量(若自变量为无序多分类变量,则以其中某项分类为参照形成若干个哑变量),分别作Logistic回归分析,选入变量的概率标准为0.05,剃除标准为0.10。结果表明,以筛选拟用于建模的CHD主要危险因素,随后对筛出的危险因素采用Bayes逐步判别分析法,构建出CHD发病预测模型,以训练样本和考核样本分别对模型的预测效果进行验证。

1.3 质量控制 ①项目实施前,对课题组成员统一培训,以便在疾病诊断、研究对象选择、信息的收集等方面规范和统一;②正式收集资料前进行预调查,根据预调查中发现的问题,及时对调查表及研究方案作适当修正;③资料的收集均由有三年以上工作经验的心血管科医生完成,调查过程中严格掌握诊断、纳入及排除标准;④如实规范填写调查表中的各项内容:血压记录入院6 h内首次测量值,实验室检查记录入院72 h内首次结果;如果发生1次以上CHD,记录首次CHD数据;为保证数据的真实无误,每周由研究小组对每份调查表进行复核。

1.4 统计学方法 采用SPSS16.0软件进行Logistic回归分析和Bayes逐步判别分析。

2 结果

2.1 CHD危险因素筛选 年龄、性别、心脑血管病史、劳累、牛奶豆浆、蔬菜水果、脾气急、高血压史、糖尿病史、腹围、高密度脂蛋白、载脂蛋白B、空腹血糖、腰臀比、总胆固醇、载脂蛋白A1与CHD之间存在统计学关联(P<0.05),见表1。

2.2 CHD预测模型 腹围、高血压史、腰臀比、载脂蛋白B、年龄、总胆固醇、载脂蛋白A1、牛奶豆浆、蔬菜水果共9个因素进入了判别模型。即预测CHD的数量化方程Y1=0.520×年龄+10.103×是否蔬菜水果+3.178×是否牛奶豆浆-3.413×是否高血压史+1.108×腹围-0.005×载脂蛋白 B+281.908×腰臀比+2.436×总胆固醇-0.447×载脂蛋白 A1-209.434;预测健康者的方程 Y0=0.409×年龄+7.749×是否蔬菜水果+5.365×是否牛奶豆浆-8.334×是否高血压史+0.962×腹围-0.000 015 43×载脂蛋白 B+258.286×腰臀比+3.778×总胆固醇-4.803×载脂蛋白 A1-169.811。

根据以上方程,将预测对象的各因素赋值代入方程,若Y1>Y0,则判为CHD者,否则判为健康者。

表1 冠心病危险因素的单变量Logistic回归分析结果

2.3 模型预测效果验证评价 为了解模型的预测效果,分别采用训练样本和考核样本对模型进行验证,并计算灵敏度、特异度、符合率、阳性似然比、阴性似然比、阳性预测值、阴性预测值,以便对模型预测的真实性、收益等进行评估。

2.3.1 训练样本验证结果 采用交互验证法将训练样本的各因素赋值回代预测判别模型,结果148例CHD患者中有140例正确判为CHD,8例误判为健康者;330例健康者中有318例判别正确,12例误判。预测的灵敏度为94.6%,特异度96.4%,约登指数91.0%,符合率95.8%,阳性似然比26.01,阴性似然比 0.056,阳性预测值 92.1%,阴性预测值 97.5%。

2.3.2 考核样本验证结果 考核样本未参与预测模型的构建,将考核样本原始数据代入预测模型能更好地验证模型预测结果的稳定性及外推效果。本考核样本的验证结果显示,80名CHD患者中有72例正确判为CHD,8例误判为健康者;170例健康者中有166例判别正确,4例误判。预测的灵敏度为90.0%,特异度 97.6%,约登指数 87.6%,符合率 95.2%,阳性似然比38.25,阴性似然比0.102,阳性预测值94.7%,阴性预测值 95.4%。

3 讨论

对于CHD的预测,以往国内外采用最多的是Framingham风险评分(FRS),用于评估人体今后10年发生冠心病的风险概率〔2〕。但该法过程繁琐,加之不同国家和地区冠心病的流行病学特点、危险因素水平有着较大差异,简单照搬使用会带来很大偏差。如刘静等〔3〕研究了FRS对于中国人群的应用价值,包含了中国11个省的3万多35~64岁的个体,进行了为期10年的随访,观察心肌梗死和冠状动脉事件死亡率的情况,结果发现,FRS评分过高地预测了观察终点事件的发生率(高估了5倍),因此FRS评分系统并不适合直接应用于中国人群。

CHD是多因素综合作用的结果〔1,4〕。本研究提示,有多达16个因素同CHD存在关联,各因素对于CHD的关联强度及关联方向也有很大差异。如能对影响CHD发生的众多因素进行整合,形成有预测价值的多变量数学模型,无疑对于CHD的早期预警预测有着重要价值。判别分析是依据多元观测指标判断个体归属类别的统计方法,是实现数量化评价及诊断建模的有效工具〔5〕。

从入选的因素来看,除了年龄是后天无法控制的因素以外,高血压、腹围、腰臀比、载脂蛋白B、总胆固醇、载脂蛋白A1、牛奶豆浆、蔬菜水果均与膳食营养、行为生活方式密不可分,都可通过后天科学合理的饮食及行为习惯加以控制或消除。因此,对以上因素进行合理的监控和预警将有利于更有效地降低CHD的发生风险。此外,这些因素指标均只需常规性检查和询问即可获取,不会造成任何健康伤害,故本预测模型可望在包括基层医院在内的各级医院的实际应用中,有较好的可操作性和实用性。

本研究采用训练样本和考核样本分别对预测模型进行交叉验证,目的在于充分了解模型的预测效果及预测结果的稳定性。从验证的结果来看,预测的灵敏度、特异度、符合率、阳性预测值和阴性预测值均达90%以上,阳性似然比和阴性似然比理想,且训练样本和考核样本的验证结果差别较小,这表明本研究模型对于CHD预测的真实性及收益均很理想。

1 孔灵芝,胡盛寿.中国心血管病报告〔M〕.北京:中国大百科全书出版社,2008:8-10.

2 Conroy RM,Pyorala K,Fitzgerald AP,et al.On behalf of the SCORE pro-ject.Estimation of ten-year risk of fatal cardiovascular disease in Europe:the SCORE project〔J〕.Eur Heart J,2003;24(11):987-1003.

3 刘 静,赵 冬,王 薇,等.中国多省市心血管病危险因素队列研究与美国弗莱明翰心脏研究结果的比较〔J〕.中华心血管病杂志,2004;32(2):167-72.

4 Srinath RK,Katan MB.Diet,nutrition and the prevention of hypertension and cardiovascular diseases〔J〕.Public Health Nutr,2009;7(1A):167-253.

5 孙振球.医学统计学〔M〕.第3版.北京:人民卫生出版社,2010:421-3.

猜你喜欢

载脂蛋白训练样本预测值
冠心病患者载脂蛋白A1、载脂蛋白B与血小板平均分布宽度水平变化及其相关性分析∗
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
化验单上的载脂蛋白是什么意思
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
化验单上的载脂蛋白是什么意思
AI讲座:ML的分类方法
人工智能
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
尤瑞克林对急性脑梗死患者载脂蛋白A1和载脂蛋白B的影响