APP下载

几何级数法在估计我国2012年15岁以上人群高血压患病率中的应用

2013-11-16严若华王杨王文李卫

中国循环杂志 2013年7期
关键词:心血管病患病率患病

严若华,王杨,王文,李卫

随着我国经济的发展和人口的老龄化,慢性非传染性疾病日趋流行,对人群健康的影响日益凸显。高血压作为以心脑血管疾病为主的慢性非遗传性疾病的主要危险因素之一,是威胁人群健康的重要公共卫生问题[1-3]。及时准确地了解人群的高血压患病情况并适时调整政策及早做出干预,对心血管疾病的预防和治疗工作意义重大。

我国自1958年来共进行过四次大规模的高血压抽样调查。1959年、1979年、1991年分别开展过三次全国高血压抽样调查,2002年“中国居民营养与健康状况调查”中也收集了参与者的血压信息[1]。然而,由于全国性的高血压调查面临着范围广、周期长等困难,实施耗费大,难以频繁进行,估计第五次的全国高血压调查将于2015年完成,而最近获悉的数据已是十年前通过大样本抽样调查得到的结果;我们并不能及时掌握如今的高血压流行状况。

以往中国心血管病报告借鉴美国心脏协会(AHA)给出的慢病估计方法,采用外推法(extrapolation)预测高血压的患病情况[4]。它假设人群的患病率自前一次调查后保持不变,而患病人数的增加仅依赖于人口基数的增长。这种方法所需数据量较少,且估计较为保守,预测值由调查直接得到,未经后期处理,较具说服力。但它依赖于过强的假设,一旦患病率有所波动,就会引起较大程度的误差。因此,为了使预测结果更为可靠,我们不妨假设患病率的年均增长率保持不变,即采用几何级数法(geometric progression)进行估计。这种方法在沿用外推法基本思路的同时,加入了对过去患病率变化趋势的考量,可能更符合实际,预测结果也与此前高血压患病率的上升趋势契合。本研究旨在估计2012年我国15岁以上人群高血压患病率和患病人数,为中国心血管病报告提供数据。

1 资料与方法

研究资料:自1958年来,我国曾四次在全国范围内进行高血压的抽样调查,调查对象为在我国有常住户口的15岁及以上人口,后三次抽样方法采用多阶段不等比例整群抽样,抽样人数根据预期分析指标和实际经费条件在省市自治区内调整。调查所得的患病率结果分别为:1959年为5.11%、1979年为7.73%、1991年为13.58%和2002年为17.65%[5]。从历次调查的结果可以看出,我国高血压的患病率呈明显上升趋势,在短短43年间,患病率增长了近2.5倍。

由此可以大致推测,高血压患病率在最近十年内仍处于逐渐上升的状态,但上升幅度难以判断。为了了解如今的高血压流行状况,我们将通过这四个数据点,预测近几年的高血压患病率。

模型与方法:本研究主要采用几何级数法:记恒定的增长率为r,若最近一次调查(2002年)得到的患病率为P0,则2003年的患病率P1可以表示为P1=P0(1+r),2004 年P2=P1(1+r)=P0(1+r)2,依此类推,(2002+t)年的患病率即为Pt=P0(1+r)t。

同时我们还尝试以时间为自变量、患病率为因变量,建立二次函数、指数函数、幂函数等拟合模型,并采用GM(1,1)灰色模型[6]预测患病率,以期对几何级数法所得的结果进行验证。这类方法依赖于高血压流行状况的历史信息,比较注重模型的数学意义,我们用决定系数R2评价它们的拟合效果:

其中Yi和Y分别代表各方法预估的多个患病率值及其均值,ei为预测误差。

2 结果

通过上述公式,可以计算出任意一年高血压患病率的预测值,结果如图1所示。2012年的高血压患病率约为23.96%。

图1 几何级数法估测我国15岁以上人群的高血压患病率

在患病率估计结果的基础上,通过相应年龄段的人口总数,可以估计高血压患病人数。目前,中国统计年鉴中提供的最新人口信息为,2011年全国15岁以上人群的人口数为11.2571亿人,假设2012年保持2011年的人口数和年龄结构不变,通过公式:患病人数=总人口×患病率,可以给出2012年我国患病人口的一个大致估计。

2012年的患病人数=2011年15岁以上人群的人口数×2012患病率=11.2571×23.96%=2.6972(亿)

这种方法在相比于外推法更加符合实际,预测结果也与此前高血压患病率的上升趋势契合,在中短期预测中具有更高的精度。

同时,其它方法得出的结果(表1)都说明,2012年的患病人数保持在2.55亿~2.85亿之间。这些模型的拟合效果很好(R2> 0.97),而结果又足以佐证几何级数法给出的预测值,可见几何级数法的估计结果相对可靠。

但我们在实际预测中并不采用表1给出的主要结果,是因为这些模型仅从数学的角度出发进行估计,并没有考虑数据的临床意义。相比之下,几何级数法基于既往数据和一个简单的假设,比较符合高血压的患病率变化趋势,因此可以认为是一种较好的预测手段。

表1 几种方法预测结果的比较

3 讨论

目前用于疾病预测的主要方法包括时间序列模型、多元回归分析模型等[7]。但前一种方法依赖于大量、密集的样本数据,需要对疾病随时间的发展趋势有全面的了解,显然本研究的数据量不足以满足分析的需求;而后一种方法则需考虑相关因素对疾病的影响。虽然人们对影响高血压的主要因素已经有了一定了解,但这些危险因素(如肥胖、过量吸烟或饮酒、精神紧张等)缺乏可靠的年患病率数据,因此难以用于建模。此外,起源于黑箱理论的BP(Back Propagation)神经网络模型[7]和随机过程理论提出的Markov状态转移模型[8]也被用于疾病的预测,但在学习样本较少时,两者均无法取得良好的预测效果。对于后者,在建模时要将总体人群的年龄增长纳入考量,世界银行的中国慢病报告也认为,人口老龄化会使中国疾病负担迅速增加,但由于前两次全国大规模调查的时间较早,并没有完整的分年龄段的高血压患病率数据资料,故而在预测时难以加入老龄化对疾病发展的影响。

因此,本文从另外的角度,采用几何级数法对疾病进行了预测。可以得到,按照近五十年来的发展趋势,我国患病率的年均增长率应保持在3.1%左右,患病率平稳增长,2012年全国15岁以上人群的高血压患病率将达到24%,患病人数约为2.7亿。

本研究为近年来高血压的流行状况提供了一些可参考的依据,还改进了之前广泛采用的外推法,将以往疾病的患病率变化规律纳入到模型当中,更加符合实际,预测结果也与此前高血压患病率的上升趋势契合,更具临床意义。同时,由2011年《中国心血管病报告》报告的各省市高血压患病率数据[5]可以看出,黑龙江省(年龄≥15岁,患病率30.48%)、云南省八州县(年龄15~69岁,患病率24.8%)、河南省新安县(年龄≥18岁,患病率30.77%)、江苏省徐州市(年龄20~75岁,患病率20.87%)、浙江省杭州市(年龄≥20岁,患病率27.49%)在2007~2009年调查得到的主要成年人群高血压患病率都处在20%到31%之间;而2007~2008年中国糖尿病与代谢疾病研究[9]也指出,我国20岁以上男性和女性的高血压患病率分别为30.09%和24.79%,虽然调查结果略高于本研究给出的预测值,但考虑到调查时间、试验设计和诊断标准等因素造成的误差,二者的结果总体差异不大,可见预测相对可靠。

然而,由中国疾病预防控制中心(CDC)发布的2010年我国疾病监测点成年人高血压患病率为33.5%[10,11],较大程度地超出了本研究的估计值。我们认为,造成该状况的原因主要在于:首先,以往全国大样本抽样调查的诊断标准倾向于低估实际患病率(1959年和1979年的高血压诊断标准与现行的国际标准并不一致,漏算了一部分应被诊断为高血压的患者,使调查所得的高血压患病人数比实际更低),而文章采用的预测方法又较为保守,因此本研究得到的结果略低;其次,2010年抽样调查的样本量计算依赖于一些参数的选择,同时调查过程中监测点的位置也会给结果带来一定偏性。但是不可否认,本研究的预测值仍有可能低估我国实际的高血压患病率及患病人数,结果较为保守,因此只作为参考。

另外,几何级数法在预测中也具有一定局限性:它依赖于患病率增速恒定的假设,也就是说,增长率的任何波动都会导致预测精度的下降;同时,图1中给出的四次高血压大规模调查的诊断标准并不完全一致,尤其是1959年对高血压的定义与之后相差较大,这可能导致错估当年的实际患病率,间接引起模型的不准确;另外在建立模型的过程中,一般我们会采用70%~80%的数据建模,留下30%左右的数据做验证,以评价模型的准确性和可靠性,但由于高血压全国调查的次数较少,剔除数据用于验证会较大地影响模型的精确度,因此暂时还无法通过预测误差来评判模型的好坏。

此外,预测模型也有进一步调整和修改的空间:如在拟合曲线时,自变量除了选择年份之外,还可以考虑将我国高血压主要危险因素水平对患病率的影响纳入考量,进行多元回归分析,给出较精确的预测结果;或采用符合疾病发展规律的Logistic回归函数建模,它所描述的“S型”生存曲线会在经历过一段时间的快速上升后逐渐趋于平缓,最终无限接近但永不超越一个界值k。这些方法除了具有数学意义外还考虑了疾病的影响因素或增长规律,也是可能给出较好估计结果的预测手段。如何实现这些方法并给出合理的解释应是我们进一步研究的方向。

[1] 李立明. 中国居民营养与健康状况调查报告之四 2002高血压. 北京 : 人民卫生出版社 . 2008: 1-2.

[2] 王文, 朱曼璐, 王拥军, 等. 心血管病已成为我国重要的公共卫生问题——《中国心血管病报告2011》概要. 中国循环杂志, 2012,27: 409-411.

[3] 王文 . 我国高血压流行趋势与防治状况 . 中国循环杂志 , 2012, 26:407-409.

[4] The American Heart Association Statistics Committee and Stroke Statistics Subcommittee. Heart Disease and Stroke Statistics—2012 Update. Circulation, 2012, 125: e3-e5; e88-e96.

[5] 卫生部心血管病防治研究中心. 中国心血管病报告 2011. 北京 : 中国大百科全书出版社 , 2012: 13-31.

[6] 金光楠, 蔡振群. GM(1, 1)灰色模型在预测麻风病患病率中的应用 . 数理医药学杂志 , 2007, 20: 720, 727.

[7] 王玮, 许伟, 郑亚军, 等. 基于BP神经网络的围产儿出生缺陷患病率预测 . 中国流行病学杂志 , 2007, 28: 507-509.

[8] Andrew Moran, Dongfeng Gu, Dong Zhao, et al. Future cardiovascular disease in China: markov model and risk factor scenario projections from the coronary heart disease policy model—China. Circ Cardiovasc Qual Outcomes, 2010, 3: 243-252.

[9] Zhao-Jun Yang, Jie Liu, Jia-Pu Ge, et al. Prevalence of cardiovascular disease risk factor in the Chinese population: the 2007-2008 China National Diabetes and Metabolic Disorders Study. European Heart Journal, 2012, 33: 213-220.

[10] 李镒冲 , 王丽敏 , 姜勇 , 等 . 2010 年中国成年人高血压患病情况 .中国预防医学杂志 , 2012, 46: 409-413.

[11] 赵文华, 宁光. 2010年中国慢性病监测项目的内容与方法. 中国预防医学杂志 , 2012, 46: 477-479.

猜你喜欢

心血管病患病率患病
《心血管病防治知识》征稿启事
《心血管病防治知识》征稿启事
《心血管病防治知识》征稿启事
2020年安图县学生龋齿患病率分析
《心血管病防治知识》征稿启事
昆明市3~5岁儿童乳牙列错畸形患病率及相关因素
野生动物与人兽共患病
对读者来信的答复
老年高血压患者抑郁的患病率及与血浆同型半胱氨酸的相关性
完形填空训练