APP下载

基于集对分析聚类法对中国未来生活用水量的预测

2016-06-15张云云朱家明

张云云,朱家明

(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030)



基于集对分析聚类法对中国未来生活用水量的预测

张云云,朱家明

(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030)

摘要:目的利用集对分析思想,构建集对分析聚类预测模型对国内未来生活用水量进行长期预测,分析未来生活用水量及增长趋势,为有关部门决策提供参考意见。方法从2000年至2014年的《中国统计年鉴》中收集年居民生活用水量时间序列数据,利用聚类的思想,将2000年至2013年的生活用水量增长率分成3类,利用集对分析思想,计算居民生活用水量与影响因子人口总数的联系度,通过预测人口总数在未来的增长率,预测未来居民生活用水量及其增长速度。结果从聚类的结果可以看出,2001-2013年生活用水量除2012年有所回落外,一直呈增长态势,年增长率除2012年外均稳定在1.02~1.04之间;由预测的结果来看,2014-2025年的生活用水量均属于第二类,即增长率范围稳定在[0.9833,1.0273],到2025年生活用水量将达到869.06亿m3;将2010-2013年实际生活用水量增长率与预测生活用水量增长率进行比较,计算其预测误差均在2%以内。结论集对分析聚类预测模型对于生活用水量的预测具有较高的精度,可以较好地预测长期生活用水量。未来生活用水量呈现缓慢增长态势,在一定增长率水平下,2025年突破850亿m3。

关键词:生活用水量预测;集对分析法;聚类预测;联系度

生活用水量长期预测对于城市规划、供水系统的管理及改扩建有着重要的意义。目前,对用水量长期预测常用的方法为时间序列预测法[1]、回归预测法[2,3]、灰色系统理论预测法[4,5]和人工神经网络预测法等[6]。其中回归预测法和灰色系统理论预测法的应用最为普遍,但这2种预测方法存在随着预见期的增长,预测精度大大降低的问题。本文利用集对分析联系度及聚类思想建立了集对分析聚类预测模型,用于对生活用水量的长期预测。该模型可克服传统参数统计预测模型的结构不确定性问题,经实际样本检验,集对分析聚类预测模型具有较高的精度。

1基本思想

集对分析[7]是从同、异、反3个方面研究2个不同事物联系的新的不确定性理论,其核心思想是将确定不确定视为一个确定不确定系统。在这个系统中,确定性和不确定性相互联系、相互影响、相互制约,并在一定条件下相互转化,用一个能充分体现上述思想的联系度来统一地描述模糊、随机、中介和信息不完全所致的各种不确定性。联系度[8]表达式为:

u=a+bi+cj

其中a表示2个集合的同一程度,b称为同一度;表示2个集合的差异不确定程度,称为差异度;c表示2个集合的对立程度,称为对立度。i为差异标记符号或相应系数,取值于[-1,1];j为对立标记符号或相应系数,规定取值为-1。根据定义,a、b、c满足归一化条件a+b+c=1,其中:a、c是相对确定的,而b是相对不确定的。

2可行性分析

集对分析聚类预测模型[7]是基于集对分析联系度及聚类思想的一种新的预测模型,它将预测对象及其影响因素作为一个整体进行数据处理,通过对影响因子的预测,结合集对分析联系度来预测待预测对象未来的发展趋势,该方法可克服传统的参数统计预测模型的结构不确定性问题[7]。由于生活用水量与人口数量息息相关,所以预测生活用水必须考虑人口增长因素,脱离人口增长因素,单纯使用生活用水量数据对未来的生活用水量进行预测必然是不客观也不准确的,而集对分析联系度恰好可以描述人口数量与生活用水量之间的这种不确定关系,所以利用集对分析聚类预测模型对未来年份的生活用水量进行预测是可行的。

3聚类预测模型的建立

3.1确定生活用水量的分类模式

集对分析聚类模型建立的第一步为确定事物N的分类模式[7],要求各分类样本数量大致相等。2001-2013年生活用水总量及其增长率数据如表1。

表1 生活用水总量及其增长率

根据表1,得出生活用水量及其增长率的趋势图,如图1、图2。

由图1可以看出2001-2013年生活用水量除2012年有所回落外,一直呈直线增长态势,由图2看出生活用水量的年增长率除2012年外均稳定在1.02~1.04之间,由此可知生活用水量总体而言是呈稳定增长趋势。按生活用水量年增长率高低将2002-2013年生活用水量均分为3类,分类集合记为A={A1,A2,A3},每类增长率范围及其增长率均值如表2。

图1 2001-2013年生活用水量  图2 2002-2013年生活用水量增长率

生活用水量增长率取值范围样本量XA1[0.9392,0.9833)41.0007A2(0.9833,1.0273]41.0059A3(1.0273,1.0714]41.0495

集对分析聚类预测模型的思想是通过预测影响因子未来的增长率从而确定预测对象未来的增长率。在这里将人口总数作为生活用水量的影响因子,因而可以通过预测2025年人口总数来确定生活用水量增长率。利用最小二乘法原理,结合1949-2013年的年末总人口数据,通过多项式拟合对2025年的年末总人口进行预测。预测结果如图3。

图3 2015-2025年人口预测

由图3可知拟合优度等于0.993 8,多项式拟合的得到的人口预测模型为:

yt=-5.1457(t-1948)+1743.7(t-1948)+48208

由拟合优度为0.993 8可知多项式拟合效果较好,故在这里拟合出的人口预测模型可以较为准确地预测未来人口总数,将未来各年的年份t代入上述人口预测模型中,即可计算得到2015-2025年各年的人口总数,其预测的人口数及预测人口增长率如表3。

表3 预测人口数及增长率

3.2计算生活用水量与人口总数的联系度

ukt=akt+bkti+cktj

uk=w1uk1+w2uk2+…wmukm=ak+bki+ckj

上式中,ak为加权后的平均同一度;bk为加权后的平均差异度;ck为加权后的平均对立度。

在这里m=1,也即仅选取对生活用水量影响最大的人口总数作为生活用水量的影响因子,通过上述中介绍的计算方法对3类不同增长率范围的生活用水量系统Ak的同一度ak、差异度bk和对立度ck进行计算,并由此得出联系度uk为:

3.3建立人口数增长率与参照样本的增长率的联系度

由于预测2025年生活用水量需要用到2014-2024年每一年的生活用水量预测数据,因此在这里待预测系统B的影响因子年增长率指2014-2025年每年的预测人口增长率(已在表3给出),根据表3中数据可计算待预测系统B的影响因子年增长率集合与参照样本的年增长率集合之间的同一度、差异度和对立度,并据此给出两者之间的联系度,计算结果如表4。

表4 同一度、差异度、对立度及联系度

3.4各年生活用水量及生活用水量增长率预测

集对分析聚类预测模型的第四步为计算uk与uB的同异反距离[7]ρk,

求得ρk0=min(ρ1,ρ2,…,ρn)。按照择近原则,待预测系统B与分类模式系统Ak0最接近,则归入类别Ak0。用xk0表示分类系统的中心值,则B的预测值可用下式计算[7]:

由表2可知3个分类系统的中心值分别为0.961 25、1.005 3和1.0493 5,再结合同异反距离公式及待预测系统B的预测值计算公式可得2010-2025每年的同异反距离及其生活用水量及其增长率预测值如表5。

表5 2010-2025每年的同异反距离及其生活用水量及其增长率预测值

从预测的结果来看,2014-2025年的生活用水量均属于第二类,即增长率范围稳定在[0.983 3,1.027 3],呈缓慢增长态势,到2025年生活用水量将达到869.06亿m3。将2010-2013年实际生活用水量增长率与预测生活用水量增长率进行比较,计算其预测误差均在2%以内,由此可知集对分析聚类预测模型对于生活用水量的预测具有较高的精度,可以较好地预测长期生活用水量。

4结论

本文建立的集对分析聚类预测模型通过对生活用水量的影响因子——人口总数的长期预测,得到未来10年的年末总人口及人口增长率预测值,利用集对分析联系度思想建立了人口预测增长率集合与参照样本集合之间的联系度,最后利用同异反距离公式及待预测系统增长率预测值计算公式,得到了2015-2025年生活用水量预测值。该模型克服了传统的参数统计预测模型的结构不确定性问题,得到了较为精确的生活用水量的预测模型,为有关部门决策提供了参考,对城市供水系统的管理及改扩建有着重要的意义。同时也为长期预测模型的建立提供了新思路,对同类预测问题有一定的参考价值。

参考文献:

[1]王彬,穆瑞林,卜喆芬.城市生活用水预测方法探讨[J].中国给水排水,1990,6(06):12-15.

[2]张雅君,刘全胜,冯萃敏.多元线性回归分析在北京城市生活需水量预测中的应用[J].给水排水,2003,29(04):26-28.

[3]顾月红,葛朝霞,薛梅,等.北京市生活用水年预报模型[J].河海大学学报,2008,36(01):19-22.

[4]张雅君,刘全胜.城市需水量灰色预测的探讨[J].中国给水排水,2002,18(03):79-81.

[5]马文敏,唐莲.灰色系统理论在城市需水量预测中的应用[J].西北水资源与水工程,2001,12(01):14-16.

[6]杨维,王恩德,陈畅.应用BP神经网络预测城市需水量的探析[J].资源调查与环境,2003,24(03):217-221.

[7]高洁,盛昭瀚.集对分析聚类预测法及其应用[J].系统工程学报,2002,17(05):458-462.

[8]赵克勤.集对分析及其初步应用[J].大自然探索,1994,13(01):67-72.

[9]周戎星.区域用水量驱动因子识别[D].合肥:合肥工业大学,2014.

[10]吴开亚,金菊良,王玲杰,等.集对分析聚类预测方法区域生态足迹趋势预测中的应用[J].武汉大学学报:信息科学版,2008,33(09):973-977.

[责任编辑:刘守义英文编辑:刘彦哲]

Prediction of Future Domestic Water Consumption Based on Clustering Set Pair Analysis

ZHANG Yun-yun,ZHU Jia-ming

(School of Statistics and Applied Math ematics,Anhui University of Finance and Economics,Bengbu,Anhui 233030,China)

Abstract:ObjectiveAccording to the set pair analysis theory,to construct clustering set pair analysis prediction models to make long-term forecasts for domestic water consumption in the future,and analyze domestic water consumption and its growth trends to provide reference for the decision-making of relevant departments.MethodsThe household water consumption time series data from China Statistical Yearbook of 2000 to 2014 were collected.By using the idea of clustering,the growth rate of domestic water consumption from 2000 to 2013 was divided into three categories.And then by using the set pair analysis,the connection degree between the water consumption and the influence factor of the population were determined.Finally,the future water consumption and its growth rate were predicted by predicting the future growth rate of the population in the future.ResultsThe results of the clustering showed that water consumption in 2001-2013 (except in 2012),was in growing trend,and the annual growth rate was stable between 1.02-1.04(except in 2012).The predicted results showed that living water consumption of 2014-2025 years would belong to second category,the growth rate range would be stable in the interval of[0.9833,1.0273],living water consumption would reach 86.906 billion cubic meters.The growth rate of the real living water consumption of 2010-2013 was compared with the forecast of the growth rate of domestic water consumption,the prediction errors were less than 2% by calculating.ConclusionTherefore,the set pair analysis model has high precision for forecasting the water consumption,and long term water consumption can be predicted well.Future living water consumption will be in a slow growth trend and break 85 billion cubic meters in 2025 under a certain growth rate.

Key words:living water consumption forecasting;set pair analysis;clustering prediction;connection degree

基金项目:国家自科科学基金项目(11301001);安徽财经大学教研项目(acjyyb2014104)

作者简介:张云云(1993-),女,安徽六安人,安徽财经大学统计与应用数学学院在读学生,研究方向:应用数学与数学建模。通讯作者:朱家明(1973-),男,安徽泗县人,副教授,硕士,研究方向:应用数学与数学建模。

中图分类号:TV 212.1

文献标识码:A

DOI:10.3969/j.issn.1673-1492.2016.03.008

来稿日期:2015-12-27