APP下载

基于遥感和PPS分层抽样的区域棉花面积估算

2016-02-06胡永森施开分王长耀

河南农业科学 2016年11期
关键词:格网棉花分层

胡永森,王 力,施开分,周 巍,王长耀

(1.东华理工大学 测绘工程学院,江西 南昌 330013; 2.中国科学院遥感与数字地球研究所 遥感科学国家重点实验室,北京 100101; 3.国家统计局 农村社会经济调查司,北京 100826)



基于遥感和PPS分层抽样的区域棉花面积估算

胡永森1,2,王 力2,施开分3,周 巍3,王长耀2

(1.东华理工大学 测绘工程学院,江西 南昌 330013; 2.中国科学院遥感与数字地球研究所 遥感科学国家重点实验室,北京 100101; 3.国家统计局 农村社会经济调查司,北京 100826)

针对传统抽样调查工作面临着野外调查工作量大、资料时效性较低且难以满足人们对数据现势性的高要求等一系列缺点,以新疆棉花种植主棉区沙湾县、玛纳斯县、呼图壁县为研究区,结合遥感技术提出了一种基于PPS分层抽样的空间抽样设计方案,并将该方案用于研究区棉花种植面积的估算。结果显示,PPS抽样与分层抽样结合后极大地提高了PPS抽样反推总体的方法优势。分配样本时分别采用按每层辅助变量之和的期望的算术平方根与该层待抽样单位总数之积、每层辅助变量之和进行比例分配的2种分配方法,其对应的反推总体的估计量变异系数分别为0.008、0.009,相对误差分别为0.016、0.017,分层后的样本变异程度极低,为反推结果的高精度打下了基础。2种样本分配方式的棉花种植面积提取精度均高于94%。该方法不仅精度高,而且在实际操作中简单方便。

遥感; 空间抽样; 样本分配; 外推总体

自20世纪60年代以来,空间遥感技术得到迅速发展,并被广泛应用到农作物长势监测和产量估算[1-3]。如美国的“大面积农作物估产实验计划(LACIE,1974—1977年)[4-5]”、“农业和资源的空间遥感调查计划(AGRISTARS,1980—1986年)[6-7]”,其主要目的就是利用遥感结合空间抽样技术探索监测大区域粮食生产的可行性方法,以满足美国进行资源管理和了解全球作物产量信息的需要,其产量提取精度均达到90%以上[8]。国内早在1984年就开始了由国家气象局组织的北方11省市冬小麦气象卫星遥感监测综合测产技术的研究[9],在农作物遥感监测中借鉴欧盟的“农业遥感监测计划(MARS)”也采用了分层抽样的方法[10],大量试验证明,分层抽样的方法也适用于我国复杂地形的特点,并且取得了很好的效果[11]。如陈仲新等[12]基于遥感技术采用分层抽样方法,建立了关于全国冬小麦面积变化率估计的一套抽样外推方法。王迪等[13-14]通过分析不同的抽样单元尺寸下抽样单元的空间相关性,并引入变异系数(CV)和相对误差(r),定量评价了不同抽样单元尺度下冬小麦面积的空间抽样效率,并在山东省冬小麦播种面积的研究中,结合遥感采用两阶段抽样方法同时优化了第一阶段的抽样体系设计,对山东省冬小麦播种面积进行估算,取得较优结果。张锦水等[15]以格网为抽样单元进行分层空间抽样,对分层层数、格网大小进行了优化设计的研究。

目前,我国农作物对地抽样调查工作主要由国家统计局农村社会经济调查司来完成,其中野外调查工作是由各省、市、县的农调队辅助完成[16]。因此,在改进传统统计调查手段的同时,结合遥感进行空间抽样方案设计的农作物面积估算新型统计方法应与国家统计部门的统计业务相结合,并尽可能利用其现有的农调队等资源。在抽样技术发展的过程中,不等概率抽样是目前统计抽样调查中最为重要的方法之一,并且至今仍在不断地完善和提高当中[17]。PPS抽样(sampling with probability proportional to size,PPS)很好地继承了不等概率抽样的特性,其将总体中每个待抽样单元的入样概率与其对应的规模大小很好地联系起来,具有很高的外推精度[18]。分层抽样作为一种常用抽样技术,不仅具有高精度、组织实施便利等优点,还可对子总体的设计变量进行估计,以便提取子总体信息,对分层界限进行优化等优势,这在很多实际问题中是非常关键和重要的。分层后的样本在各层的变化较为连续和缓和,对PPS抽样效率的提高具有很好的辅助作用。因此,基于前人研究经验和成果,以棉花种植面积为例,结合国家统计局现行对地抽样调查业务,将分层抽样引入到PPS结构中,提出一种基于遥感和PPS分层抽样技术的两阶段空间抽样设计方案,旨在为改进现行的棉花种植面积调查业务提供参考。

1 材料和方法

1.1 研究区概况

以新疆棉花种植主棉区沙湾县、玛纳斯县、呼图壁县三县为研究区(图1),研究区内还包括新疆建设兵团的新湖农场、芳草湖农场及其他13个团场的部分区域,以区内耕地中的棉花种植面积为研究对象。本研究区位于北疆天山北麓地区,是北疆重要的棉花产区,棉花种植面积占全疆棉花种植面积的20%以上,矿产资源丰富,属中温带大陆性气候。主要种植棉花、玉米、冬小麦等作物。

黑色区域为棉花,空白区域为其他作物或者未种植任何作物

1.2 数据源

受经济因素和遥感影像获取的制约,一般不会采取使用高分辨率遥感数据对研究区进行全覆盖分析。因此,这里主要采用30 m左右的中分辨率遥感图像进行拼接得到研究区域的遥感影像图,通过对比研究棉花和其他作物物候、光谱信息的差异,选取最有利于遥感技术识别棉花的时相进行分类,得到中分辨率农作物分类图,用它作为抽样框中的数据,为抽样体系的设计工作提供数据支持。在第一阶段抽样中抽中的一级样本地块用高分辨率影像进行覆盖,第二阶段抽样工作则在一级样本地块内进行,抽出二级样本,对二级样本进行野外调查,调查结果用于对覆盖对应一级样本的高分辨率影像进行监督分类[19-20]。根据时间可获取性以及精度的要求,中分辨率影像采用Landsat OLI/TIRS(OLI陆地成像仪)、环境与灾害监测预报小卫星星座(以下简称“HJ星”)和高分一号卫星影像为数据源,高分辨率影像采用高分一号2 m的全色影像和8 m的多光谱影像融合得到。

1.3 研究方法

1.3.1 抽样框大小的选取 选择正方形格网作为抽样框,在编制抽样框的过程中,通过分析计算不同抽样单元尺度的全局空间自相关指数(Moran’sI)及对应的显著性检验指标Z Score的变化范围[21],同时参考中分影像分类结果并结合当地棉农种植习惯来确定合适的抽样单元大小,使抽样单元间空间正相关性相对最弱,抽样方差相对最小,最终确定一级格网抽样框为3 km×3 km。将每个一级格网内部分割成300 m×300 m的二级小格网样地,并抽取部分二级小样地作为辅助后期野外调查使用。Moran’sI计算公式如下:

(1)

1.3.2 样本总量及分层数的确定 在确定样本总量及分配方式前,首先对抽样单元进行分层,在分层界限的选择上,利用辅助变量确定分层界限[22]。利用分类后研究区中分辨率遥感影像(图1)为抽样框提供数据支持,选择格网中棉花种植面积占耕地面积比例作为分层界限,利用累积频数均方根法进行分层。一般来说,在忽略有限概率空间(finite probability space,fpc)的条件下,只要满足每层样本量nh≥2,层数越多精度越高。但是当层数L>6时,精度的提高随层数的增加变得微乎其微,故理论上一般以6层为最好。但是由于调查费用的限制以及目标变量的分布等客观原因,结合实际情况将研究区的待抽样格网分为4层。为了既提高抽样效率又达到对研究区新生棉花种植面积变化进行监测的目的,仅将棉花种植区域附近的荒地单元按系统等距抽样抽取10%加入到总体格网,将其分配到第1层对其进行抽样调查,剩余的荒地单元则不参与到抽样和后期计算。

根据分层抽样样本总量测算方法[23],确定样本总量的粗估量。在后期确定各层的分配方式及各层样本数量后,对各层按分配的样本量进行抽样确定样本。由各县农调队对样本进行实地考察并反馈信息进行问题样本的调换,确定最终抽样总量及样本的最优空间位置。

(2)

(3)

Phi为第h层第i个格网的入样概率,nh(h=1,2,3…,k)为各层样本量,yhi代表第h层第i个单元的指标值,Nh代表第h层的总格网数,nh为各层样本量,样本总量n=n1+n2+…+nk。

(2)Zh的粗估方法。本研究区中所涉及的3个县均为棉花种植大县,因此在有棉花种植的格网中棉花的种植面积往往与耕地面积成近似正比关系,假设子总体中第h层的Nh个值(yhi,xhi)是一个超总体随机样本,其中i=1,2,…,Nh,则有关系:

yhi=βxhi+εhi

(4)

(5)

(6)

野外调查主要分为2个阶段:第1阶段在抽选样本后,由统计局下属的各县农调队对样本进行实地考察,对样本地块的实际情况(如由于新疆地域较广样本查找困难,样本地块作物发生变化等)进行反馈,对问题样本进行微调。第2阶段使用手持PDA导航对最终确定的一级样本地块内部随机选取的3个300 m×300 m二级样本进行实地调查,用于后期对相应一级样本地块的遥感影像分类。

(7)

(8)

2 结果与分析

根据野外调查数据对一级样本进行分类后,得出反推总体(各层棉花种植总面积)所需数据,估算出各层及总体棉花种植面积。将总体估算结果对比2014年新疆维吾尔自治区统计局和新疆建设兵团统计局公布数据,求出估算精度,并计算总体和各层的CV及r,进行精度评价。

表1 精度评价指标计算结果

3 结论与讨论

针对传统抽样方法时效性较低、作业量大等缺点,提出了基于遥感技术的空间抽样方法,并将其与国家统计局对地抽样调查业务相结合,充分利用了统计局现有资源。本研究以新疆棉花种植主棉区沙湾县、玛纳斯县、呼图壁县三县为研究区,引入变异系数(CV)和相对误差(r)作为评价指标,结果表明,研究区内总体总量的简单估计量的CV和r较小,棉花种植面积提取精度均高于94%,同时在实际操作中该方法可行性较强,外推数据现势性高。

但在对样本的调查中发现,有些样本距离居民居住地较远,寻找样本十分困难甚至难以到达样本所在地,因此,在抽样前充分考虑样本的空间位置,对已抽样本进行大致勘察和微调是十分必要的。同时由于新疆地广人稀,在分层和抽样时可考虑在基于抽样原理的前提下,提高人为调控所占的权重,多增加棉花种植集中区的层数和样本数,集中主要资源对其进行调查,提高其估算精度,在剩余棉花种植稀少的大区域地方人为调控减少分层数和样本量,以此来达到提高整体调查精度和避免人力物力等资源浪费的预期效果。此外,本方法中的研究区域为棉花主产区,对于重棉区和有棉区是否仍有极大的优势还需进一步探讨。

[1] 蒋桂英,李少昆,王登伟,等.棉花遥感应用进展[J].新疆农业大学学报,2002,25(3):76-79.

[2] 洪保章.毛豆遥感光谱与地上鲜生物量的相关分析[D].福州:福建农林大学,2006.

[3] 李刚,杨粉团,姜晓莉,等.遥感技术在玉米栽培中的应用研究进展[J].玉米科学,2010,18(5):149-152.

[4] 吴全,杨邦杰,裴志远,等.大尺度作物面积遥感监测中小地物的影响与双重抽样[J].农业工程学报,2004,20(3):130-133.

[5] 周清波.国内外农情遥感现状与发展趋势[J].中国农业资源与区划,2004,25(5):9-14.

[6]ChhikaraRS,HoustonAG,LundgrenJC.CropacreageestimationusingaLandsatbasedestimatorasanauxiliaryvariable[J].IEEETransactionsonGeoscienceandRemotesensing,1986,24(1):155-168.

[7] 刘海启,金敏毓,龚维鹏.美国农业遥感技术应用状况概述[J].中国农业资源与区划,1999,20(2):56-60.

[8] 陈水森.基于波谱库的作物纯像元识别与种植面积遥感估算[D].北京:中国科学院研究生院遥感应用研究所,2005.

[9] 肖乾广,周嗣松,陈维英,等.用气象卫星数据对冬小麦进行估产实验[J].环境遥感,1986,1(4):260-269.

[10] 王力凡,潘剑君.利用高-中-低精度遥感的大区域高精度耕地面积估测分析[J].江西农业学报,2011,23(4):153-155.

[11] 刘海启.大尺度耕地变化监测的遥感抽样方法研究[J].农业工程学报,2001,17(2):168-171.

[12] 陈仲新,刘海启,周清波,等.全国冬小麦面积变化遥感监测抽样外推方法的研究[J].农业工程学报,2000,16(5):126-129.

[13] 王迪,周清波,陈仲新,等.冬小麦种植面积空间抽样单元尺寸优化设计[J].自然资源学报,2013,28(7):1232-1242.

[14] 王迪,周清波,陈仲新,等.空间抽样方法估算冬小麦播种面积[J].农业工程学报,2012,28(10):177-184.

[15] 张锦水,潘耀忠,胡潭高,等.冬小麦种植面积空间抽样效率影响因子分析[J].农业工程学报,2009,25(8):169-173.

[16] 邬明权,杨良闯,于博,等.基于遥感与多变量概率抽样调查的作物种植面积测量[J].农业工程学报,2014,30(2):146-152.

[17] 蔡择林.PPS分层抽样时样本单位数的设计[J].湖北师范学院学报(自然科学版),1996,16(6):51-55.

[18] 史京京,雷渊才,赵天忠.森林资源抽样调查技术方法研究进展[J].林业科学研究,2009,22(1):101-108.

[19] 许伟,奚砚涛.基于Landsat8遥感影像的合肥市土地利用分类[J].湖北农业科学,2015,54(15):3625-3629,3637.

[20] 任广波,张杰,马毅,等.基于半监督学习的遥感影像分类训练样本时空拓展方法[J].国土资源遥感,2013,25(2):87-94.

[21] 王迪,周清波,陈仲新,等.玉米种植面积空间抽样调查方案优化设计[J].农业工程学报,2014,30(8):117-125.

[22] 杜子芳.抽样技术及其应用[M].北京:清华大学出版社,2006.

[23] 冯士雍,施锡铨.抽样调查:理论、方法与实践[M].上海:上海科学技术出版社,1996.

[24] 潘耀忠,张锦水,朱文泉,等.粮食作物种植面积遥感测量与估产[M].北京:科学出版社,2013.

Estimation of Regional Cotton Area Based on Remote Sensing and PPS Stratified Sampling

HU Yongsen1,2,WANG Li2,SHI Kaifen3,ZHOU Wei3,WANG Changyao2

(1.Faculty of Geomatics,East China Institute of Technology,Nanchang 330013,China; 2.The State Key Laboratory of Remote Sensing Science/Institute of Remote Sensing and Digital Earth,Chinese Academy of Sciences,Beijing 100101,China; 3.Rural Socio-economic Survey Department,National Bureau of Statistics,Beijing 100826,China)

The method of traditional sampling survey work has two major drawbacks.One is the large workload,and the other is the outdated basic data.It is difficult to meet the people’s high requirements of data updating.In order to solve those problems in a conditional sampling survey,a novel crop area extraction method was proposed in this paper using remote sensing and PPS stratified sampling technology.The algorithm had been tested over a study area in counties of Mnasi,Hutubi and Shawan which are all cotton planting base counties.The results showed that the combination of PPS sampling and stratified sampling greatly improved the overall method advantage of PPS sampling.Two proportional distribution methods for sample distribution were adapted,which were the product of the sum of the desired arithmentic square root of each layer of auxiliary variables and the total number of units in each layer,the sum of auxiliary variables per layer.The variation coefficients of population of extrapolated population total were 0.008 and 0.009 by two proportional distribution methods,and the relative errors with two distribution methods were 0.016 and 0.017.The degree of variation of samples was very low after stratification,which layed the foundation for the high precision of the result.The total area accuracy of cotton planting reached more than 94% by the two sample distribution method.This method not only has high precision,but also is simple and convenient in practical operation.

remote sensing; spatial sampling; distribution of samples; extrapolated population

2014-07-19

国家统计局新疆棉花种植面积遥感调查项目;国家自然基金项目(41371358);国家“863”计划项目(2014AA06A511);国家科技重大专项(14CNIC-032079-32-02)

胡永森(1990-),男,河南周口人,硕士,主要从事农业遥感研究。E-mail:1042202325@qq.com

TP75

A

1004-3268(2016)11-0155-05

猜你喜欢

格网棉花分层
棉花是花吗?
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
实时电离层格网数据精度评估
棉花
矢量点状数据抽稀方法的研究与实现
一种沉降环可准确就位的分层沉降仪
雨林的分层
有趣的分层
心中的“棉花糖”
第三讲 棉花肥害诊断及其防治