APP下载

云计算下的大数据在统计中的应用研究①

2017-05-30李莎

中国商论 2017年3期
关键词:统计大数据

摘 要:伴随着信息化对经济社会的发展,大数据研究已成为当前的热点,成为了一种重要的生产要素,发挥着重要的经济作用。本文将大数据运用在统计工作中,结合绍兴地区的实际情况描述了当前农产品生产者价格存在的问题,并对其进行了分析,最后给出了解决的思路。

关键词:大数据 统计 农产品生产者价格

中图分类号:F323.7 文献标识码:A 文章编号:2096-0298(2017)01(c)-154-03

大数据的快速发展对统计学发展产生了及其重要的意义,它能够对数据总体进行相关性分析,对数据的相关性和实时性更为重视,有别于传统方式中的通过样本来分析总体的方法。目前大数据技术主要是对数据资源进行整合,利用数据挖掘和现代信息技术架构高速数据处理平台,为政府统计工作提高强有力的决策支持功能及应用价值。中央在2014年1号文件中提出”编制和发布权威性农产品生产者价格指数”,这就对农产品价格在统计方面提出了更高的要求。大数据能够为政府提供大量的结构化数据和丰富的原始资料,极大的丰富了数据来源,提高了数据搜集效率,缩短了数据采集时间,提高了统计数据质量。农产品生产者的价格在市场经济中占据具有的作用,加上其具有直观性,易获得性和数据量大的等点,因此引入大数据进行分析具有巨大的优势。 将农产品生产者价格作为研究对象,这样做有三个目的;(1)从价格入手能够更加深入地运用大数据在政府统计中的进行分析;(2)农产品生产者价格的调查之前已经累积了丰富的数据资源,有较大的改善空间;(3)研究为国家以后发布相关的农产品生产品价格的指数提高参考,丰富农产品生产者价格,更好地为研究农产品生产者价格运行、预警提供服务。

1 绍兴地区农产品生产者价格调查分析

绍兴地区自古以来农产品颇为丰富,绍兴主城区的黄酒、鱼干、腐乳、腊肠,诸暨的香榧、绿剑茶、同山烧、珍珠,上虞的杨梅,嵊州的炖鸭,以及新昌的大佛龙井、小京生、绿茶油等名优特产。由于农产品种类众多,各种产品的性质不同,因此如何能够更好的对这些农产品生产者进行价格调查,为政府制定相应的统计数据信息就显得尤为重要。

1.1 绍兴农产品生产者价格调查的必要性

一个地区农产品生产者的价格主要是指该地区农产品生产者直接出售其产品实际获得的单位产品的价格,开展农产品生产者价格调查的目的在于对绍兴地区的农产品生产者价格资料进行全面收集和整理,从而在一定程度上客观反映地区的农产品生产者价格水平与农业产业结构调整情况,满足农业与国民经济核算的需求,向社会各界提供优质的数据信息服务,为各级政府制定农业政策和保护农产品流通政策提供充分的决策依据。

1.2 绍兴农产品生产者价格调查情况简述

农产品生产者价格的调查对象为主要的农业生产经营单位,对于有具体详细农产品出售数据的生产经营单位采用随机抽样和重点调查相结合的方式,对于农产品销售量比较大的地区(比如香榧、花生等)采取主观选样的方法进行选取。抽样的时候选取在绍兴地区范围内70%的农产品地区作为编制样本选取的范围,在该范围下,将农产品分为“上、中、下”三个层次,在上层中所有的生产者都作为样本,在中层中所有生产者都采用抽样法直接选取样本,在下层中生产者首先选出行政村的样本,然后采用简单的随机抽样方法选出农产品生产者价格样本。农产品的价格作为调查的对象主要是生产并出售的主要农产品获具有代表性的农产品,农村调查员将农产品的名称、价格、数量和金额计入到生产者价格调查台账中,有绍兴市统计局在每个季度末进行收集、整理和录入。本次农产品价格调查样本主要分布在绍兴地区的5个村,共50家农户,选取样本共计100个。

1.3 农产品生产者价格计算方法

(1)采用加权算术平均法计算某一个被调查的农产品的平均价格

某个产品出售的金额之和除以该产品出售数量之和,得到该产品的平均价格。

2 農产品生产者价格统计数据存在的问题及原因分析

2.1 数据质量有待提升

绍兴农产品生产者价格调查涉及四个大类,28个小类,180余种产品,每个分类都需要计算出一个权重值,然后再通过四大分类的权数和季度指数汇总计算出农产品生产者价格数据。目前要完全准确地收集到所有品种的农产品销售数据很难做到,农产品生产者价格调查的权重值主要是根据所有用户的调查数据进行整理和计算,并参考农业生产总值来进行评估,记账分类是目前使用最多的一种方法,但优点在于计算大类权数,缺点是对于小类和具体品种计算不准确,因此使得农产品生产者价格调查的权重值出现缺失,造成了权重值的计算误差,从而影响到整体数据的准确性。

2.2 调查制度不够完善

农产品生产者价格调查的指标体系,调查方式和调查内容设计都存在一些问题:首先指标体系近似,由于农产品生产者价格指标与集贸市场中的价格调查重复,且大部分都集中在粮食、蔬菜、水果上,指标内容设计相似,不仅增加了人力和物力,还会发生数据趋势不吻合的情况,造成一定的影响;其次固定的调查品种无法适应变换的的种植结构,从已有的农产品生产者价格调查情况来看,农户生产者的品种是动态的,每一年或者每季度都有可能与之前不同,因此在调查过程中可能会出现超过调查品种的产品,从而导致农产品信息不全;最后部分品种种类设置不合理,目前部分品种分类不够合理,农产品生产者价格记账要求按照农业统计制度中的农产品参考目录进行分类,有一些分类不够合理,有一些过于粗糙,因此造成了调查制度方法的不完善。

2.3 数据采集难度较大,效率有待提升

目前,绍兴地区的农产品生产者价格调查样本就是采用住户调查样本点,但根据国家统计局的规定农产品生产者价格调查必须在所有的农产品生产者价格调查单位独立记账,将出售的农产品的数量、出售的金额和出售的单价都需要记录在台帐上。但从实际情况来看,存在以下的问题:一是需要记账的工作量非常大。调查用户每天需要登记住户的调查现金日记账和农产品生产价格台账,由于数量庞大和每天都需要重复,因此容易导致用户出现厌烦情绪,这样会导致记录不准确,容易出现遗漏记录和错误记录等情况。二是记账不及时。农产品生产者种类比较多,有些农产品生产者并不是每天都有商品的售出,有的农产品生产者生产的产品具有很强的季节性,在某一个季节中一个产品都没有,而在有些季节中有很多产品,因此无法做到及时记录记账信息。三是调查员的水平差异不同。根据不同的商品种类,把不同的出售产品单独从现金日记账簿中挑选出来是需要具有一定的会计方面知识的,如果不具备此能力,则很难完成记账任务,因此都会采用辅助调查员来完成。四是部分未参与调查的用户担心自己的核心价格数据外泄,因此故意虚报了生产者价格,再加上统计工作中用户的规模数和调查单位数据占据比重比较大,因此对整体的数据操作了影响,影响了评估的效果。此外有关农产品的很多数据都集中在一些比较热点的品种和交易平台上,加上目前很多网站同质化现象十分严重,对于一些品种的价格数据很难进行准确地搜索,并且有些产品还具有不同规格而缺乏参考价值等情况,因此对于一些特定的小品种数据在年份建设中具有缺失性,无法在时间上建立同条件的序列上的比较。

2.4 传统获得样本代表性不足,无法满足分级需求

随着因特网技术的不断推广,部分农产品生产者价格的调查采用网上的方式来进行,这在具有良好的网络基础的农村是可以的,但有些地方地处偏远,网络基础稍差,因此获得样本数据的真实性存在一定的遗漏。以绍兴地区的诸暨香榧和新昌茶叶为例,有些农作物的主产区相对比较分散,种植规模大小不一,并且这些农产品可能并不具有代表性,因此这种相对频繁的、单一的轮换的方式使得样本对总体的代表性有所不足,从而影响数据的的连续性和可比性。

3 农产品生产者价格调查中应用大数据的对策分析

3.1 统一规范大数据的统计标准

建立对大数据的统计标准是关系到大数据能否在相关的政府统计工作中运用的关键,同时也使数据具有统一性、准确性和连续性。由于大数据本身就包含了各种类型的不同数据,数据渠道来源十分广泛,且数据量十分庞大,各种数据的结构十分复杂,为了能够更好地发挥大数据在农产品生产者价格中的应用,必须要对大数据的运用采用统一的统计标准,才能有效地保证统计数据的准确性和客观性。政府统计部门需要制定一系列的规范统计标准,比如相关指标解释、明确的统计分类、设定的调查范围以及一些相应的计算方法等,必须在统一标准的框架之内进行数据的搜集和处理。

3.2 强化顶层设计,重视农产品元数据

由于农产品自身具有的特点,导致农产品生产者价格的数据参差不齐,因此首先需要通过标准化的设定来将各种数据进行指标分类,从中找出事物之间存在的联系,在进行大范围的相关调查基础上,以统一规范为核心,以政府统计调查的指标体系和农产品价格的元数据作为基础,整合现有的数据,强化统计中的顶层设计,制定总体规划、方案和相关配套文件,制定大数据的使用基本原则、相关工作流程和操作规范,采用电子化的方式对数据进行标准化定义,通过结构化和非结构化的数据类型来设计报表,选定不同的数据类型的样本范围,实现政府统计从抽样调查向抽样调查、搜索方式相结合的转变方式,因此需要在设计报表的时候,完善基层表的设计,改进原来基层表的结构,以便能够更好地进行数据的相关规范。

3.3 扩展农产品数据采集渠道

在大数据格局中,统计单位可以随时了解各个农产品市场终端的数据变换情况,同时将现有的农产品交易网站纳入大数据体系,对这些数据进行利用,有效地改变传统的单一的记账方式,一边以被调查单位上报时间点的价格为主,同时另一边以网络大数据中部分农产品生产者价格为辅,科学确定采价的周期,为政府统计调查提供合适的数据补充,能够切实有效的减轻基层报表负担。

3.4 建立适合农产品的大数据技术支撑体系

在农产品生产者价格的相关统计中使用大数据,核心的技术主要包括相关的农产品价格的数据采集和数据挖掘、分析。目前有很多的大数据的技术相关,包括如何并发的处理数据,如何有效的进行数据挖掘,如何进行分布式处理以及虛拟化和内存计算等等,这些技术都已有成功的经验,但专门适合农产品生产者价格大数据分析的不多,另外大量的数据广泛地存在了互联网上,如何能够进行合适的搜集、处理和分析的大数据软件是政府统计部门的必要条件。因此有关农产品方面的统计需要相关统计部分业务进行充分分析,开发出适合的软件,既能满足职能要求,又能够满足数据安全的需求。大数据运用的安全风险应该严格对信息系统安全管理的要求和标准,从而制定相关的完善的管理制度和安全管理机构,在系统运行过程中建立有效的管控机制,随时明确大数据安全管理的职能,定期进行检修和检查。

3.5 培养全方位的人才体系

在农产品生产者价格的统计工作是运用大数据,需要不断地学习发达国家的甚至是具有代表性的互联网企业在处理大数据方面的经验,更需要加强相关政府统计部门的人才队伍建设,在引入技术人才的同时,也需要考虑人才是否能和农产品相“结合”,促使统计人员不断地学习和掌握新的相关知识和技术,改变自身的知识结构,提高整体的综合素质,同时需要与相关的大学、企业进行合作,通过向高校定向培养统计方面的人才,并开展集中运用大数据的专题讲座,努力培养具有丰富经验和良好的统计思维,又能娴熟掌握信息技术的复合型人才,适应大数据的需求,推动相关农业统计事业的发展。只有健全基层信息管理机构,才能为人才培养搭建平台,通过在县、乡、镇设置专门的机构,将会为推动统计化信息化管理,为大数据后备人才培养发挥重要的作用。

4 结语

深入研究大数据在政府统计工作的运用方法,具有重要的理论意义和现实意义,本文通过对大数据进行理论研究,结合绍兴地区的实际情况,将农产品生产者价格作为研究对象,分析了农产品生产者价格中存在的问题,并指出了使用大数据存在的问题和困难,提出了在政府统计调查中运用大数据的对策。

参考文献

[1] 李芳.大数据在政府统计工作中的运用研究[D].云南大学,2015.

[2] 张淑英.加强农产品价格调查为健全农产品市场体系服务[J].调研世界,2003(4).

①基金项目:2016年浙江省统计研究课题(云计算下的大数据在统计中的应用研究——以绍兴地区农产品生产者价格为例)。

作者简介:李莎(1981-),女,讲师,在职硕士,主要从事会计、统计方面的研究。

猜你喜欢

统计大数据
2008—2015我国健美操科研论文的统计与分析
山东省交通运输投资计划管理信息系统的设计
市场经济背景下的会计统计发展探究
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
统计信息化在企事业单位人力资源管理中的应用研究
信息化时代如何加强统计信息化管理