APP下载

进一步扩充数据对大数据低密度价值的影响

2018-12-22袁桓涛深圳外国语学校高三

数码世界 2018年3期
关键词:摩尔定律数据量低密度

袁桓涛 深圳外国语学校高三(9)班

1 大数据综述

数据是能够客观反映事实的数字和资料,而大数据则强调了数据的广泛与全面。学者认为:大数据因自身蕴含的大量信息而可以表征事物更多更全面的属性。权威学者维克ViktorMayer-Schonberger认为,大数据时代是没有样本的时代,所有的样本即是全部数据。[ ]然而,从目前的硬件、软件条件来分析,这种“全数据样本”的数据分析方式将会占用大量的存储空间和存储能量,是现阶段不能实现的。因此,获取的数据不一定足以揭示完整的分析对象,我们目前的大数据并不是理想中的大数据。

从数据的体量来看,大数据的“大”是相对的。在目前常见的定义中,大数据通常用来指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。“新摩尔定律”曾经提出,全球信息总量每18个月即会翻一番。全球数据量 在2012年约为2.7 ZB,按照“新摩尔定律”,在2020年将超过86 ZB。

即使是相同的对象,随着技术的进步,获取到数据的体量、类型也会不断增长,人类永远只能逼近“全数据”这个概念却不可能精确达成。在这种情况下,人类的数据处理能力能适应“新摩尔定律”所揭示的数据高速增长吗?

2.大数据的局限

据统计,2012年产生的有效数据中有97%没有得到分析利用就遭到删除,目前来看,丢失的数据将无法找回,将永久性的成为“数字阴影”。此外,由于“数字阴影”的存在,人类社会并不会同步进入大数据时代,大数据、小数据和无数据分布于社会的不同区域。来自大数据的分析结论在小数据世界不一定有普遍适用性而有些无数据的研究领域也并非依靠数据就可以获得突破性研究。例如,2008年汶川、2013年雅安地震的社交网络数据大部分集中在成都等大型城市,而相对偏僻的地区,由于电力、通信系统瘫痪几乎统计不到相关数据。如果利用当时的大数据平台——社交网络数据对灾情进行分析,是无法覆盖受灾最严重地区的情况,在这种状况下,实际的工作开展依靠的是军队开路的低数据搜索,而这也被证实为最为有效的应急方法之一。

3.大数据的低密度价值

在大数据时代之前,人们利用不同的采样方法缩小数据规模,力求用少量的数据来代表性地描述事物的特征。而这类数据包含大量有用的信息,因为人们依据专门的用途对事物进行了抽象。而在大数据时代,样本数目不断增加,逐渐逼近原始的总体数据,人们为了能够分析所有细节信息,直接处理全体数据而非样本数据。这一做法跳过了许多数据精简、分类、区分的步骤,无形中引入了大量无用或虚假的数据。据互联网数据中心预测,全人类即使到2020年也仅有33%的数据算得上有效数据。因此,为了保证足够的有效信息,一般不对数据进行删除。这就造成了数据绝对量的持续猛增与有效信息量的相对稳定之间的矛盾——数据低价值密度。大数据价值的低密度造成了技术与成本上的巨大挑战。这种数据规模使得数据学家进行数学分析的难度不亚于大海捞针。例如,一个生态学家想分析过去10年美国蒸散发量的变化,下载的图像数据就达3TB,需要4000CPU小时来处理,最后只生成小于100M的分析结果,如果转化成纯文本语言的话可能更少。这充分地说明,大数据时代的数据量巨大、然而却难以高效地产出。本文将大数据低密度价值产生的原因归纳为以下几点:

3.1 数据量庞大,有效数据难以进行分析处理。

3.2 大数据的价值或者最能体现它优势的在于它对市场的快速反应,然而市场快速变化使得数据与人脑思维存在“数字鸿沟”,人类难以及时做出及时相应变化的数据或数据分析。

3.3 数据的采集往往不及时,数据样本不全面,会导致数据的真实度降低。

4.总结

目前大数据的算法是基于电脑计算机的学习,开发、学习难度较大,而且对硬件软件要求都十分苛刻,成本与产出也并不成正比。目前的数据使用情况在今后的较长时间内恐怕都难以得到进一步的提升,这使得大数据为用户或企业带来的利益不是直接有效的。大数据当前的问题在于数据流量已经超过了计算机的计算负荷、同时大量的隐含信息因为人类的思维意识无法突破“数字鸿沟”导致并不能为人类所使用。在这种情况下,本文认为应当暂缓对于数据的进一步扩充,转而对已有的精确数据进行深度学习,对现有的计算机硬件进行升级,采取计算机深度学习的方法不断地现有的数据进行重复挖掘、从而改变大数据目前被贴上的“低价值密度”的标签,使得大数据的数据能够拥有更高的价值。

[1]陈喜乐,朱本用,刘伟榕.大数据分析的理论与实践挑战[J].自然辩证法研究,2016,32(07):90-95.

[2]维克托.迈尔-舍恩伯格,等.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

[3]马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013(2):10-17

猜你喜欢

摩尔定律数据量低密度
低密度隔热炭/炭复合材料高效制备及性能研究
新型低密度Nb-Ti合金组织及性能研究
基于大数据量的初至层析成像算法优化
摩尔定律
高刷新率不容易显示器需求与接口标准带宽
低密度超音速减速器
摩尔定律
低密度脂蛋白
电力营销数据分析中的数据集成技术研究
固定资产管理系统对物流管理的促进和发展