APP下载

大数据技术对天文物理学发展的影响

2018-02-21刘峻良

科技视界 2018年33期
关键词:发展史大数据技术

刘峻良

【摘 要】现代大数据技术的发展对于各个学科的贡献都非常显著,本文以开普勒定律的发展历史为例,探究大数据技术在天文物理学的发展史中所造成的影响。

【关键词】大数据技术;天体物理学;开普勒定律;发展史

中图分类号: P11 文献标识码: A 文章编号: 2095-2457(2018)33-0177-002

DOI:10.19694/j.cnki.issn2095-2457.2018.33.080

1 研究背景

在当今大数据时代的背景下,科学技术保持着飞速发展的势头,随着时代的改变,科学技术的发展方式也随之变化。从最为古老的心算、纸算、口口相传到现代的大数据库整理,从个人研究到现在的全球思维风暴,科学技术的发展速度得到了质的飞跃,但飞速发展的同时又有其弊端。本文以开普勒三定律的发展进程为例,探究大数据技术对天文物理学发展的影响。

2 大数据技术对开普勒三定律发展的影响

2.1 大数据技术简介

“大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合”。过去人们理解的数据在很大程度上指的是数字,是一种方便处理、能够计算的数字数据,而如今的“大数据”不仅仅是数字,还囊括了包含文本、图片、音频、视频等在内的一系列形式和格式,涵盖的内容十分丰富。大数据技术包括对数据的采集、存储、管理、处理、分析、隐私、安全等各个方面。

另外,大数据在当今时代还具有非常丰富的载体类型,例如现在的博客、论坛、音视频分享、新闻播报、互动信息等等,都是现代主流的载体形式,也正是这些载体形式让大数据保持流动,让大量的数据进行不停歇的交互,从而对知识进行反复印证。大数据的作用是收集、分析大量信息,目的在于从复杂的数据里找到过去从未昭示的规律。

2.2 大数据在开普勒三定律发展中的影响

2.2.1 开普勒研究三大定律的原始数据的获取及积累

16世纪后半叶,第谷对于天文物理学的研究为开普勒提出三大定律提供了坚实的基础,这也正是开普勒三定律研究的最原始“数据库”。第谷于1572年发现仙后座中的一颗新星,受丹麦国王腓特烈二世的邀请在汶岛建造天堡观象台,20年的观测、积累使第谷拥有了第一手的观测数据积累,并依此提出了一种介于地心说和日心说之间的宇宙结构体系,第谷编制的恒星表也流传至今,仍然对天文物理学的研究有很大的价值,恒星表的保存及流传也是大数据技术中数据留存功能的体现。

1601年第谷逝世后,开普勒接替第谷的工作编制鲁道夫星表,同时也继承了第谷的數据积累资料,这其中体现了一手数据的传递。“但开普勒的兴趣和注意力却更多的放在改进和完善哥白尼的日心说上,在探讨行星轨道性质的研究上。他发现第谷的观测数据,与哥白尼体系、托勒密体系都不符合。他决心寻找这种不一致的原因和行星运行的真实轨道”。开普勒通过对前人观测数据的整理和研究发现了疑点,并因之确定了自身的研究方向,这是大数据在文本模式下的雏形对于科学研究的影响体现。

2.2.2 开普勒研究三大定律的原始数据发展与创新

确定了研究方向后他以火星为例运用统治人类思想达2000余年的匀速圆周运动加偏心圆来计算,通过长达4年对各种行星轨道形状设计方案的计算,开普勒认识到哥白尼体系的匀速圆周运动和偏心圆的轨道模式与火星的实际运动轨道不符,于是他尝试用别的几何曲线来描述火星轨道的形状。这里可以把“匀速圆周运动加偏心圆的轨道模式”这种已被当时物理学界接受的概念认为是一种数据信息,而由于这种数据本身就是错误的,所以对它再分析的整个过程就是白费功夫。这表明数据在传递过程中会出现错误,所以数据的质量把控在学术研究和应用领域影响着分析结果的有效性和真实性,对没有质量保证的数据作出相关预测可能会出现虚假信息,这种信息会直接导致偏离原本预期的决策。开普勒坚信看似杂乱无章的数据背后一定隐藏着某种数学关系,通过使用新的计算模型对数据进行推演的过程就是数据分析的过程。在开普勒第一和第二定律的发现过程中,其理论体系中掺杂着许多的猜想和假设甚至是错误的内容,例如在面积定律的推导使用了距离定律,在椭圆轨道定律的建立中使用了摆动理论,开普勒通过不断地澄清这些错误,最后终于得到了正确的行星运动定律,可见对一堆杂乱无章的大数据要通过分析发现其规律的绝非一蹴而就,需要借助正确的数据分析方法才能有所创新发现,正如布拉赫在在天文学上的观察到的数据只有通过开普勒的分析处理技术才能点石成金,从而成为推动天体物理学发展的革命因素。

在发现行星运动的轨道定律和面积定律后,开普勒渴望找到一种能适合所有行星的总体模式,找到各行星之间的内在联系。经过九年的反复计算和假设,终于1618年找到在大量观测数据后面隐匿的数的和谐性:行星公转周期(T)的平方与它们到太阳的平均距离(R)的立方成正比,这就是周期定律。在开普勒的所处的时代,对数和对数表还没有发明,只能采取尝试的方法寻找观测数据背后所隐藏的规律,这样就可能在花费大量时间的同时一无所获,其研究的周期之长、付出的劳动之艰辛是令人难以想象的,其成功具有偶然性,很有可能终其一生也会一无所获。而在数据分析技术不断发展创新的今天,我们可以利用先进的数据处理软件如EXCEL、SPSS等对数据进行分析,从而快速准确的挖掘数据的内在规律。为了加强对数据分析技术软件优越性的理解,我以开普勒第三定律为例设计了如下一个探究过程:

邀请20名高一同学参与实验,给予表一的2列数据,要求找出第1,2列数据之间的内在规律:

结果:经过40分钟的尝试,同学们尝试了根式、加、减、乘、除等各种运算后毫无所获,同学们从最初的跃跃欲试到后面开始放弃寻找。

告诉同学们以上为开普勒发现行星运动第三定律所使用的原始数据,反映的是行星的公转周期T和轨道半径R之间的关系(如表2),让他们查阅资料后了解第三定律的内容,然后将同学分成A、B两组,A族可以借助计算器、EXCEL等工具,B组单纯使用纸和笔分别对数字进行运算,最后通过绘制图表的方式找出两组数据之间的规律。

结果:经过15分钟的运算,A小组得出了计算结果,并绘制了表3,运用EXCEL的绘图功能画出了如下图表,而B组仍停留在数据的计算阶段。

通过以上实验环节我们可以看出借助现代数据分析工具,可以方便的对实验数据进行运算并整理成合理的表格,通过图表可以直观的观察变量之间的关系并为进一步的数据整理奠定基础。科学家们在用实验探究物理规律的过程中,为后人留下了大量宝贵的观测数据,但由于数学发展水平的限制,大量数据都需要经过后人去探索甚至在传递中随着时代的变迁而湮灭,但如果有现今的数学理论基础和先进的数据处理技术手段,人类可以提前认识数据之间的内在规律从而推动物理学的发展。

2.2.3 大数据技术在当今天文物理学中的发展与运用

半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息爆炸的学科如天文学、基因学等,创造出了“大数据”这个概念。大数据环境下,天文物理实验数据大多数是依赖观测电磁辐射获得,天文物理学家的工具包括分析模型和计算机模拟。要充分发掘天文大数据的科学价值,需要在数据存储、管理、检索、分析、计算等方面突破一系列关键技术屏障,还要优化大数据下的天文研究工作流程。为适应天文物理发展的需要,虚拟天文台和云计算等技术应运而生,构建了一个完整的科研信息化平台,意味着我国天文学研究领域从传统的工作模式走向泛在融合的信息化时代的到来。

中国虚拟天文台将大数据与云计算技术有机地结合起来,设计开发了我国天文科技领域云系统。虚拟天文台的诞生,消除了各个数据库系统访问标准不统一的问题,使得天文学家可以避免一些重复性工作,节省宝贵的时间。同时,如果未来的天文数据都在虚拟天文台的管理之下,进行整理,那么天文学家只需要掌握虚拟天文台的一些工具,就可以使用所有的天文数据来进行科研工作,这将大大加快研究的速度。

2.3 大数据在未来天文学物理学发展的应用展望

通过虚拟天文台连通起来的全球天文数据网格让天文数据的发现和访问变得空前便捷,但这其中缺乏的一个使用方便、适应性强、可以从海量数据集中提取信息和知识的工具库,特别是那些可以在万亿字节量级数据集上开展数据挖掘和分析的工具,这是当代“大数据”科学所面临的一个共同挑战。探测器、传感器、高性能计算集群等快速积累着各种数据,对网络、存储、计算等信息化基础设施不断提出新的需求。数据挖掘、知识发现、数据可视化专家需要不停地思考如何让研究工具更加强壮。

3 总结与分析

“大数据”这一概念最早来自于1997年,自其出现以来,它在物理学、天文学、生物学等各个学科及情报学、金融学等各个行业有着极为重要的作用。其中,大数据集是指在决策的过程中所可能遇到的数量,它的数据量非常的大,而且来源、类型都是多种多样的。对大数据这个整体而言,数据越多越好,它能让不同行业的人从中寻找到解决某一相关问题的方法。但是对于大数据的具体应用而言,数据量未必越大越好。因为在大数据的实际应用中,如果用以分析的数据量越大,则得到的东西就越多,而至于那些结论是否正确则难以保证。因此,我们必须带着目的性的去搜索整理数据,换言之,大数据必须往下细化,针对不同行业不同领域的特定问题制定不同的解决方法。

4 下一步研究计划

我将在接下来的研究中,一方面,继续学习大数据技术,运用大数据算法对天文物理学方面继续挖掘学习,另一方面由天文物理学科运用到其他方面去,如将大数据技术与生活联系起来,如进行共享单车使用、废弃情况的大数据分析,得出结论,帮助更好的进行共享单车行业管理。

【参考文献】

[1]Nola Taylor Redd.天空立法者开普勒[J].军事文摘,2018(08):36-39.

[2]曾宪明.开普勒第一和第二定律的发现[J].物理,1993(05):317-321.

[3]李素艳.开普勒——牛顿脚下的巨人[J].物理教师,2011,32(11):51-52.、

[4]尹德利.谈史料中的原始数据在中学物理教学中的深度应用——以开普勒发现行星运动第三定律为例[J].物理通报,2014(S2):2-4.

[5]鐘华,刘杰,王伟.科学大数据智能分析软件的现状与趋势[J].中国科学院院刊,2018,33(08):812-817.

[6]肖健,于策,崔辰州,李长华,何勃亮,樊东卫,刘梁,陈肖,张海龙,王传军.天文科技领域云:大数据时代的天文教育和科研信息化平台[J].实验技术与管理,2017,34(10):133-138.

[7]徐迪威,张颖.数据分析与现代科技管理[J].科技管理研究,2018,38(15):239-245.

[8]崔辰州,于策,肖健,何勃亮,李长华,樊东卫,王传军,曹子皇,范玉峰,洪智,李珊珊,米琳莹,裘实,万望辉,王建国,王甲卫,尹树成,郝晋新,薛艳杰,刘梁,陈肖,张海龙,谌俊毅,乔翠兰,苏丽颖.大数据时代的天文学研究[J].科学通报,2015,60(Z1):445-449.

[9]殷齐龙,王军策.浅谈计算机大数据分析与云计算网络技术[J].信息与电脑(理论版),2018(17):121-123.

猜你喜欢

发展史大数据技术
提高生物化学教学效果的探索
大数据技术对新闻业务的影响研究
浅谈我国会计发展史
浅谈低音提琴在演奏中的技巧问题
明晰主线,品读实效