APP下载

空间大数据分析师:用冰冷的数据诉说有温度的故事

2019-07-16

中学生天地(B版) 2019年6期
关键词:鲁菜分析师出租车

姓名:张海平

身份:空间大数据分析师

技能:用地图让数据说话,用数据让生活更美好

十年前,我坐着绿皮火车踏上了去往大学,通向理想之门的征程。从兰州到济南,26个小时的车程,一路上大部分时间都是站着,实在熬不住的时候便席地而坐。九月的天特别热,但更炽热的是那颗对美好大学生活满怀期待的心。从此,我便多了一个地理学人的身份。

我的专业是地理信息科学(GIS)。曾经,我和大多数人一样,不好意思在人前说自己的专业是地理学,当然更不会说是地理信息科学。对于这样一个在当时大多数人都不了解的小众专业,解释起来相当麻烦。我有时候会说它是计算机,有时候会说是测绘,但从来不会说是地理。但随着学习的深入和对这个行业的了解,我逐渐喜欢上了它,一晃就是十年。

回顾十年的求学和工作生涯,我对地理的热爱有增无减,对地理信息科学的钻研持之以恒,对它的认识也逐步深化,并形成了自己的知识树,我也因此成了一名高级空间大数据分析师。

提升自我的黄金时期

很多人说,大多数人的职业在大学毕业后的实习阶段才开始算步入正轨,空间大数据分析似乎也不例外,真正的学习能力和行业兴趣主要在这个阶段得以挖掘和培养。但事实告诉我们,在大学里对专业知识的主动学习,将在很大程度上影响你未来职业的高度。

地理学、地图学和编程技术是我们的核心课程。更直白地解释,就是用编程技术去建模地理学问题,然后用地图的方式去展示分析的过程和结果。

大一时,我第一次接触到了C语言编程;大二时,我接触到了第一个空间数据分析和地图制作软件。由于之前对这些毫无了解,而大学的课程往往快而粗,在课堂上远不能掌握这些内容,于是我每天去机房泡几个小时敲代码,练习绘制地图和分析地理数据。一开始是艰难和迷茫的,甚至很难真正入门,但随着学习的深入,我渐渐喜欢甚至迷恋上了制图分析和编程。

在接下来的日子里,我组建了学习团队,开始学习更加高级的空间数据分析方法和更难的C++等编程语言。本科最后一年,我已经带着团队完成了几个软件开发项目,并在一段实习工作中作为主力参与了机场调度系统的研发。

在研究生阶段,为了提高专业素养,我开始系统阅读各类书籍,每个月至少读10本书,一年下来就是上百本书。我渐渐发现,空间数据不再是一串冰冷的数字,展现在地图上的不仅仅有结构之美,而且蕴含着人文之美、文化之善。此时,大数据技术开始兴起,研究和分析工作也从传统空间数据分析转向空间大数据分析,并开始关注社会经济现象、社会群体、社会文化和人类行为等方面。

用数据和专业素养解决问题

你知道中国现在有多少个村落吗?

答案是40多万个行政村,300多万个自然村。

你知道每天有多少个自然村落在消逝吗?

答案是120多个。

我在做一项关于地名遗产的大数据分析项目时,得知答案时和你一样震惊。

中国的村庄经历了几千年的发展。这些不断消逝的村落,有些是因为合并而消失,有些是因为人们都去了城市而荒芜。村落的荒芜意味着村落地名的消失,更意味着一种弥足珍贵的地名文化的丢失。于是,这些村落的地名文化一部分永远消逝了,另一部分则成为了一种地名遗产。

这个项目的艰辛让我记忆犹新。为了更好地了解地名文化,我们不仅采集了大量数据,还远赴成都进行实地调研。当地的交通非常不便,而更大的困难在于语言沟通。因为听不懂方言,我们只能不断找人翻译。慢慢地,我们发现,当地的村落名称很多带着“龙”字。为什么会这样呢?我们查不到可靠而详细的文献,只好再向当地七八十岁的老人求教。就这样,通过访问村民、社区的文化站、当地政府,加之以数据分析,我们才得到了初步的结论。

这样的经历,每个空间大数据分析师都不会陌生。我们用数据发现问题,并用数据解决问题。这是一个艰难的过程,同时结合了数据分析和实地调查,完成这样的项目少则一个月,多则半年。除了对专业素养和技术有要求,还考验着你的实践能力和耐心。

一台电脑行走江湖

有的项目比较深入,需要实地调查。但其实在工作中,大多数的空间数据分析更酷更简约,只需要一台电脑就可以行走于世界中。

“八大菜系”不陌生吧?但你知道现在位列八大菜系之首的是什么菜吗?如果你的答案是“鲁菜”,我的数据可能会让你惊讶了。

在一个关于饮食文化的大数据分析项目中,我通过自己写代码,获取高德地图上750万个餐馆兴趣点数据,提取出这些餐馆相应的菜系,分析了这些菜系在地图上的空间分布特征和模式。

大数据分析的结果告诉我,以前排在八大菜系之首的鲁菜,其地位已经岌岌可危了,而川菜的发展势头相当迅猛,已经是目前分布最广泛的菜系。

大数据分析似乎很简单,敲敲键盘就能得出结论。但要成为一名优秀的空间大数据分析师,专业素养必不可少。有些人表面上知道八大菜系,但对深层的饮食文化知之甚少。举个例子,东北菜实际上是鲁菜的一个分支,闯关东时期,很多山东人来到了东北,将鲁菜与当地的食材和饮食习惯相结合,从而形成了现在的东北菜。现在东北菜发展得也很好,因此在某种程度上,可以说鲁菜更加与时俱进了。

这些知识就涉及专业素养。如果你不了解闯关东,不了解鲁菜的渊源,你就没法做好大数据分析。所谓大数据,并不是通过数据简单地说话,而是要用专业素养分析数据,让数据变得更有温度,并且更有说服力。

在另一個关注社会低收入群体的项目中,我从相关部门拿到上海市数万辆出租车的轨迹数据,采用GIS技术分析得到出租车群体的工作时长、工作时间节点及其居住地的空间分布特征。分析这个有什么用呢?出租车司机其实是城市里的低收入人群,但他们又是城市最大的贡献者之一,其工作从早到晚,方便了人们的出行。然而,根据大数据分析,他们的住所基本聚集在一起,而且是在离市区十多千米以外的地方。随着经济的发展,这些对城市贡献最大的人,却成了被疏离的一群人。政府应该怎样关注低收入人群?通过我们的大数据分析报告,政府可以调控出租车的税收、滴滴对出租车的影响等。上海市有5万辆出租车,意味着有10万人在做出租车司机。加上他们的家人,能够影响到的是上百万人。如果没有大数据分析报告,政府可能投了大量的金钱,花了大量的精力,却没有用在刀刃上。因此,这是我们身为空间大数据分析师需要做的工作。

成为一名空间大数据分析师后,我越发强烈地感受到:技术是先进的,数据是有趣的。而更大的成就感在于社会价值,因为我们是在用实际行动关注社会,用专业知识、技能和自己的思考,或多或少地,有形或者无形地影响这个社会。

在这个信息革命主导的“大数据时代”,大数据分析师不可避免地成了一个非常热门的职业。除了空间大数据分析师,三百六十行,可以说行行都有大数据。作为一名地理学人,我很骄傲能用自己的热忱和技术,诠释大数据时代地理学作为自然科学、社会科学和人文学科的综合体,在人们日常生活中所扮演的重要角色。

(补充采写:韩 政)

猜你喜欢

鲁菜分析师出租车
乘坐出租车
凭什么
分析师一致预期
分析师一致预期
分析师一致预期
分析师一致预期
乡味小厨诚献夏日经典鲁菜美馔
开往春天的深夜出租车
李书福炮轰出租车
李光璧:重塑80后们的鲁菜记忆