APP下载

大数据应用人才的知识、能力、素质结构及其培养

2017-09-01田绪红邝颖杰肖磊刘财兴

计算机教育 2017年8期
关键词:人才培养模式大数据

田绪红+邝颖杰+肖磊+刘财兴

摘 要:给出大数据应用人才的一种初步定位与分类方法,结合应用型人才通用的知识能力素质结构特征,论述大数据应用人才特殊的知识结构、能力结构与素质结构,从课程设置、实验系统建设、校企合作等方面,探讨大数据应用人才知识能力素质结构培养模式。

关键词:大数据;知识能力素质结构;人才培养模式

1 大数据应用人才的定位

高等学校应该培养什么样的人才,从历史角度上看,不同时期有不同的观点。学术界目前认为,高等学校培养的人才通常分为研究型人才、应用型人才与技能型人才。研究型人才指探索世界、发现知识与规律、寻求科学理论的人才,重在培养其坚实的理论基础、科学的思维方法、批判性的精神及探索规律与创新知识的能力。应用型人才指将科学规律与知识应用于社会生产实践,为社会创造直接价值的人才,重在培养其理论联系实际、将专业知识转化为社会生产实践的能力。技能型人才指在生产第一线进行实际操作的高级技工人才,重在培养其掌握扎实的专业经验性知识、技能与技巧以及实际岗位操作能力[1]。

随着大数据应用的兴起,社会对大数据应用人才的需求急剧增长。大数据应用人才如何定义?大数据应用人才应该具备什么样的知识能力结构特征?如何培养合格的大数据应用人才?这些都是目前高等教育急需研究的课题。

大数据应用人才并没有严格的定义,但大体上指:“运用统计分析、机器学习、分布式处理等技术,从大量数据中提取出对业务有意义的信息,以易懂的形式传达给决策者,并创造出新的数据运用服务的人才。”[2]

通常来讲,大数据应用人才可分为以下4种类型[3]。

(1)IT架构与管理工程师,负责规划设计大数据系统运行的IT基础架构,如网络基础设施、云平台构架、服务器集群、数据库系统等,并负责日常管理、运行、维护、性能调整、升级换代等。

(2)数据系统工程师,负责大数据软件系统的分析、设计、实现、运行维护等,熟悉软件开发过程,了解大数据处理算法。

(3)数据分析师,擅长機器学习与数据挖掘算法,熟悉统计学方法,精通数据处理与分析过程。

(4)数据科学家,大数据中的领导者,具备多种交叉科学和商业技能,能够将数据和技术转化为企业的商业价值。

这4类人才往往存在重叠与交叉,对于一个小型大数据应用,可能一个人兼顾几个方面,既是IT架构师,也是系统工程师,既是系统工程师,也是数据分析师。对于一个大型应用,通常需要一个团队分工协作。即便如此,团队所有成员也必须具备大数据处理各方面的知识。因此,大数据应用人才属于应用型人才,是一种新型复合型人才。

2 大数据应用人才知识能力素质结构特征

大数据应用人才属于应用型人才,应该具备应用型人才通用的知识能力结构特征。大数据应用人才也是一种非常新型的复合人才,还需要具备一些特殊的知识能力素质结构。

应用型人才通用的知识能力素质结构特征已经有许多文献进行了探讨[4]。

知识结构包括人文社会科学知识、学科基础知识、专业基础知识、专业知识、综合性知识。

能力结构包括公共基础能力、专业综合能力、个性发展能力。

素质结构通常体现为非智力因素,如思想、道德、品质、心理、身体等;表现为一种人格特征和精神状态,如思想道德品质、社会责任感、诚信守法、团结合作、文化艺术修养、审美情趣、科学精神、专业兴趣、专业使命感、创造意识、创造欲望等都是素质的体现。

数据科学人才的最佳来源[5]包括34%计算机科学专业的学生,24%非计算机科学专业的学生,27%IT、计算机科学以外领域的专家,12%的商业智能专家,3%其他。由此可以总结出数据科学人才的基本知识能力素质结构。

2.1 知识结构

(1)数学知识,包括微积分、线性代数等。这些知识是理解与学习其他知识(如数据挖掘等)的基础,也是培养抽象思维的必要环节。这些知识学习也是培养与数量有关的能力的基础。

(2)计算机科学知识,包括计算机科学与技术方面的基本原理、方法、手段等基础知识。

程序设计基础知识方面,掌握常用的编程语言与技能,如Python、C/C++、Java、Perl、MATLAB、Pig等。Python作为一种开源语言,目前在科学计算、机器学习等方面得到广泛应用,因此,掌握Python语言对于大数据开发非常有帮助。

数据库知识方面,了解数据库分析与设计的基本方法与过程,掌握数据建模的方法与技能,熟悉数据建模的常用工具,熟练使用SQL及NOSQL平台与工具。

分布与并行计算知识方面,了解云计算、虚拟化等分布式技术,掌握常用的并行算法,掌握大数据处理工具知识,如MapReduce、Hadoop、Hive、Spark等分布式计算工具。

(3)机器学习方面的知识,掌握数据挖掘常用算法,如贝叶斯方法、决策树、神经网络、关联规则、聚类等,了解不同类型数据处理方法,如文本数据挖掘、时间序列数据挖掘、流数据分析与处理等。近几年人工智能方面取得较大进展,尤其是深度神经网络领域。

(4)领域知识。大数据应用领域非常广泛,包括政府、金融、电信、零售、制造业、教育、医疗等,只有对某个领域的业务流程、数据特征、数据处理需求以及数据的商业价值等非常熟悉,才能真正将数据和技术转化为企业的利润。

2.2 能力结构

(1)综合应用知识的能力。通常来讲,一个大数据应用项目涉及多方面的知识,要求大数据人才有较强的综合能力,来融会贯通各种知识。

(2)团队合作与领导能力。 一个大数据团队通常会聚集各方面的人才,因此相互合作非常重要,良好的团队合作精神将形成合力。另外,较强的领导能力是协调团队和凝聚团队的重要保证。

(3)工程能力。大数据应用项目本质上是工程项目,因此,要按照工程项目的规律开展,团队人员要具备工程开发与管理的能力。

(4)沟通交流能力。企业的业务部门员工以及管理层,对企业的业务流程会非常熟悉,但不熟悉数据分析方面的知识。大数据人才必须具备与他们进行良好沟通的能力,才能深入挖掘企业的数据特征与处理需要,并将数据分析的结果有效传达给他们,否则,大数据的价值就得不到充分发挥。

2.3 素质结构

(1)创新欲望。不墨守成规,勤于思考,具有强烈的创新欲望与创新精神。目前大数据虽然在许多方面取得了非常的成功,但仍然有大量的现象、技术、问题都是前所未有的,如AlphaGo最近连续战胜全世界的围棋高手,不仅给围棋界带来震撼,也让全世界对人工智能未来的发展感到震惊。因此,大数据应用人才要敢于创新,勇于创新,善于创新。

(2)对数据的敏感性与好奇心。从庞大的数据中发现商业价值不是一件唾手可得的事情,面对海量复杂的数据,人们往往无从下手。只有对数据具有高度敏感性并对发现数据背后的隐藏秘密具有强烈好奇心的人才能成功找出答案。

(3)跨界思维。大数据应用往往需要将不同来源、不同类型、不同领域的数据进行融合与分析,才能发现前所未有的价值。因此,大数据人才不能将自己的思维模式局限于某个或几个固定的领域,要具有跨专业、跨领域的跨界思维模式。

(4)正确的价值观与道德法律意识。大数据应用可帮助企业获得合法的商业价值,但应用不当,也可能泄漏国家机密、损害国家的利益、侵犯单位与个人隐私,因此,大数据人才必须具备正确的价值观。技术是合法获利的手段,而不是违纪犯法的工具。技术获利要遵循社会基本的道德与价值观,要遵守国家的法律与法规。

3 大数据应用人才培养的实践探索

为顺应计算机学科“大数据时代”对人才知识结构、能力结构以及整体素质的要求,在广东省高等学校质量工程项目、专业综合改革试点项目与大数据课程群教学团队项目支持下,学校计算机科学与技術专业进行了大数据应用人才培养探索。

华南农业大学是省部共建211大学,广东省高水平大学建设高校,计算机科学与技术专业一直是学校最受欢迎的专业。因此,学校计算机科学与技术专业生源质量非常好,具备较好的培养基础。

近年来,学校人才培养方案不断改革,强化知识能力素质的综合培养。通过学校基本培养环节的学习,学生通用的知识结构、能力结构与素质结构已经得到较好培养。通过大学数学课程与计算机科学与技术专业课程的学习,学生数学知识与计算机知识已经掌握得较为牢固。

在上述基础之上,笔者采取了如下措施,加强学生大数据方面知识、能力与素质培养。

(1)在人才培养方案中增设了数据科学模块,包含6门课程:统计学、数据挖掘与机器学习、分布与并行计算、云计算与大数据、Hadoop大数据处理技术、大数据及其安全与隐私。通过特色的数据科学模块课程,加强了统计学知识、并行计算方面知识、机器学习方面的知识、大数据处理技术方面知识的学习;同时,强化了学生隐私保护方面的道德法律意识。

(2)在人才培养方案中增加实践环节学分,改革实践环节教学模式。大部分实践环节项目综合性较强,要求学生采取小组合作方式完成,并严格要求学生撰写开题报告、设计文档,项目结束要进行分组答辩。通过这样的方式,强化学生综合应用知识的能力,培养学生团队合作与交流沟通能力。

(3)开发程序设计在线自动评判系统,开展“基于大数据的大学生程序设计能力评价指标”研究,并将研究成果融合到自动评判系统中,对系统进行优化。借助该系统,算法程序设计类课程从一开始就引入竞赛机制,积极鼓励学生除了完成教师规定的上机实验外,挑战不同难度的额外上机实验,并根据学生完成额外上机实验的难度、数量、质量,进行综合实时排名。学生每完成一个上机实验,即可实时看到排名的更新情况。这种教学模式大大激发了学生的学习兴趣与求知欲望,许多学生利用课余时间登录系统完成实验,努力提高自己排名。这种教学模式也极大提高了学生参加各级程序设计大赛的成绩。近3年计算机学科学生获得ICPC国际大学生程序设计竞赛亚洲区域赛金牌6项,银牌14项,铜牌7项。2014年和2015年连续2年晋级ACM-ICPC全球总决赛,并分别获得全球总决赛第19名和第28名的好成绩。

(4)与华为技术有限公司、北京红亚华宇科技有限公司、广东宏远科技有限公司等公司合作,共同建设云实验平台,包括信息安全云实验系统、大数据云实验系统等;在此基础上,提出“云平台+服务”的实践教学模式,构建课程实验、创新项目和创业活动“三位一体”的实践教学体系。通过云平台实验系统的训练,学生在大数据处理方面的实践能力得到较大提升。系统还提供了许多不同行业的实际案例供学生实习与实训,丰富了学生的领域知识,提高了学生综合应用知识的能力和工程实践能力,激发了学生对大数据领域的好奇心。系统也给学生提供了一个创新创业的平台,学生有好的创新项目(包括国家级、省级、校级及院级大学生创新项目)或者好的创业项目,只要申请相应的服务即可随时随地使用云平台资源,有效激发了学生创新创业的欲望。

(5)与国家级人才培训基地四川华迪信息技术有限公司合作,在学生毕业实习环节实施软件工程项目复现,即利用企业已开发成功的软件工程项目,去掉一些商业秘密后,让学生在企业管理人员、工程人员的指导下,将原来的项目重新实施一遍。学生组成项目小组,自主选定组长,在组长领导下协作完成每个阶段的任务。其中一个重要的创新是严格按照软件工程规范,实施分阶段提交,交叉完成各阶段任务。即每个小组要根据另外一个小组上一阶段提交的文档完成下一阶段的任务,而不根据自己上一阶段完成的文档继续完成下一阶段任务。这就要求学生严格按照软件工程规范完成每一阶段的文档,否则下一阶段的小组就很难开展下去。

这种实习模式重点培养了学生的工程能力、团队合作与领导能力、沟通交流能力。同时IT企业提供的实习环境也大大激发了学生的创新欲望及对大数据领域的好奇心。

(6)与阿里云计算有限公司、北京知行慧科教育科技有限公司及广东温氏食品集团股份有限公司等单位合作,共同开设了云计算与大数据试点班——温氏阿里班。

阿里云计算有限公司的大数据技术、北京知行慧科教育科技有限公司的合作课程、广东温氏食品集团股份有限公司的奖学金与实习机会、华南农业大学的教学改革成果与创新实践平台,所有这些优质资源集中起来构成了温氏阿里班的这种创新人才培养模式。目前,温氏阿里班受到社会广泛关注,第一届新生入学成绩在学校所有专业中排名第一,由此可见这种人才培养得到广大学生的认可。

上述方案涉及课程设置、实验系统建设、校企合作等环节,2013年开始在学校计算机科学与技术专业开展人才培养模式试点工作。

目前第一届学生尚未毕业,但有许多学生已经找到工作或实习单位。初步统计表明,从事大数据相关工作或实习的学生较之前增加了40%,说明经过这样的模式培养,学生在大数据应用方面的兴趣与能力有明显增强。

4 结 语

目前,社会对大数据应用人才的需求非常旺盛,对大数据应用人才的期望也非常高。如何科学地制订大数据应用人才的知识能力素质结构标准,实施有效的培养方案,是高等学校人才培养方面的一个重要课题。本文只是一个初步的尝试,需要得到同行的指正并进行进一步的探索。

参考文献:

[1] 潘懋元. 应用型人才培养的理论与实践[M]. 厦门: 厦门大学出版社, 2011: 21-28.

[2] 城田真琴. 大数据冲击[M]. 周自恒, 译. 北京: 人民邮电出版社, 2013: 223.

[3] 罗旭. 大数据时代我们最需要什么样的人才[N]. 光明日报, 2014-03-08(8).

[4] 宋克慧, 田圣会, 彭庆文. 应用型人才的知识、能力、素质结构及其培养[J]. 高等教育研究, 2012, 33(7): 94-98.

[5] EMC. Data science revealed: A data-driven glimpse into the burgeoning new field[EB/OL]. [2017-06-20]. http://www.emc.com/collateral/about/news/emc-data-science-study-wp.pdf.

(编辑:孙怡銘)

猜你喜欢

人才培养模式大数据
校企合作下的应用型物流人才培养模式研究
大数据环境下基于移动客户端的传统媒体转型思路
独立学院商务英语专业人才培养模式探索
高校创新型人才培养制度的建设与思考
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索