APP下载

大数据背景下统计人才培养模式与课程体系优化研究

2022-08-17何帮强

牡丹江大学学报 2022年9期
关键词:数据挖掘课程体系统计学

何帮强

(安徽工程大学数理与金融学院,安徽 芜湖 241000)

由于互联网、云计算、物联网等一批信息技术飞快进步,人类记录数据呈现指数式增长,社会迈入大数据时代。大数据对我们日常经济社会的生产、流通、分配、消费等经济活动以及社会经济运行机制、公众生活方式和国家治理能力水平等产生重要影响。[1]统计人才作为大数据价值得以实现的重要支撑。培养优秀的统计分析人才是大数据时代需要。大数据技术变革对大学统计专业人才培养提出了更高和更多的要求。优秀统计专业人才应该具备扎实统计理论基础,掌握先进的统计方法,熟悉最新的统计软件;善于通过已有数据提出问题,会处理不同种类海量数据,具备数据清洗、深度挖掘、准确表现数据和分析数据的能力。统计专业人才还要善于把生活中的实际问题转化为统计数据问题,再利用掌握统计分析方法进行分析,最后把数据分析结论让大家易于接受的方式表达。[2]新时代的统计专业人才不仅具备传统统计理论基础,还应会统计软件编程、数据库操作等各方面的能力。因此,如何对统计学专业的培养目标和课程教学做出改革以适应大数据发展,是统计人才培养值得关注的重要问题。朱建平等分析了大数据时代给统计学界带来的巨大改变,分析了在大数据时代统计研究工作过程与传统统计的区别,明确了现代统计工作和统计科学研究转变的方法。[3]邱淑芳等认为大数据的意义不在于掌握的巨大数据量,而在于对这些含有实际意义的数据进行处理所带来的社会财富。并认为当前统计人才培养模式与课程体系不适应大数据时代的要求,提出统计人才培养模式与课程体系需要优化。[4]本文结合大数据内涵的初步认识,探讨大数据背景下的统计人才的培养模式与课程体系优化研究。

1 对大数据的内涵的初步认识

研究机构Gartner把“大数据”定义为大量的、具有高增长率和形式多样化的信息资产。通过处理模式更新后将有更好的决策力、更强洞察力和更优的流程能力。李金昌认为大数据就是一切可记录信号的集合。[5]数据可以重复使用、不断产生新的价值。大数据就像“显微镜”那样,使得人们能够通过洞察数据来研究自然、经济、社会现象。大数据有4V特点:第一,Volume(大量):数据的量已经到达EB级别和超过EB级别。第二,Velocity(高速):目前大数据的交换和传播是通过移动互联网、云计算等多种方式,数据进行交换和传播速度更快。第三,Variety(多样):数据包括非结构化、结构化和半结构化数据。当今社会,非结构化数据在生活中占比越来越高。第四,Value(低价值密度):即大数据中有社会价值的信息相对于海量数据来说非常少。人们处理大数据就像在大海中捞金子,这金子就是大数据的社会价值。统计研究者要能从海量的数据信息库中找到有效的信息,挖掘隐藏的“规律”。通过统计数据分析来发现数据规律,研究利用规律,贯穿了人类社会经济发展的始终。统计人才要能利用大数据为社会服务,让大数据服务于社会经济的发展。科学发展往往和数据分析相关,例如流行病学中开端于伦敦1854年霍乱疫情,一位医师就是利用了疫情数据发现在一口水井附近霍乱患病率异常,关掉这口水井后,霍乱的发病率得到控制。这个典型事例,充分显示了数据在人们日常生活中的应用价值。

2 大数据时代对统计人才培育提出的新挑战

大数据分析技术发展的飞快,以至于数据分析统计人才跟不上大数据发展的步伐,现在与未来若干年内统计人才都会供不应求,据预测,未来几年数据统计人才缺口将高达上百万。大数据发展给统计数据分析人才带来了发展机会,同时也给统计人才的培养提出了新挑战。大数据背景下对统计数据分析整合提出更高的要求,统计人才的培养需要数学、统计学、计算机等多个学科参与。统计人才必须具备从海量数据提取需要信息,从数据中挖掘有用信息,实现数据效用最大化。在大数据背景下,统计人才需要掌握数据挖掘、统计软件、数据分析、金融和经济相关知识,才能把经济生活中的海量数据转化为有价值的应用。[6]

2.1 统计人才培养目标挑战——具备交叉学科背景的统计人才[7]

传统统计学首先必须会如何搜集、收集数据,然后整理数据,用统计指标或图表来表现。或者建立数据模型,预测未来事态的发展。当代数据的出现方式多样化,海量的非结构化数据推进数据库技术革新,数据库技术进入基于网络数据应用的非结构化数据库时代。相应的统计分析从基于样本数据的建模变为借助云计算数据平台的大数据挖掘。大数据背景下统计专业人才培养多种学科背景的统计人才。华为公司总裁任正非就认为:各个本科专业的培养后面都加一个统计学,社会需要培养高端复合型的大数据人才。大数据时代统计人才能熟练应用统计软件进行数据分析、数据挖掘。会处理非结构化或半结构化数据。统计学专业无论从学生的就业需求方面,还是从大数据背景下统计学专业深度发展方面的需求而言。都应该加强数据操作与统计类软件类课程的比重,提高统计专业学生统计软件编程能力。统计人才培养还要注重大数据与金融、商业等专业的融合。

2.2 统计人才培养内容挑战——具备交叉学科知识课程体系

课程体系是体现教学理念和教学目标的关键所在。大数据时代要求统计人才具备一定数据收集、分析、处理、数据挖掘和整合等技术能力,大数据意义不在于搜集海量数据,关键在于对这些数据进行处理带来的财富。[5]统计人才要掌握对各种类型和不同格式数据进行检索、合并和重组技术。统计学教育内容要及时更新,跟上大数据时代的要求。要求统计人才不仅掌握传统统计学内容,还要对数据获取所需要的数据爬取,数据处理需要的清洗、数据挖掘、降维有所掌握。[8]事实上,现代统计方法也是不断发展更新的,统计专业应该掌握基本统计分析方法,还应掌握数据分析和数据挖掘等,还要根据专业方向增加程序设计和数据库处理类课程。在总课时、总学分确定的情况下,在设置课程内容上要有所选择和侧重。把实用的统计学基础课和核心课程安排上,而其他一些次要的课程可做为选修课程。每个学校培养的统计人才要有自己的特色。要将学校的特色专业与数据分析结合,如复旦大学的数据分析就与国际商务相结合,北京航空航天大学与西安电子科技大学是大数据技术与软件工程相结合,武汉大学注重大数据的应用。统计学专业的课程可分解为三块:数学与统计学、计算机基础及应用、数据分析和挖掘。现代的数据分析与处理需要融合经济、金融以及计算机等多个领域的知识。

2.3 统计人才教学方式、实践教学挑战——具备实际数据分析整合的能力

大数据背景下统计学是一门实用性学科,立足于解决数据分析的实际问题。美国高校重视校外企业合作来提高学生的实践能力。比如:斯坦福大学学生被允许使用Amazon的EC2云平台做大数据计算;旧金山大学与思科等公司合作,大数据人才能充分利用企业的实践平台,毕业后能更快上手。我国高校与企业合作相对较弱,导致高校培养的大数据人才毕业后需要较长的适应期。当前统计学教学中尽可能将大数据主流分析环境,比如Hadoop、Storm引入课程,以案例教学方式模拟实际生活中数据搜集、处理和分析。或者以业界相关问题展开教学。学习者能对业界日常活动及宏观经济运行进行统计分析。实践课程内容和方式要跟上业界实际需要。积极参与业界实训操作。大学统计人才培养实践环节脱离实际,造成运用统计专业知识解决大数据时代现实问题的能力不够。以后教学课程要做到理论和应用结合、实验和实训等环节相互衔接,突出教学课程的应用性,实现统计人才培养目标。

3 安徽工程大学统计人才模式与课程体系优化

安徽工程大学统计学专业于2005年开始招收本科生,招生规模由最初的80人增加到现在的120人。于2007年开始在应用数学二级硕士学位点下招收经济统计研究方向硕士生。2020年在数学一级学科学位硕士点下增设概率论与数理统计二级硕士点。安徽工程大学统计学专业主要围绕金融统计方向培养,注重于金融模型的统计分析,强调对于金融模型的数据编程和模拟能力的培养,学生就业率一直在95%以上。统计学专业毕业生近几年考研率在30%以上,其中2019年统计152班考研录取率高达52%。很多优秀的毕业生步入一些名校继续深造学习,如中国人民大学、华东师范大学、东北财经大学等。也有部分学生申请出国继续深造,学校主要有牛津大学、思克莱德大学、长野平昌学院、澳门科技大学和德比大学等。

秉承“深化改革、引培并举、高效融合、加大投入、完善闭环”,围绕服务于地方经济和大数据产业发展需求,遵照国家统计专业建设标准,确立产教协同育人的专业理念,将“学生中心、成果导向、持续改进”的工程教育理念贯穿统计人才培养全过程,加强统计专业特色建设,在省属高校形成明显优势和特色,全面提升统计专业核心竞争力和社会影响力。

3.1 学院注重师资队伍建设

教师决定人才培养质量,经学院统计教师大部分都是统计方向的博士,熟练掌握传统统计理论,但对于大数据领域中数据分析、清洗、挖掘、可视化等技术能力欠缺,特别涉及云技术、分布式计算、并行计算等技能跟不上大数据时代需要。学院始终坚持“引进与培养相结合”。鼓励教师多参加有关大数据技术等的会议和培训,聘请业界成功人士,尝试实行校外导师制,参与统计专业学生的培养。[9]大数据分析有时需要有金融、工商管理或经济学的背景。因此需要金融、管理、经济相关的老师,统一安排课程,提高统计学专业课程的广度和深度。

3.2 教学内容与课程体系的构建与设置

安徽工程大学统计学人才目标:培养德、智、体、美全面发展,具备扎实数学与统计学专业理论基础,和数据搜集、数据分析处理、数据挖掘、开发应用等技能。在统计专业课程设置上,学院增加统计金融课程和数据挖掘课程,统计分析软件和数据分析处理课程。 教学内容以“4 平台”(学科通识教育平台、统计专业教育平台、专业研究方向教育平台和专业实践教育平台)为载体,建立起理论、实践以及能力培养的人才培养体系。具体构建的知识体系、知识领域和课程体系详见表 1。

表1 安徽工程大学统计学专业教育内容与课程体系

从表1所示:课程设置总体思想是重视数学、统计、计算机理论课程的开设,也重视统计实践应用能力的培养。应用型课程包括 Python 语言、数据库程序设计、大数据挖掘与机器学习等实践课程。通过电脑和实际操作来培养大学生对于搜集资料、进行数据分析、进行数据挖掘等方面的实际操作能力。[10]

3.3 实践教学的强化

实践教学是统计专业学生大学期间培养方式中重要的一个环节,确定统计专业学生的实践教学培养目标,大数据技术变革实时影响高等院校统计人才培养方式中实践教学的内容。在实践教学中加强学生大数据方向各项统计技能和数据挖掘技能训练,统计老师在实践教学中要了解大数据技术的新动向,对数据分析、数据挖掘和统计软件培训内容进行及时更新,顺应大数据发展的需求。统计学专业的学生不仅需要掌握扎实的统计专业知识,同时还需要加强口头和书面表达能力、以及与业界的交流和沟通能力,具有较强创新意识和团队合作能力。统计专业的学生平时应该养成重视数据搜集、整理、数据分析、科学合理选择统计方法、分析总结数据规律的习惯。

3.4 改变考核方式

传统的统计专业各种课程主要是考试,考试内容是书本基本概念的记忆、公式推导,强调对统计课程基础知识的理解。大数据时代要注重提高学生对数据相关性和数据分析的能力。更加注重实践能力的考核。可以设计业界中一个项目,进行数据分析,让学生们设计出算法,写出数据分析报告。或者以小组形式撰写报告,以答辩方式考察。

综上所述,大数据背景下的统计人才培养改革。考虑从统计学专业理论课程整合、加强数据操作与统计计算类课程的比重、有针对性的加强统计专业数学基础课程设置与拓广实践类训练课程四个方面入手,探索大数据背景下我校统计学专业改革。通过教学实践不断完善,同时积极与相关企业合作,共同利用和挖掘数据资源。培养一批数据分析能力强、数据挖掘技术过硬、具有较强实践能力且能够适应大数据时代需求人才。

4 结束语

目前,大多地方普通高校的统计专业课程设置不一定能够满足这个时代要求,大数据不仅需要一批专业的统计分析人才,同样也需要一批善于和各个领域进行沟通交流统计技术人才。高校应该把统计专业培养人才的重点放在统计人才模式的创新路径和完善课程体系上。应重点对大数据采集、数据挖掘、数据分析和数据应用等领域开设课程,注重大数据与经济、金融、商业等行业的融合,紧跟着大数据技术发展的脚步,培养出一大批符合大数据时代发展要求的统计专业人才。

猜你喜欢

数据挖掘课程体系统计学
关于投稿的统计学要求
基于数据挖掘探讨慢性肾衰竭处方规律
基于数据挖掘技术的非均衡数据分类研究
三维视角构建劳动教育课程体系
“艺养教育”凝练与艺美课程体系建设
“三位一体”课外阅读课程体系的实施策略
统计学教学与实验实践的一体化整合初探
《女士品茶:统计学如何变革了科学和生活》
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究