基于数据挖掘的大学生就业市场需求分析

2021-11-08胡鹏李长云傅荣鑫

电脑知识与技术 2021年27期

胡鹏李长云傅荣鑫

摘要：“择业难”“就业难”已是大学生面临的两难问题。该文基于网络校园招聘，利用Python和SPSS工具需求视角分析就业现状。研究表明，热门职位集中在计算机、互联网，主要分布在北上广深城市，但“新一线”需求比例在上升，并且私营企业占比最大。另外，企业更看重大学生的基础能力、工作态度和品质。该研究为大学生就业、择业提供参考和借鉴。

关键词：就业指导;大学生招聘;数据挖掘;Python

中图分类号：TP3-0 文献标识码：A

文章编号：1009-3044（2021）27-0035-03

1 背景

随着我国改革开放不断深化，高校教育模式也从精英转为大众教育，导致大学生就业压力日益增大。通过分析，人们发现“就业难”的影响因素之一就是“择业难”。由于企业和学生存在信息不对称问题[1]，导致人才结构性化短缺。

因此，本文用爬虫算法收集招聘网站信息，分析需求的热门区域、热门职业、热门职位的技能要求等。为高校和大学生解决“就业难”“择业难”的问题。

2 大学生招聘方式分析

企业针对大学生招聘通常会采用校园招聘或者网络招聘。

校园招聘是专门针对应届大学生的招聘方式。目前，应届毕业生主要就业途径就是校园招聘，但是，艾瑞咨询在《中国校园招聘大学生洞察白皮书》中指出获得1～3家企业面试的学生比例近40%，这说明应届毕业生虽然参与不少校园招聘，但成功获取Offer还是具有一定难度。网络招聘是以招聘平台为载体，企业在平台发布招聘信息，它可以将就业信息全方位地提供给学生[2]，相较于传统的线下招聘，它更节约时间成本和空间成本。典型的招聘网站如“前程无忧”“智联招聘”等。网络招聘发展至今，已经积累了大量的职位信息，随着AI技术的日渐成熟，依靠网络就能够实现精准的职位推荐[3]，对于促进大学生就业是十分有意义的。

3 企业招聘市场需求数据挖掘

3.1 数据获取

1）数据源的选择。招聘网站有很多，但是最有影响力的综合招聘网站非前程无忧（51job.com）莫属。前程无忧招聘网站上具有海量的招聘信息，覆蓋的知名企业较多。所以本文选择从前程无忧招聘网站上获取职位信息。

2）Python爬虫获取数据。Python阅读简单，代码结构清晰、明了[4]。利用爬虫算法获取以下信息。①获取热门职位名单。前程无忧网有各类职位信息，职位名称众多，为了Python爬虫可以实现，我们需要先确定职位名称。由于前程无忧没有提供职位名称集合，我们选择从BOSS直聘首页获取职位名称。②获取热门职位信息。由于我们研究的市场需求是针对大学生就业，所以在爬取职位信息时，将工作年限参数设置为“在校生/应届生”。获取热门职位的爬虫代码如下：

def count_page（）：

"根据boss直聘首页的职位名获取职位名称集合，再从前程无忧上获取热门职位"

driver_path = r"D：＼Chrome＼Downloads＼chromedriver.exe"

file_name = r"D：＼Python_code＼Python程序＼爬虫相关代码＼51job＼原始数据＼数量.xlsx"

headers = {

'User-Agent'： 'Mozilla/5.0 （Windows NT 10.0; Win64; x64） AppleWebKit/537.36 （KHTML， like Gecko） Chrome/73.0.3683.86 Safari/537.36'

}

browser = webdriver.Chrome（executable_path=driver_path）

url = "https：//www.zhipin.com/"

job_names = []

browser.get（url）

html = browser.page_source