APP下载

基于数据挖掘的大学生就业市场需求分析

2021-11-08胡鹏李长云傅荣鑫

电脑知识与技术 2021年27期
关键词:就业指导数据挖掘

胡鹏 李长云 傅荣鑫

摘要:“择业难”“就业难”已是大学生面临的两难问题。该文基于网络校园招聘,利用Python和SPSS工具需求视角分析就业现状。研究表明,热门职位集中在计算机、互联网,主要分布在北上广深城市,但“新一线”需求比例在上升,并且私营企业占比最大。另外,企业更看重大学生的基础能力、工作态度和品质。该研究为大学生就业、择业提供参考和借鉴。

关键词:就业指导;大学生招聘;数据挖掘;Python

中图分类号:TP3-0      文献标识码:A

文章编号:1009-3044(2021)27-0035-03

1 背景

随着我国改革开放不断深化,高校教育模式也从精英转为大众教育,导致大学生就业压力日益增大。通过分析,人们发现“就业难”的影响因素之一就是“择业难”。由于企业和学生存在信息不对称问题[1],导致人才结构性化短缺。

因此,本文用爬虫算法收集招聘网站信息,分析需求的热门区域、热门职业、热门职位的技能要求等。为高校和大学生解决“就业难”“择业难”的问题。

2 大学生招聘方式分析

企业针对大学生招聘通常会采用校园招聘或者网络招聘。

校园招聘是专门针对应届大学生的招聘方式。目前,应届毕业生主要就业途径就是校园招聘,但是,艾瑞咨询在《中国校园招聘大学生洞察白皮书》中指出获得1~3家企业面试的学生比例近40%,这说明应届毕业生虽然参与不少校园招聘,但成功获取Offer还是具有一定难度。网络招聘是以招聘平台为载体,企业在平台发布招聘信息,它可以将就业信息全方位地提供给学生[2],相较于传统的线下招聘,它更节约时间成本和空间成本。典型的招聘网站如“前程无忧”“智联招聘”等。网络招聘发展至今,已经积累了大量的职位信息,随着AI技术的日渐成熟,依靠网络就能够实现精准的职位推荐[3],对于促进大学生就业是十分有意义的。

3 企业招聘市场需求数据挖掘

3.1 数据获取

1)数据源的选择。招聘网站有很多,但是最有影响力的综合招聘网站非前程无忧(51job.com)莫属。前程无忧招聘网站上具有海量的招聘信息,覆蓋的知名企业较多。所以本文选择从前程无忧招聘网站上获取职位信息。

2)Python爬虫获取数据。Python阅读简单,代码结构清晰、明了[4]。利用爬虫算法获取以下信息。①获取热门职位名单。前程无忧网有各类职位信息,职位名称众多,为了Python爬虫可以实现,我们需要先确定职位名称。由于前程无忧没有提供职位名称集合,我们选择从BOSS直聘首页获取职位名称。②获取热门职位信息。由于我们研究的市场需求是针对大学生就业,所以在爬取职位信息时,将工作年限参数设置为“在校生/应届生”。获取热门职位的爬虫代码如下:

def count_page():

"根据boss直聘首页的职位名获取职位名称集合,再从前程无忧上获取热门职位"

driver_path = r"D:\Chrome\Downloads\chromedriver.exe"

file_name = r"D:\Python_code\Python程序\爬虫相关代码\51job\原始数据\数量.xlsx"

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'

}

browser = webdriver.Chrome(executable_path=driver_path)

url = "https://www.zhipin.com/"

job_names = []

browser.get(url)

html = browser.page_source

selector = etree.HTML(html)

job_names += selector.xpath("//div[@class='job-menu']//div[@class='menu-sub']//li/div[@class='text']/a/text()")

name_nums = {}

for name in job_names:

browser = webdriver.Chrome(executable_path=driver_path)

input_tag = browser.find_element_by_id("kwdselectid")

input_tag.send_keys(name)

input_tag.clear()

click_tag = browser.find_element(By.LINK_TEXT, "搜索")

click_tag.click()

html = browser.page_source

html = etree.HTML(html)

job_url = html.xpath("//div[contains(@id,'filter_workyear')]//li[2]/a/@href")

web = requests.get(job_url, headers=headers)

猜你喜欢

就业指导数据挖掘
大学生就业指导教育工作开展对策探讨
略谈开展大学生就业指导的重要性
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
大学生就业指导课教学模式的实践与探索
以人为本,深化高职院校就业指导工作
基于GPGPU的离散数据挖掘研究