APP下载

基于知识图谱的学习资源平台构建

2023-08-23刘波

高师理科学刊 2023年7期
关键词:图谱职业院校建模

刘波

基于知识图谱的学习资源平台构建

刘波

(南京工业职业技术大学 计算机与软件学院,江苏 南京 210023)

针对当前职业院校学生自主学习过程中所面临的问题,提出了一种学习资源平台构建方法.基于此设计平台研究了知识图谱的构建技术架构、知识的建模过程、图谱数据的采集处理过程、知识的抽取技术和知识的存储等关键技术,介绍了知识点抽取和知识关系抽取的具体方法.平台采用基于课程教材层次结构的本体建模方法,使用Neo4j图数据库进行知识存储.该研究成果为学习资源平台的建设提供了技术参考和支撑.

数字化平台;学习资源;知识图谱

随着信息技术的不断发展,人们的学习方式也发生了重大变革,自主学习成为了一种趋势和需求.职业院校的学生作为应用型人才培养的主要对象,自主学习的能力和水平对其未来的职业发展具有重要影响.然而,当前职业院校学生在自主学习过程中面临着诸多问题[1-2].首先,知识获取不全面.职业院校学生需要掌握大量的专业知识和技能,但是传统的教学方式往往难以覆盖所有知识点.此外,不同教师教学风格和教学内容的差异也会导致学生知识获取的不全面性.因此,学生需要一个全面的学习资源库来补充和完善其所学知识.其次,知识结构不清晰.职业院校学生需要将所学知识整合成系统性的知识结构,并建立起不同知识点之间的关联关系.然而,由于传统的教学方式往往注重教学内容的传授而忽视知识结构的构建,学生在知识结构的构建方面往往缺乏有效的指导和帮助.最后,学习过程不连贯.职业院校学生需要将所学知识整合并应用于实际工作中.然而,由于传统教学方式往往强调知识点的单独学习,而忽视知识点之间的联系和应用,学生在实际工作中往往无法有效地将所学知识应用于实际情境中.

知识图谱作为一种新型的知识表达方式,可以将各种不同的知识点以及它们之间的关系以图形的方式进行展示,从而更好地帮助人们理解知识的本质和内在联系.而基于知识图谱的学习资源平台,则是利用知识图谱技术构建一个学习资源库,为学生提供全面、系统、便捷的学习资源和知识服务,帮助学生更好地掌握知识,提高学习效率和自主学习能力.首先,基于知识图谱的学习资源平台可以将各种不同的知识点以及它们之间的关系以图形的方式进行展示,从而让学生能够更全面地了解和掌握知识,同时避免因为信息获取不全面而出现的学习漏洞.其次,基于知识图谱的学习资源平台可以帮助学生建立知识点之间的关联性,形成知识网络,让学生能够更好地理解知识点之间的内在联系和逻辑结构,避免因为知识结构不清晰而出现的学习难度.同时,基于知识图谱的学习资源平台可以将各种知识点之间的关系进行清晰地展示,让学生能够更好地理解知识点之间的关联性和逻辑顺序,避免因为学习过程不连贯而出现的学习障碍.

因此,建立基于知识图谱的学习资源平台可以有效地解决职业院校学生自主学习过程中所面临的问题.本文的研究旨在探索基于知识图谱的学习资源平台的构建方法和技术,以提供技术支撑和参考,为职业院校学生自主学习提供更好的学习环境和学习资源.

1 学习资源平台构建过程

学习资源平台是一种数字化智能平台,其基于职业院校专业知识图谱以及职业岗位技能要求进行聚合.为了构建这样一个平台,需要对相关资料进行查阅,理清知识图谱、职业本科专业课程体系、企业用人技能要求等相关内容,以及归纳总结平台构建的关键环节.此外,在平台构建过程中,还需要整理分析多源数据,梳理学习内容图谱数据.同时,通过现代信息技术构建数字化学习环境,并采用知识图谱技术来组织和序列化学习内容.通过将课程知识图谱、学科知识结构和学习内容进行深度融合,可以满足不同认知阶段和不同能力水平学习者的不同教育需求,促进传统学习方式的变革.

基于知识图谱的学习资源平台的构建过程可以总结概括为4个步骤:

1.1 资料查阅和归纳总结

需要查阅相关资料,如文献、书籍等,以理清知识图谱、职业院校专业课程体系、企业用人技能要求等相关内容,并将平台构建的关键环节进行归纳总结.

1.2 数据整理和分析

在平台构建过程中,需要整理分析多源数据,梳理学习内容图谱数据.通过现代信息技术构建数字化学习环境,并采用知识图谱技术来组织和序列化学习内容,以帮助学生更好地“看得见”学习内容.

1.3 知识图谱和学习内容的深度融合

通过将课程知识图谱、学科知识结构和学习内容进行深度融合,可以满足不同认知阶段和不同能力水平学习者的不同教育需求,促进传统学习方式的变革.

1.4 平台应用和数据收集

构建好基于知识图谱的数字平台后,需要将其应用于教学实践,并收集伴随性数据和学习者反馈数据,对数据进行整理分析,并验证平台的有效性.同时,还需要总结存在的问题并加以改进,以提高平台的效果和用户体验.

通过4个步骤,可以构建出一个基于知识图谱的学习资源平台,该平台可以帮助学生更好地理解和掌握学科知识,同时也可以满足不同学生的不同学习需求,从而促进传统学习方式的变革.

2 学习资源平台的关键技术

2.1 知识图谱技术架构

知识图谱是一种用于描述和组织知识的技术架构[3],在教育领域,要求其对知识的深度和广度进行准确描述和表达.本文采用自顶向下和自底向上结合的方式来构建知识图谱,这种方式能够更好地满足教育领域的知识组织和应用的需求.

在构建知识图谱的过程中,首先,进行知识建模,通过学科教学团队人工编制,确定学科知识体系并梳理知识构成,逐步细化到各个知识点,形成知识层次结构.在此过程中,需要考虑知识的概念、属性和关系的准确描述和表达,保证知识结构的合理性和学习资源平台的可扩充性.其次,确定数据来源并进行知识抽取,将知识实体、实体属性和实体关系添加到三元组中.这一步骤是非常关键的,需要采用自然语言处理和机器学习等技术,对大量的学术文献、教材和网络资源进行分析和挖掘,以获取可靠的知识数据源.最后,进行知识融合、本体构建和知识展示.在知识融合方面,需要将不同数据源中的知识进行整合,去重和归一化,确保知识的一致性和完整性.在本体构建方面,需要建立起一套规范的知识表示语言和本体模型,以实现对知识的自动化处理和应用.在知识展示方面,需要提供可视化界面和搜索引擎等工具,使用户能够快速准确地获取所需知识.

因此,基于知识图谱的学习资源平台构建是一项复杂的任务,需要采用多种技术和方法进行配合,以保证知识的准确描述、组织和应用.本文的知识图谱构建框架见图1,这一框架为职业教育领域的知识组织和学习资源平台的建设提供了重要的指导和支持.其中,知识建模阶段是构建知识图谱的基础,决定了知识图谱的准确性和可扩展性;知识抽取阶段则是获取知识数据源的关键步骤,需要采用多种技术和方法进行数据挖掘和分析;知识融合和本体构建阶段则是对知识进行规范化和整合的关键步骤,保证知识的一致性和应用的效率;知识展示阶段则是将知识呈现给用户的重要环节,需要提供直观、易用的界面和工具,以满足用户的需求.

图1 知识图谱构建框架

2.2 知识建模

知识建模是对知识的概念、属性和关系进行准确描述和表达的过程.在知识图谱学习资源平台构建过程中,知识建模是非常重要的环节.本文的研究对象是职业本科教育领域,因此相较于其他通用知识图谱,其广度、深度和细粒度方面都有更高的要求.

在进行知识建模时,需要考虑如何保证知识结构的合理性和学习资源平台的可扩充性.对于职业教育领域而言,需要建立起专业类、课程类、章节类、知识点类和学习资源类等5个分类,并考虑各分类间的横纵关系,分类之间的关系见图2.

在专业类方面,需要对各个专业的知识领域进行建模,包括专业名称、专业描述、专业方向、所属行业等属性,并通过关系连接不同的专业.在课程类方面,需要对各个课程的知识领域进行建模,包括课程名称、课程描述、课程目标、所属专业等属性,并通过关系连接不同的课程.在章节类方面,需要对各个章节的知识领域进行建模,包括章节名称、章节描述、所属课程等属性,并通过关系连接不同的章节.在知识点类方面,需要对各个知识点的知识领域进行建模,包括知识点名称、知识点描述、所属章节、知识点类型等属性,并通过关系连接不同的知识点.在学习资源类方面,需要对各个学习资源的知识领域进行建模,包括资源名称、资源描述、所属知识点、资源类型、资源路径等属性,并通过关系连接不同的学习资源.

在这个知识图谱中,每个节点代表一个知识点或学习资源,每个节点都有自己的属性,例如:知识点的名称、描述、类型,或者学习资源的名称、描述、类型和路径等.节点之间的边代表不同节点之间的关系,例如:一个学习资源所属的知识点,或者一个章节所属的课程等.通过这样的知识建模方式,可以在职业本科教育领域中建立起一个详细、准确、全面的知识图谱,帮助学习者更好地理解和掌握相关知识,同时也能够帮助教师和教育管理者更好地制定教学计划和评估学习效果.此外,保证学习资源平台的可扩充性也是一个重要的考虑因素.在知识建模时,需要充分考虑未来的拓展和升级,保证平台的可持续发展.因此,在建立知识图谱时,需要注意数据格式的统一性和可扩展性,并预留一定的空间以容纳未来可能新增的节点和边.

图2 各分类横纵关系

2.3 学习资源数据采集与处理

在知识图谱学习资源平台构建过程中,学习资源数据采集与处理是重要的环节之一.学习资源主要来源于课程教材、教材配套的教学资源和互联网数据等3个方面.

2.3.1 课程教材 课程教材是专业领域知识的高度凝练,适合作为知识构建的主要数据源.在选择课程教材时,需要经过学科教学团队的专业评估和讨论,同时要充分结合当前就业市场的职业能力要求,确保教材具有实际应用价值.不同的课程教材以不同的角度进行教学知识阐述,有助于学习者从多角度进行知识学习,同时也为学习资源平台提供了多样化的数据源.

2.3.2 教材配套的教学资源 教材配套的教学资源是目前各大出版社新出版教材的必备内容.这些教学资源如课件、教案、案例、习题等拓展了教材的学习内容,具有很强的系统性和针对性.此外,配套的二维码、网址等同步学习资料可以随时随地获取并使用,方便快捷,极大地提高了学习效率.

2.3.3 互联网 互联网也是重要的学习资源来源.在信息化时代,众多教育教学网站提供了大量教学资源,这些教学资源进一步完善了学习者的学习系统性.同时,各类招聘网站的招聘信息中,也明确提出了各个职位的职业能力需求.学习者可以通过互联网更加全面地了解就业环境,帮助学习者更好地做好职业能力准备和职业学习规划.

在收集和存储学习资源之后,需要对这些资源进行筛选和处理,才能够进行资源数据采集.这个过程可以通过文本挖掘技术和自然语言处理技术来实现.文本挖掘技术可以从非结构化文本中找出结构化的数据,自然语言处理技术可以自动抽取知识信息,将其转化为结构化数据.这些技术的应用,可以大幅度提高资源数据采集的效率和准确性.但是,由于学习资源的来源非常广泛,其质量和可信度也参差不齐,因此在进行数据采集和处理时需要注意4个方面:(1)来源可靠性.在选择学习资源时,应尽量选择来源可靠、内容真实可信的教育机构或网站,以免误导学习者.(2)版权问题.对于非自主创作的学习资源,需要尊重原作者的知识产权,确保获取学习资源的合法性和版权合规性.(3)内容质量.需要对收集到的学习资源进行评估和筛选,保证内容的质量和实用性.同时,应注意资源的时效性,及时更新或淘汰过期的学习资源.(4)数据格式.为了便于资源管理和利用,需要对采集到的学习资源进行标准化和分类,建立起完整的知识图谱体系.通过这些措施,可以保证学习资源的质量和可信度,提高学习资源平台的知识覆盖率和应用价值,从而更好地服务于学习者和教育机构.

数据采集完成后还需要进行分词处理,本文主要采用Jieba对课程教材内容进行分词操作.Jieba具有词性标注、统计词频、关键词抽取以及去除停用词和标点符号等功能.对于一些相关领域的专业词汇,则需要人工手动添加.

2.4 知识抽取

2.4.1 知识点抽取 在知识图谱的构建前,要对专业领域知识进行分析、提炼等处理操作.提取知识点及知识点之间的关系,分析各知识点之间的层次关系,然后建立知识本体模型,最终以本体模型作为知识图谱的组织框架,进行实例数据的填充,完成知识图谱的构建[4].知识点作为知识图谱构建的重要组成单位,应首先将课程知识点抽取出来.

TF-IDF(Term Frequency-Inverse Document Frequency)是一种常见的数据挖掘与信息检索技术,主要用于文本特征提取.其核心思想在于:一个词语的出现频率,与该词语对某篇文章的重要程度成正比,但与在语料库中出现的频率成反比.即一个词语在文章中出现的频率越高,则该词语越能代表该文章,可以视为该文章的关键词.

TF-IDF是TF与IDF乘积的一种算法,其中:TF为词频;IDF为逆文档频率.TF是指一个词语在某篇文章的出现次数与该文章总词数之比,IDF是指在某篇文章中,给定一个词语在其他文章出现的次数,用来检测该词语的普遍程度是否能作为区分该文章与其他文章的词语.TF-IDF的计算公式[5]为

通过TF-IDF抽取知识关键词后,再经由人工标记归纳无用词,保留该专业领域的关键词.将保留的关键词交由专家查看、审核、补充和完善,最终得到高质量的核心关键词,并将这些关键词作为课程知识点.

2.4.2 知识关系抽取在知识图谱中,知识之间通过关系相互关联,并最终构成语义网络,主要采用两阶段的方式进行关系抽取.一阶段采用关键词触发的方式进行关系抽取.在关系抽取前,对文章进行统计分析,把一些常用关键词作为核心关键词,利用关键词匹配的方式获取知识关系,常见的关键词[6]见表1.

表1 常见的关键词

在二阶段主要采用依存句法分析的方法进行关系处理.句法分析主要用于确定句子的句法结构以及句子中词与词之间的依存关系,依存句法分析则是通过分析语句结构中成分之间的依存关系解释其句法结构,发现语句语法特征和语义联系.依存句法分析广泛应用于实体关系抽取、情感分析、自动问答、触发词识别等自然语言处理任务之中[7].本文使用的依存句法分析工具是LTP[8],LTP是由哈尔滨工业大学研制的一套中文自然语言处理系统,集成了词法、句法和语义分析等中文语言处理技术,能够帮助研究者深入研究语言各个层面之间的关系[9].

2.5 知识图谱构建

知识图谱的构建是非常关键的一个环节,在构建本体模型时,需要从“章节”到“知识点”再到“资源”的方式进行建模.使用本体库Protégé[10]来建立知识图谱模式层,该层包含相关概念、属性和关系等信息.知识图谱本体分为模式层和数据层2个层次,模式层是本体建模的模板,用于描述概念之间的关系和属性;数据层则用于填充模式层,以创建具体的实例.

在本体建模的过程中,着重考虑了课程教材的层次结构.通过对不同层次的教材内容进行分析,以建立一个更加完整的知识图谱模型.例如:可以将一个课程的每个章节作为模式层的一个概念,并将每个章节下的知识点作为该概念的属性.通过这种方式,可以建立一个更加完整的知识图谱,可以帮助学习者更好地了解课程内容.

在填充数据层的过程中,使用了Neo4j[11]图数据库进行知识存储.Neo4j图数据库是一种非关系型数据库,它可以存储具有复杂关系的数据.通过将模式层中的概念和属性映射到数据库中的节点和属性上,将概念之间的关系映射为数据库中的边.通过这种方式构建一个高效的知识图谱,并可以方便地查询和管理其中的数据.

本文的方法在构建知识图谱时,更加注重数据的层次结构,从而更加准确地描述了不同概念之间的关系和属性.而使用图数据库来存储知识图谱,使查询和管理数据更加高效和方便.然而,值得注意的是,学习资源的来源非常广泛,其质量和可信度也参差不齐.在实际应用中,需要对资源的质量和可信度进行评估和筛选,以确保学习者可以获得高质量和可靠的学习资源.

3 学习资源平台构建成果

在学习资源平台构建过程中,以“人工智能工程技术”专业为实验对象,具体分析了专业信息,包括课程类、章节类、知识点类和学习资源类及其应包含和具备的学习内容,学习内容示例数据见表2~6,人工智能导论课程的知识图谱内容见图3.在下一步的研究中,还将在知识图谱中加入来自学生学习数据的实时反馈,以进一步优化知识图谱的质量.通过对知识图谱的评估,所构建的知识图谱能够有效地支持学习资源的推荐和学习过程的辅助.

表2 专业类示例数据

表3 课程类示例数据

表4 章节类示例数据

表5 知识点类示例数据

表6 学习资源类示例数据

图3 人工智能导论课程的知识图谱结构

本研究通过知识图谱的构建和学习资源的推荐,能够为学生提供个性化、高效的学习支持,有望成为未来在线教育平台的重要发展方向.

4 结语

本文研究了学习资源知识图谱平台的构建方法,通过教学精准化以满足学习者的职业化学习需求,缩短学习者匹配职业岗位的时间成本,提升学习资源的开发质量和利用率.通过数据分析和人工智能技术,将学习者的学习内容及资源以图谱化的方式进行展示,打破原有参照普通教育建立的“以教师为中心”的学习生态系统.通过该平台让学生直观地了解所学知识脉络、职业技能需求及职业差距,引导学生更有针对性地学习,更好地发挥他们学习的积极性和主动性,促进教育资源的最大化利用,使得优质的教育信息资源的使用率大幅提升.在下一步的工作中,还需要研究学习者画像的构建.通过对学习者的基本信息、学习内容以及学习行为等数据的收集,刻画学习者的个体化特征和行为特征,对用户、标签、资源等个性化数据进行聚类和分析,最终实现个性化学习资源推荐服务.

[1] 刘炜杰.特殊情形下职业院校在线教学模式的构建研究[J].职教论坛,2020(4):49-54.

[2] 王雯,韩锡斌.职业院校课程混合教学设计的现状分析[J].教育与职业,2020(9):95-100.

[3] 刘峤,李杨,段宏,等.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600.

[4] 家明强.基于知识图谱的课程学习系统设计与实现[D].昆明:云南师范大学,2021.

[5] 唐晓波,刘江南.基于BERT和TF-IDF的问答社区问句自动标引研究:以金投网问答社区为例[J].情报科学,2021,39(3):3-10.

[6] 蒋婷,孙建军.领域学术本体概念等级关系抽取研究[J].情报学报,2017,36(10):1080-1092.

[7] 邹超群.基于知识图谱的智慧学习平台的设计与实现[D].西安:西安理工大学,2020.

[8] 李晓,解辉,李立杰.基于Word2vec的句子语义相似度计算研究[J].计算机科学,2017,44(9):256-260.

[9] 刘挺,车万翔,李正华.语言技术平台[J].中文信息学报,2011,25(6):53-62.

[10] 洪娜,张智雄.Protégé在科研本体构建与推理中的实践研究[J].现代图书情报技术,2009(增刊1):1-5.

[11] 王红,张青青,蔡伟伟,等.基于Neo4j的领域本体存储方法研究[J].计算机应用研究,2017,34(8):2404-2407.

Construction of learning resource platform based on knowledge graph

LIU Bo

(School of Computer and Software,Nanjing Vocational University of Industry Technology,Nanjing 210023,China)

A method is presented for constructing a learning resource platform to address the challenges faced by vocational college students in their independent learning processes.The design of the platform is based on the investigation of key technologies such as the construction of knowledge graphs,the modeling process of knowledge, the collection and processing of graph data,knowledge extraction techniques,and knowledge storage.Specific methods for knowledge point extraction and knowledge relationship extraction are introduced.The platform adopts an ontology modeling approach based on the hierarchical structure of course textbooks and utilizes the Neo4j graph database for knowledge storage.The research findings provide technical references and support for the development of learning resource platforms.

digital platform;learning resource;knowledge graph

1007-9831(2023)07-0041-07

TP311

A

10.3969/j.issn.1007-9831.2023.07.009

2023-03-06

江苏省现代教育技术研究课题(2022-R-100280)——职业本科院校学生学习资源图谱化研究;江苏高校哲学社会科学研究课题(2023SJYB0537)——数字化赋能职业教育高质量发展研究

刘波(1986-),男,江苏徐州人,工程师,硕士,从事智慧教育研究.E-mail:liubo@niit.edu.cn

猜你喜欢

图谱职业院校建模
绘一张成长图谱
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
如何加强职业院校学生的德育教育
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
浅谈职业院校中的美术教育
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
支持水利职业院校发展
三元组辐射场的建模与仿真