APP下载

个性化学习资源推荐中文本情感识别的作用及关键技术

2023-06-07许桂芳穆肃

中国电化教育 2023年5期
关键词:个性化学习

许桂芳 穆肃

摘要:基于数据智能分析的学习资源推送是精准支持个性化学习的教学服务方式之一。随着人工智能技术和学习分析技术的发展,通过对行为数据、测评数据和日志数据等的分析进行资源推送虽已有较成功应用,但未能实现学习者个人情感状态为引导的资源推送。为此,该研究针对个性化学习资源推荐中情感价值、情感控制理论和实践的缺失,以实现个性化学习多维度情感识别为目标,采用BERT模型和TextCNN构建个性化学习资源推荐文本情感识别模型,并提出了基于学习者作业、论坛内容等的文本情感识别模型实现过程。学习资源推荐文本情感识别模型和实现过程可为真实应用提供方法支持和技术路线指引。

关键词:学习资源推荐;文本情感识别;个性化学习

中图分类号:G434 文献标识码:A

* 本文系国家自然科学基金2022年度重点项目“课堂流媒体跨模态知识元协同解析与评估方法”(项目编号:62237001)研究成果。① 穆肃为本文通讯作者。

个性化学习资源推荐的目标是用技术破解教育中长期存在的“不可能三角”,即优质、公平、效能三者兼顾的难题[1],将传统供给驱动的资源推荐方式转变为需求驱动的个性化资源推荐模式,实现以学生为主体的学习支持服务,促进学生个性化发展。人的学习过程中,认知、情感、意志是内在因素,行为是外在表现,内在因素通过外在行为映射到学习活动上,对学习过程产生影响。及时、合理、有效的资源推荐服务需要建立在对学习者的全面了解的基础上[2]。

目前,机器学习、深度学习等人工智能技术和数据挖掘技术,被引入在线教育平台,通过对学习者的认知特点、知识水平、学习偏好等进行分析,形成学习者特征模型,从而有针对性地提供学习资源推荐服务,个性化学习资源推荐研究已取得一定进展和成果。个性化学习资源推荐现在主要有三条实施途径:第一是学习者建模,也称为“学习者画像”,通过真实全面地采集并分析学习者的学习目标、学习风格、认知水平等个性特征数据,建立准确的学习者模型并进行资源推送;第二是学习资源建模,深入挖掘学习资源与学习者个性相关联的数据,以建立二者的相似关系实现推送;第三是推荐算法设计,采用智能计算模式将学习者模型和学习资源模型匹配,并在适当的时机融入学习者的学习过程,从而提升学习效率[3]。对学习者特征的研究越来越全面、立体,推荐就越准确。但无论是理论或是实证研究方面,学习者建模时提取知识和认知方面的特征比较普遍,而结合学习者情感状态进行资源推荐的研究还相对较少,因此开展情感状态识别和描述,以提升资源推送准确度,成为资源推荐技术研究的新角度,也是本文研究提出的原因。

一、教学资源个性化推荐中情感识别的作用

学习情感是学习者在学习过程中产生的情感体验,具体表现形式为学习情绪的表达[4],对学习过程和状态会产生影响。按照情感状态的表示方式不同,情感可以分为离散状态表示和连续状态表示[5]。离散状态表示基于基本情感理论,例如美国心理学家Ekman将人类的情感归为高兴、生气、伤心、厌恶、惊讶、害怕六个类别之一,其他情感可以看做基本情感的组合[6]。連续状态表示基于维度情感理论,认为情感状态并不是相互独立的,假设将情感映射到多维连续空间,每一种情感相当于多维连续空间中的一个点,例如Mehrabian提出的“情感三维理论”采用“效价”(Valence)、“唤醒”(Arousal)和“支配”(Dominance)三个维度描述情感状态,分别表示情感的愉悦程度、强度和控制程度[7]。Faria等指出个人在线上学习环境中的行为会受到情绪的强烈影响[8],Cordero等也发现情绪和学生学习风格和学业成绩有显著关系[9]。已有研究证据表明,一些情绪状态能支持学习过程,另一些则抑制学习过程[10-12]。例如,困惑与学习资源的理解呈正相关,但可能导致学习的非适应性情感,比如当学生无法理解时的沮丧[13]。在新兴的学术研究中应用情感视角,并将情感定位为学习的中心,正成为一种趋势[14]。情感识别(或称情感计算)指通过计算机实现人类情感的识别、解释、建模和分析[15]。情感识别被用于调节教学策略、改善学习过程[16-18]。自动情感识别算法可以帮助探索这种情感的作用,使对学习者情感状态的评估比基于问卷的调查更加客观。

在传统课堂上,教师可以通过面部表情、眼部动作、手势、身体姿势、说话声音甚至一些生理信号等显性表征的信息判断学习者的情感状态,及时调整教学策略。而在线上个性化学习推荐环境中,由于师生处于“准分离”状态,准确识别学习者情感需要利用技术手段来实现。学习过程中用于进行情感识别的数据包括:表情、手势与身体姿态数据,皮肤电数据、脑电数据、文本数据等多模态数据[19],研究者不断探究学习者的情绪状态和交互模式对学习的调节作用。多模态的学习情感识别研究正处于起步阶段,这是今后的重要研究方向。情感识别数据的获取和分析方法应用于个性化学习推荐中具有一定的局限性。大部分研究需要配置额外的采集设备,情感数据高昂的采集和标注成本、采集过程对学习过程造成的侵入性等问题限制情感识别在个性化学习推荐中的应用。同时,在线学习者的状态是相对自由和隐蔽的,通过显性特征提取学习者的情感特征存在数据稀疏的问题。而大多数的文本采集方式以调查问卷和学习量表为主,静态的量表无法反映学习者实时的情感状态。许多研究者开始关注于有限资源情况下的情感识别问题[20]。

学习者在线上学习过程中与同学间的讨论、协作学习过程中的交互、与教师间的提问交流、对学习资源的评论、学习者提交的学习报告等文本,都蕴含着丰富的情感信息。学习者这些文本中情感的表达是隐性的,通过文本情感识别技术可以分析、提取文本数据中的情感特征,自动识别其中的学习者情感状态,以此调节学习资源推荐策略,为实现更精准的个性化学习资源推荐提供了一种新的思路。情感识别在资源智能推送中可以发挥的作用有以下几方面:

1.从多视角综合理解学习者的行为、情感与认知的关系,整合多维度数据的分析来发现更多影响学习者建模的个性化参数,融入情感特征形成全面的分析模型。

2.从情感评价的角度提供学习资源表示的新框架,利用无监督的深度技术对海量资源进行属性的情感描述,提高学习资源推荐的精准度和适应度,为同类研究提供了新的思路与方法。

3.通过深层特征提取挖掘学习者情感模型与学习资源模型潜在特征,来构成能够体现两者的自适应关联的独特性或相似性表示方式,为情感理论在个性化学习推荐的实现提供了新的理论支撑。

二、文本情感识别的常规方法和资源推荐中的应用

Pekrun最早提出学习情绪定义并描述成就情绪与学习者认知之间的关系,将学习者的学习定义为结果/预期、结果/回顾和活动不同阶段,每个阶段对应控制和价值状态,并分别表达为不同的情感,包括愉快、希望、自豪、放松、愤怒、焦虑、羞愧等[21]。随着近年来在线学习、混合学习的发展,研究者采集不同学习数据分析了不同学习者的在线学习情感类型。赵宏等人[22]将学习情感划分为积极情感体验(包括骄傲、兴奋、满意等)和消极情感体验(包括孤独感、挫败感等)。李艳等[23]通过阅读在线学习日志分析学习者的情感体验的内容,发现学习者的情感体验主要表现为兴奋、期待、压力、紧迫感、逐渐适应、信心、愉悦感、挫败感和不舍9种类型。以上研究通过分析在线学习中学习者部分学习行为的记录文本得出学习情感分类情况。研究表明,学习者在不同的学习情境的学习体验是不同的,线上学习中不同学习群体的情感体验较为个性化[24]。学习者的情感体验是动态变化的,其情感体验在不同的学习过程、学习内容、学习阶段随时间发生变化[25]。这种变化目前还未能找到统一的规律[26],通过文本情感识别技术对其进行研究有助于准确判断学习者的情感。

(一)文本情感识别的方法和技术方案

1.文本情感识别已有的方法和技术方案

文本情感识别属于自然语言处理(Natural Language Processing,NLP)中的一种技术,自然语言在各个层面广泛存在的歧义性和多义性使得自然语言处理存在较多困难。自2012年以来,自然语言处理研究领域尝试直接通过深度学习建模,在许多任务上取得了明显的质量提升[27]。文本情感识别技术主要包括情感数据编码、情感特征提取和情感分类等过程。按照情感数据编码的技术可以分为:

(1)基于语料库的方法:主要是利用语句之间的连接词具有一定的情感极性,通过抽取连接词进行统计计算。戴敏等人[28]设计了一套中文情感信息抽取语料库的标注体系,可用于对常见的句子情感极性、情感词和评价对象等信息的标注。

(2)基于情感词典的方法:早期研究主要使用标注好情感倾向的情感词典来判断情感类别,如文献[29]采用BonsonNLP情感词典对MOOC平台三门大学数学基础课程共44243条课程评论数据进行情感分类,提取和分析平台学习者对在线课程的学习感受。但是基于情感词典的方法对于网络新词的更新支持不足,不同情境下的同一情感词存在词语歧义,在跨领域的泛化能力不理想。

(3)基于传统机器学习的技术:人工提取文本特征后,以帶有情感标注的数据集训练一个情感分类器,再用于预测待检测文本的情感倾向。该分类器是通过传统的机器学习方法(常用的有贝叶斯算法和支持向量机)进行训练。基于传统机器学习的方法需要人工对文本特征进行标记,而且不能充分利用上下文文本的语境信息,准确性受到影响。

(4)基于深度学习的方法。深度学习技术对字词进行基于上下文的稠密向量表示,通常称为词向量或词嵌入(Word Embedding)。由于词向量可以多维度、抽象化体现语言特征,词义相近的词的词向量相对“更接近”,在自然语言表示中得到广泛应用。但词向量表达特征的准确程度依靠对包含大量句子或单词的语料进行训练即“学习”所得,语料数据收集会相对较难。但由于语言的规律是共通的,可以利用迁移性将别人已经训练好的词向量集用到自己的任务中。常见的开源的词向量工具有Word2vec、Glove等,由巨量语料库训练而成,泛化能力比较强,可以直接用于特定的文本识别任务中。近年来出现的BERT等采用预训练的方法,可以使用未标注的文本进行编码,减少了手工编码的复杂和主观性。

在特征提取方面,神经网络技术通过全连接层、隐藏层进行多层计算,能较好抽取深层次、抽象化特征,如CNN(卷积神经网络)和RNN(循环神经网络)等都有很好的表现。CNN对提取局部特征比较擅长,TextCNN在此基础上针对语言处理的特点进行优化。而RNN原理相似,但其能将前一输入信息带入下一输入的序列处理更加适合语言的按顺序读取的序列特性。但RNN无法处理长文本的上下文信息,加入长短时记忆机制的LSTM(长短期记忆网络)对RNN结构进行改进,能够更好理解上下文的词语关系,GRN(广义回归神经网络)进一步优化,使这种结构更简单。但RNN无法支持并行计算,只能通过多层计算来提取特征,这会使神经网络的结构过于复杂。近年来,能够支持并行计算的Transformer框架被提出来并且得到广泛应用,但这种大模型涉及参数非常多,对算力要求很高。利用语言的可迁移性,使用别人训练好参数的模型作为基础再进行优化补充和参数微调来设计开发特定的任务成为普遍做法。BERT模型是基于Transformer框架的预训练语言模型,支持双向特征的深层提取,能够提取上下文的信息,只需要少量数据加上微调,可以提高识别准确率。

在情感分类方面,经过模型训练输出具有情感特征的数据再经过分类算法,就可以输出情感识别结果。分类算法比较简单,采用传统机器算法或CNN、TextCNN可以实现计算目标。

2.拟采用的文本情感识别的方法和技术方案

静态的情感描述和单一学习场景的文本数据是无法准确捕捉学习者的情感变化轨迹,本研究尝试采集个性化学习系统中的学习者的不同场景在线学习文本数据,挖掘学习者深层次的动态的情感特征,以更全面地识别学习者的学习情感,实现更精准的个性化推荐,如下页图1所示。

(1)数据集。采集学习者的学习体验报告、学习资源评论数据、协作学习交互数据、师生答疑数据,以句子为单位进行情感标注,自主构建一个个性化学习领域的情感数据集;

(2)特征编码。采用BERT预训练语言模型,运用其自监督机制和双向注意力机制,将原始文本数据转化为包含上下文信息的多维词向量;

(3)特征提取和分类。采用TextCNN文本卷积神经网络结构,设置多个卷积核对输入的词向量进行多维特征提取,再通过全连接层分类输出识别结果。

(4)通过文本情感识别形成学习者隐性情感特征、学习资源隐性特征,计算学习者和学习资源之间隐性情感特征的最大相似度,为每位学习者找到最感兴趣的学习资源列表。

(二)現有文本情感识别在学习资源推荐系统中的应用

目前,文本情感识别在个性化学习资源推荐中的应用还处于起步阶段。Camilo Salazar等[30]提出了一种学习资源中自动情感分析的方法,还比较了学习资源中文本数据情感分析任务的各种特征提取策略和机器学习技术。其研究发现采用BERT进行未标注文本识别呈现出与标注情感词相似的分布,显示出与真实标注的良好一致性和极好的相似性,反映了该方法的可行性。基于词频、词典、词向量和BERT的特征集和特征提取用了传统机器学习方式PLS和RF技术,这些机器学习技术提取情绪的过程是非常领域敏感的,当将学习到的模型应用于其他领域时,准确率会大大下降。研究反映出模型的识别能力与训练它们的数据领域的紧密联系,显示出对其他领域的低泛化。通过比较该研究指出,传统编码标注方法需要对学习资源进行情感标注,由于存在大量此类资源,这是一项非常艰巨的任务。

上述关于文本情感识别在个性化学习资源推荐中的研究证明采用文本情感识别方式进行情感分析是可行的,但存在以下问题:一是采用传统机器学习的特征提取方法在不同的领域泛化能力比较低,训练模型用于其他领域的情感识别效果不好;二是采用标注情感数据集手工工作量大,且无法及时更新数据。因此,本研究从学习者在学习过程中产生文本数据分析的角度,利用BERT模型可以对未标注的数据集进行编码的优点,采集个性化学习推荐中的学习者行为数据作为学习领域数据集的补充,采用深度学习技术TextCNN(文本卷积神经网络)技术进行情感特征提取的方式,构建情感识别模型,以实现对文本情感识别下个性化资源推荐。

三、个性化学习推荐中的文本情感数据集的构建

文本情感识别实质是情感归类问题,BERT预训练模型使用的语料虽然很丰富,对自然语言的语义联系迁移效果比较好,但用于情感分析任务时,为了体现领域特点,还需要少量学习过程标注的文本情感数据,才能训练得到更加精准的模型,得到理想的预测值。个性化学习推荐中有特有的学习者情感特征,比如对学习的困惑,学有所成的喜悦和遇到挫折的沮丧等情感,与一般的商业推荐不同。目前,专门用于学习者的学习情感数据集的相关研究比较少,且主要以英文为主,大部分机构或单位不会开放学习者的学习数据,需要自己建立分析数据集。因此,本研究提出构建个性化学习推荐中学习者文本情感识别数据集的方法。

(一)文本数据指标的筛选

个性化学习系统中学习者在学习过程产生的文本数据分为自主学习文本数据、协作学习文本数据[31]。自主学习文本数据是学习者与学习资源或学习平台进行交互产生的,如对学习资源的评价和分析,学习体验报告、系统的学习支持服务中的提问和答疑等文本数据;协作学习文本数据是学习者与其他学习伙伴进行协同知识建构的过程,如交流讨论、协作行为和问题解决行为等文本数据[32]。

衡量学习过程产生的文本数据能否作为学习情感特征数据,需要判断数据是否体现学习者的在线学习情感体验。在线学习情感体验可以划分为正向和负向两个维度,具有临场性、交互性、变化性、社会性、技术支配性和具身性特征[33]。现有研究中采用的学习情感体验反馈文本数据载体包括:(1) SPOC论坛帖子。刘智等[34]发现在SPOC论坛互动过程中,学习者的主观态度倾向于积极极性,且该课程中学习者的积极情绪密度普遍高于困惑及消极情绪密度;(2)课程反思文本。单迎杰等[35]在课程每单元最后设置话题为“学习体验与反思”,鼓励学习者分享其在该单元学习过程中的体验与感受,并对反思文本进行质性分析;(3)学习活动记录。朱孝平[36]在实训过程中以及实训活动结束后,让学生记录、总结实训活动的体验与收获,该记录文本作为“互动工具”“反思工具”,研究发现学习者的体验特别丰富,这些体验多指向情感态度领域;(4)在线交互数据。马宁等[37]开展大规模教师在线培训,围绕每周的学习主题开展在线异步交互活动,生成了12576条交互文本被平台自动记录;通过向量机挖掘学习者隐藏在交互文本中的情感状态和认知水平,为自动反馈提供依据;(5)学习资源评论数据。张娜等[38]爬取12种领域的学科课程的有效数据68367条,其中包含千余门课程信息和评价,采用统计分析和文本分析的方法,分析显示积极评论数量都高于消极的评论数量。

以上研究所采用学习文本数据具有数据可自动获取、情感特征可提取、数据获取途径可行的特点。参考既有的个性化学习行为数据和文本情感测量情况,本研究在综合分析的基础上,以某高校在线学习平台自动记录的数据作为来源,精选三门课程三年来的学习体验报告、学习资源评论数据、协作学习交互数据、师生答疑数据作为文本的数据来源。

(二)文本数据的收集

本研究选择的文本数据都是平台自动记录,存放于系统的数据库中,可以自动导出相关字段内容得到。数据导出时系统管理员将数据做脱敏处理,主要用于训练模型识别语义中的情感信息,不涉及个人信息。

1.学习体验报告数据。在每门课程结束时,教师会设置一个“学习报告或体验”活动,让学生在平台上提交学习结束后的体验总结。学习报告主要分为学习内容、学习效果评价以及对学习资源的改进建议等。学习体验报告通常是长文本,其中包含不同方面不同极性的情感,可能一个文本中包含的情感有多种。为了方便处理,这类报告按不同的评价点切分成几份的短文本。

2.学习资源评论数据。系统包含学习资源库,按照资源的类别比如课件、课程、文本、语音等的存放学习资源文件,提供给学习者学习。学习者浏览的时候每个资源在播放页面下设置有点赞和评论区,设置打分功能,提供1、3、5三个不同的分值,分别对应高、中、低的评价,学习者在点赞或评论时如果配合打分,后期会减少进行数据标注的工作量。

3.协作学习交互数据。协作学习交互数据包括论坛区的发帖信息和小组讨论信息。这部分内容包含学生学习活动中形成的观点、提出的困惑、问题得到解答后的回復等信息。

4.答疑数据。包含学生和教师之间提问和解惑的交流文本,平台提供的学习支持服务的答疑文本。

四种内容的数据收集后归于一个文档,对于和情感无关的一些冗余信息进行初步筛选,比如标点符号、重复信息等,去除无关信息,留下以句子为单位的文本数据。

(三)情感类型定义

根据Pekrun关于成就情绪的控制价值理论对学习情感的分类[39],本研究按学习情感的产生情境,定义学习情感类型,并确定情感表达方式。

一级指标里按照三种不同的学习情境,包括结果/预期、结果/回顾、活动,定义三个一级指标;二级指标里对应每个一级指标,按照愉悦度进行区分情感状态分为积极和消极两种倾向,定义为二级指标;三级指标里对应每一种情感极性,根据情感的唤醒度/激活度,分别定义为高、中、低三类,其中在结果回顾中,我们以情感的优势度划分,根据情感对他人和外界环境的控制力和影响力,将结果原因分为无关的、自我和其他三类,按照积极和消极情感的极性分别分为三类不同情感。

根据控制价值理论,对应三级指标,确定情感类型,并进行编码。其中结果/预期包括期待、希望、无望、放松、焦虑、绝望6种情感;结果/回顾中包括快乐、骄傲、感激、悲伤、羞愧、愤怒6种情感;活动中包括享受、生气、挫折、无聊4种情感。一共细分为16种情感类型,按顺序从0至15进行编码,形成情感类型编码文件。如表1所示。

(四)文本数据的情感标注

对收集到的学习者的多个来源的文本材料进行分析,采用三级编码技术,对所有与学习者体验有关的句子进行预处理,去除无关信息,然后进行编码。首先对文本中的情态进行初步分类,主要分成学习前的结果/预期,学习后的结果/回顾,学习过程中的活动三个阶段。每个阶段按情感倾向性分为积极的情感、消极的情感,进而根据情感强度分成具体的情感类型,如表1所示。通过与师生访谈等手段,进一步证实了这种分类结果的合理性。

已标注的情感数据汇成一个数据集文件,每一个完整句子一行,标注好情感编码,编码的数字与情感类型一一对应,形成数据集,如下页图2所示。

四、个性化学习资源推荐的文本情感识别模型技术架构

利用学习情感标注数据集,借助预训练BERT模型进行分词和词向量编码,本研究提出以下个性化学习资源推荐的文本情感识别模型技术架构。模型分为训练模型和识别模型。训练模型主要用于数据集预训练,识别模型用于预测学习者的文本情感。模型的技术架构如图3所示。

整个模型包括输入层、预处理层、BERT层、TextCNN层和输出层。

(一)输入层

训练模型导入数据集文件,输入的数据为标注的情感数据。一般将数据集随机分为训练数据集、验证数据集和测试数据集,存放在train.txt,vec. txt,test.txt文件中,分别用于训练、验证和测试环节。数据文件中还必须有一个class.txt文件,存放数据情感分类和编码的对照表。

识别模型读取待识别文本,每次提取一个句子进行分析。识别模型输入层通过API接口与个性化推荐系统其他项目对接,以接收待识别的文本数据。

(二)预处理层

预处理主要是对输入层数据进行分词和编码。本研究采用BERT中的BertTokenizer进行分词,所以加载BERT模型时将同名的BertTokenizer也一同加载。由于BERT是预训练大量语料生成的优化模型,参数已经调整到“最佳状态”,所以使用BERT编码的词向量特征信息准确率比较高。BERT的分词方法是把文本的每个字作为一个单位,例如输入一个句子,分词后用encode方法进行编码,形成句子的词向量。

以中文句子:“视频讲解清晰”为例,分词的结果是:

[cls,视,频,讲,解,清,晰,sep]

执行分词并编码,将文字转成编码ID。

BERT编码时在句子的第一个字前面加了一个标志变量[cls]编码,编码后初始值为[101],表示句子的开头,在输出层时情感分类的编码信息会在这个编码中。每个句子分隔会加上一个[sep]编码,编码值为[102]。类似的标志向量还有[mask]。数据集中每一个句子的长度是不等的,为了批处理时统一调用,还需要定义每次处理句子的长度,不足长度用PAD值0补足,过长的句子进行截取,丢弃后面的内容。句子的长度需要根据数据集中的句子的长度而定,一般取容纳大部分句子的长度。

(三)BERT层

对输入的词向量进行读取和双向特征运算,使输出向量带有上下文的情感信息。输入由两部分构成,包括上一节编码的词向量和位置编码相加。因为BERT的机制是所有字词同时输入,此处叠加位置编码可以记住句子中字的顺序。位置编码是随机产生的,BERT中对词向量编码会转化为768维,编码后每个句子输出的实际上768维度的矩阵。

(四)TextCNN层

TextCNN层主要作用是对BERT输出的向量进行卷积计算,通过卷积,提取每个句子的不同维度的情感特征。每个卷积核代表一个维度特征,为了从多维度提取向量的特征,分别设置大小为2,3,4的卷积核,每种尺寸卷积操作设置为2个。运算结果输入池化层,池化选取每个词向量中的最大值,取到最大值标量,再将不同卷积核的值拼接,输出特征向量。最后将特征向量送入全连接层进行计算,输出一个含有16类情感特征的向量。

(五)输出层

训练模型主要为了学习到更优化的参数,输出会与验证值进行比较,通过反向传播对模型参数进行调整。通过训练后将形成的模型导出,作为识别模型。识别模型将输出结果通过API接口与在线学习系统的用户界面联系,输出情感识别的结果。或作为学习推荐的子模块,成为输入项。

五、文本情感识别在个性化学习推荐中的应用

(一)识别学习者的情感状态以调整资源推荐策略

文本情感识别可用于自动检测学习者的情感状态及其变化,辅助资源推荐决策,将学习者从抑制学习的消极状态转移到激发学习的积极状态,提高学习干预的精准性和效率。相关研究[40]表明,促进学生的积极情绪和幸福感与学习成功、进步相关。已有实验证明根据对与学习相关的参与、沮丧、无聊的情感自动识别来制定学习内容推荐的策略,使学习者保持在最佳情感状态,确实可以增加学习者参与度,从而促进學习。本研究构建的文本情感识别模型基于多场景下学习者的文本数据,较全面把握学习过程的变化,对学习者情感进行细分,能够识别学习者潜在的学习情感状态。通过评估学习者对某一学习过程或在某段时间的情感状态,可以有针对性地建立对应不同情感状态的推荐策略库,自动计算推荐促进学习者积极情感或增强学习参与度的学习资源。例如当观察到学习者情感状态处于认知负荷过载的消极状态时,学习推荐系统可以降低难度或在待推荐资源列表中选择轻松风格的学习资源来调节学习者情感,相反,当学习者从消极状态转入积极状态时,可以适当增加资源推荐。由于识别的准确度很大程度受数据的影响,推荐系统设计时需要考虑对数据采集的支持。

(二)对学习资源的情感评价影响学习资源推荐路径

在个性化学习资源推荐系统中,学习发生在学习者和学习资源的交互中,学习者和学习资源具有较大的规模,推荐算法利用学习者的认知、知识等个性化参数和学习资源特征,通过相似度等计算产生学习资源推荐列表。常见的推荐方法有基于内容、基于协同过滤、基于混合推荐、基于社交网络、基于情景感知等,资源推荐顺序主要依据评分。实际应用中学习资源多源异构、依赖人工评价的特点会制约资源特征表示的及时性,简单的评分很难响应真实的需求。文本情感识别对学习资源推荐路径有两方面作用:(1)增加情感指标影响推荐列表排序。通过观察学习者和学习资源互动过程的情感状态,提取学习者对学习资源的文本评价来判断学习者对资源的情感倾向,在原有的推荐上增加情感评价的考量,提高推荐精准度。比如将待推荐学习资源列表中学习者评论积极情感较多的资源排序靠前等;(2)通过情感识别和情感归因,了解学习资源本身存在的问题,加以增强或改进,提升学习资源的质量。

(三)从情感维度完善学习资源推荐建模方法

对学习者的研究是学习支持服务最重要的研究热点之一,从学习者画像、学习智能体到数字孪生的构建,对学习者多维度多模态数据挖掘的理论和技术不断发展。包括学习资源推荐在内的人机交互教学系统,已不仅满足传授知识、培养技能的功能性追求,更重要的是构建促进学习者身心健康发展的智能化个性化学习生态。文本情感识别在学习资源推荐中侵入性小、可靠性高,是构建多模态情感识别的重要通道,可以为学习者建模提供情感维度的个性化参数,提高个性化学习推荐的精准度。在后续的研究中,可以就融入文本情感识别的学习者推荐建模方向开展设计和实验。

参考文献:

[1] 祝智庭.教育数字化转型新认知[J].教育家,2023,360(4):13-15.

[2] 宗阳,郑勤华等.中国MOOCs学习者价值研究——基于RFM模型的在线学习行为分析[J].现代远距离教育,2016,164(2):21-28.

[3] 吴正洋,汤庸等.个性化学习推荐研究综述[J].计算机科学与探索,2022,16(1):21-40.

[4] 翟雪松,许家奇等.在线教育中的学习情感计算研究——基于多源数据融合视角[J].华东师范大学学报(教育科学版),2022,40(9):32-44.

[5] SCHERER K R.Psychological models of emotion [J].The Neuropsychology of Emotion,2000,137(3):137-162.

[6] ORTONY A,TURNER T J.Whats basic about basic emotions [J]. Psychological Review,1990,97(3):315.

[7] MEHRABIAN A.Pleasure-arousal-dominance:A general framework for describing and measuring individual differences in temperament [J]. Current Psychology,1996,14(4):261-292.

[8] Bahreini,K.,Nadolski,R.,et al.Towards multimodal emotion recognition in E-learning environments [J].Interactive LearnIng Environments,2016, 24(3):590-605.

[9] Cordero,J.,Aguilar,J.,et al.Intelligent approaches to identify student learning styles through emotions in a classroom [J].Revista Ibérica de Sistemas e Tecnologias de Informa o,2019,E17:703-716.

[10] Hudlicka E.To feel or not to feel:The role of affect in humancomputer interaction [J].International Journal of Human-Computer Studies,2003,59(1):1-32.

[11] Picard R.Affective computing:challenges [J].International Journal of Human-Computer Studies,2003,59(1):55-64.

[12] Sheng Z,Lin Z Y,et al.The model of E-learning based on affective computing [C].Chengdu:IEEE,2010.

[13] S DMello,Lehman B,et al.Confusion can be beneficial for learning [J]. Learning & Instruction,2014,29:153-170.

[14] Yadegaridehkordi E,Noor N,et al.Affective computing in education:A systematic review and future research [DB/OL].https://www. sciencedirect.com/science/article/pii/S0360131519302027,2019-09-09.

[15] 權学良,曾志刚等.基于生理信号的情感计算研究综述[J].自动化学报,2021,47(8):1769-1784.

[16] Woolf,B.P.,Arroyo,I,et al.Affective Tutors:Automatic Detection of and Response to Student Emotion [C].Berlin:Springer,2010.207-227.

[17] Feng T,Gao P,et al.Recognizing and regulating e-learners emotions based on interactive Chinese texts in e-learning systems [J]. Knowledge-Based Systems,2014,55:148-164.

[18] Fatahi,S.An experimental study on an adaptive e-learning environment based on learners personality and emotion [J].Educ Inf Technol,2019,(24):2225-2241.

[19] 田元,周晓蕾等.学习情感分析方法研究综述[J].中国教育信息化,2021,505(22):1-6.

[20]黄兆培,张峰源等.情感识别中的迁移学习问题综述[EB/OL].http:// kns.cnki.net/kcms/detail/11.2406.TN.20230227.0856.002.html,2023-04-02.

[21][39] PEKRUN R,GOETZ T,et al.Academic Emotions in Students Self-Regulated Learning and Achievement:A Program of Qualitative and Quantitative Research [J].Educational Psychologist,2002,37(2):91-105.

[22][26] 赵宏,傅兆阳等.基于特征融合的中文文本情感分析方法[J].兰州理工大学学报,2022,48(3):94-102.

[23][25] 李艳,张慕华.高校学生慕课和翻转课堂体验实证研究——基于231条在线学习日志分析[J].现代远程教育研究,2015,137(5):73-84+93.

[24] 邹菊梅,胡梦荻等.线上、线下及混合学习情感体验的特征分析与比较[J].现代教育技术,2022,32(4):50-60.

[27] 赵京胜,宋梦雪等.自然语言处理中的文本表示研究[J].软件学报,2022,33(1):102-128.

[28] 戴敏,朱珠等.面向中文文本的情感信息抽取语料库构建[J].中文信息学报,2015,29(4):67-73.

[29] 刘娟,谭均翘等.基于MOOC平台数学类课程情感词典的文本分析研究[J].科教导刊,2021,451(19):78-80.

[30] Salazar,C.,Montoya-Múnera,E.,et al.Sentiment analysis in learning resources [EB/OL].https://doi.org/10.1007/s40692-022-00237-9,2022-09-05.

[31] 穆肃,崔萌等.全景透视多模态学习分析的数据整合方法[J].现代远程教育研究,2021,33(1):26-37+48.

[32] 马志强,苏珊.学习分析视域下的学习者模型研究脉络与进展[J].现代远距离教育,2016,166(4):44-50.

[33] 李同同,谭多宁等.在线学习情感体验的维度、特征及其作用机制[J].成人教育,2022,42(10):63-70.

[34] 刘智,杨重阳等.SPOC论坛互动中学习者情绪特征及其与学习效果的关系研究[J].中国电化教育,2018,(4):102-110.

[35] 单迎杰,傅钢善等.基于反思文本的慕课学习情感体验特征分析[J].电化教育研究,2021,42(4):53-60+75.

[36] 朱孝平,邹菊梅等.实训活动体验的情态分析方法[J].职业技术教育,2014,35(13):31-35.

[37] 马宁,张燕玲等.面向在线异步交互文本的情感—认知自动化分析模型研究——以大规模教师在线培训为例[J].现代教育技术,2022,32(5):83-92.

[38] 张娜,乔德聪.基于深度学习的在线学习评论情感分析研究[J].河南城建学院学报,2020,29(4):63-71+92.

[40] Hurley J M,Carter C K,et al.Examining the predictive relationship between personality and emotion traits and students agent-directed emotions:towards emotionally-adaptive agent-based learning environments [J].User Modeling and User-Adapted Interaction,2016, 26(2-3):177-219.

作者简介:

许桂芳:高级实验师,在读博士,研究方向为远程教育、教育信息化。

穆肃:教授,博士生导师,研究方向为教育人工智能、远程教育。

The Role of Text Sentiment Recognition in Personalized Learning Resource Recommendation and Key Technologies

Xu Guifang1, Mu Su2

(1.School of Information Technology in Education, South China Normal University, Guangzhou 510631, Guangdong; 2.Institution of AI in education, South China Normal University, Guangzhou 510631, Guangdong)

Abstract: Learning resource pushing based on data intelligence analysis is one of the teaching services that precisely support personalized learning. With the development of artificial intelligence technology and learning analytics, resource pushing through the analysis of behavioral data, assessment data and log data has been more successfully applied, but it fails to realize resource pushing guided by learners personal emotional state. Therefore, this study addresses the lack of theory and practice of emotion value and emotion control in personalized learning resource recommendation, and aims to achieve multidimensional emotion recognition for personalized learning, uses BERT model and TextCNN to build a text emotion recognition model for personalized learning resource recommendation, and proposes the process of implementing the text emotion recognition model based on learners homework and forum content. The learning resource recommendation text sentiment recognition model and the implementation process can provide methodological support and technical route guidance for real applications.

Keywords: recommendation of learning resources; text emotion recognition; personalized learning

責任编辑:李雅瑄

猜你喜欢

个性化学习
职校学生语文个性化自主学习初探
指导学生“个性化学习”,改善学生学习行为
“留白“促进学生个性化学习例析
教学资源支持下的Sakai个性化学习研究
微视频在初中英语听力教学中的应用探索
基于SOA的在线学习资源集成模式的研究
适应性学习系统的参考模型对比研究
MOOC环境下中学生数学个性化学习模式研究
农村小学数学个性化学习指导策略探究
教育中个性化学习的探讨与运用