基于深度学习的大学生心理测试系统

2019-10-21杨学武王若岩夏震

科学与财富 2019年35期

杨学武王若岩夏震

摘要：大学生心理问题频发，但传统的心理检测存在费时费力、结果不精准等问题。本项目根据高校大学生心理健康问题，首次设计并研发了一种基于深度学习的智能心理测试系统。该系统利用深度学习技术进行人脸情感分析、自然语言处理，并根据SCL90，UPI等关于大学生心理测试的量表进行分析。用户通过网页或app平台，可以通过语音、文字多维人机交互的方式进行心理测试。系统综合得出准确的心理状况分析并根据分析结果给出相应的治疗方案。

关键词：心理测试系统;深度学习特征;人机交互;自杀

引言：

近年来随着计算机运算能力和神经网络理论的发展，深度学习越来越引起科学界和工业界的关注。深度学习是一种自动学习特征的算法，其中最为代表的是卷积神经网络（Convolutional Neural Network，CNN），它在人脸图像识别领域得到广泛的应用[3-5]，深度学习技术已经广泛应用于心理学领域，用于心理健康或者情感分析，但基于深度学习技术对于自杀分析的研究还较少，为此本研究应用深度学习技术以大学生心理健康为研究对象，对大学生心理健康水平测试建立有效的算法模型用以识别其心理状况进而为预防自杀提供有效支持。

1 数据采集

本研究的语言文本数据集采用的是来自 CIS 2016（计算智能与安全国际会议）的一篇paper [6]的一个数据集，表情数据集是来自kaggle的一次人脸表情比赛的Fer2013数据集，Fer2013人脸表情数据集由35886张人脸表情图片组成，其中，测试图（Training）28708张，公共验证图（PublicTest）和私有验证图（PrivateTest）各3589张，每张图片是由大小固定为48×48的灰度图像组成，共有7种表情，分别对应于数字标签0-6，具体表情对应的标签和中英文如下：0 anger 生气;1 disgust厌恶;2 fear 恐惧;3 happy 开心;4 sad 伤心;5 surprised 惊讶;6 normal中性。

2 研究方法

2.1 文本预处理

中文分词是中文文本处理的一个基础步骤，也是中文人机自然语言交互的基础模块，在进行中文自然语言处理时，通常需要先进行分词，jieba分词算法使用了基于前缀词典实现高效的词图扫描，生成句子中汉字所有可能生成词情况所构成的有向无环图（DAG），再采用了动态规划查找最大概率路径，找出基于词频的最大切分组合，对于未登录词，采用了基于汉字成词能力的HMM模型，使用了Viterbi算法。

使用jieba分词包对消息回复进行分词处理除去分词后文本中含有较少信息的词语，例如（“啊”“哎”“吧”），经过筛选，找出消息回复中带有情感色彩的话，比如，开心、哈哈、难受等字眼。

2.2 模型方法

这一部分我们将详细介绍该心理测试系统用到的模型方法，因为在测试过程中有根据图像识别和根据自然语言来识别，所以这部分我们分为两个方面来介绍。

2.2.1 图像识别模型

在图像识别模型中，我们采用深度卷积神经网络来将人脸表情特征提取与表情分类融合到一个 End-to-End 的网络中。采用了 VGG19 来完成表情的识别与分类。VGG19 的每一个小块是由一个卷积层，一个 BatchNorm 层，一个 ReLU 层和一个平均池化层来构成的。在全连接层之前加入了 Dropout 策略，增加了模型鲁棒性。并且，我们去掉了传统 VGG19 中的多个全连接层，直接在一个全连接层后分为 7 类情绪去识别。

在用户与系统进行人机交互的聊天过程中，我们的系统会通过摄像头实时捕捉用户的面部表情，然后进行实时的分析，每当用户的情绪有较大的波动时系统会将表情捕捉然后根据softmax激励函数进行处理后进行输出。在前面有对表情进行七种分类，经激励函数处理以后选择概率最高的情绪进行输出，这时就能得到用户的情绪数据（不包括平淡的表情）。当用户在测量过程中情绪波动很大时，系统将持续的检测出用户的情绪然后进行输出。

在得到用户的表情数据后，和用户在聊天界面的文字输入进行比对分析，就可以得到更加有说服力的数据。

2.2.2 自然语言处理模型

CNN 处理文本的时候，输入就是一个为矩阵的句子，就像原先图像像素的输入一样，不过是单通道的。矩阵的每一行对应一个单词的 Token（标记），通常是一个单词，但它可以是一个字符。也就是說，每行是表示单词的向量表示。通常，这些向量是词嵌入向量（低维表示），如 word2vec 或 GloVe，但它们也可以是将单词索引为词汇表的 one-hot 向量（独热编码、一位有效编码）。

在计算机视觉中，滤波器会滑过图像的局部色块，但在 NLP 中，我们通常使用在矩阵的整行上滑动的滤波器。因此，滤波器的 “宽度” 通常与输入矩阵的宽度相同。高度或区域大小可以变化，通常可以一次滑动超过 2-5 个单词。

2.3 模型验证

本研究将收集到的数据集随机分为两组，第一组70%用作训练，用于模型训练和建模，第二组30%，用于测试以及验证使用建立的模型进行预测的准确率。经大量经验得知，在keep—prob是70%的时候，可以得到较好的效果。

2.4 训练测试结果

1）测试集准确性数据：

18.， 18.， 12.， 6.， 6.， 36.， 68.， 67.， 71.， 85.， 73.， 88.， 80.， 78.，

80.， 71.， 76.， 76.， 85.， 76.， 76.， 88.， 90.， 79.， 84.， 84.， 86.， 86.

2）最高准确率：90.000%

最高准确率 Epoch：22

在训练了很长时间以后，训练准确率几乎稳定在了98%，然后我们拿这时的模型去进行测试，发现准确率平均能达到90%。这时我们可以说这个模型训练成功了。

3 实验结果与分析

该系统可以用打字聊天的方式让测试者与电脑聊天机器人互动，在用户许可的情况下还会打开摄像头对用户的表情进行采集从何得到更加准确的结果，在聊天过程中，我们的系统会对用户的聊天内容以及表情进行实时分析，在测试完成以后会打出相应的分数，如果用户表现积极则会得到高分并给出鼓励，用户表现消极则会得到低分而且会给出相应的建议。

4 结语

本文提出了基于深度学习来进行大学生心理健康水平的测量，针对人脸图像和语言进行心理测试问题，该模型可以学习和提取到比较健壮的情绪特征，实现了大学生有心理健康问题和没有心理健康问题的自动识别分类。

参考文献：

[1]吴连海，王萍，王磊，等。心理健康症状对大学生自杀倾向预测模型的构建[j] 中国健康心理学杂志，2010，18（1）：99-100 。

[2]蔣怀滨，张斌，李强，等。消极完美主义对自杀态度预测机制的内隐实验研究[j] 现代预防医学2015，42（6）：1038-1041.

[3]LAWRENCES，GILESCL，TSOI Ac，etc. Face recognition：a convolutional neural network approach[J]. IEEE transactions on neural networks， 1997， 8（1）：98-1 13

[4]KHALILHMSUNGLS A convolutional neural network approach for face verification[C]2014 International Conference on High Performance Computing and Simulation（HPCS）. Bologna， Italy， 2014：707714.

[5] Sentiment Classification with Convolutional Neural Networks： an Experimental Study on a Large-scale Chinese Conversation Corpus CIS 2016：计算智能与安全国际会议

【基金项目】本文系天津工业大学2019年度大学生实践创新训练项目，项目编号：201910058064