基于Bert和Bi-GRU的心理人格投射测验检验方法与实现

2020-06-11陈阳

物联网技术 2020年5期

陈阳

摘要：为了弥补部分心里咨询从业人员对心理投射技术经验水平的不足，使心理投射测验更好地在心理咨询行业和人格特征分析中得到应用，文中提出一种基于Bert词嵌入、Bi-GRU和罗夏墨迹测验的人格特征检测方法。实验结果表明，多个模型在验证集上的平均准确率平均可以达到89.20%，具有较好的准确性。

关键词：心理投射测验;罗夏墨迹测验;深度学习;自然语言处理;Bert;心理咨询

中图分类号：TP279文献标识码：A文章编号：2095-1302（2020）05-0-03

0 引言

随着生活水平的提高和社会的发展，人们对人格特征的探索与应用需求逐渐增多。人格特征应用的好坏可以决定一个企业中员工的工作氛围、效率，甚至可以决定人身和财产的安全性。如果人格特征的检测手段在入职（学）和人员安排（分配）方面得到普及，如“空姐乘坐滴滴顺风车遇害案”“复旦大学生投毒案”等性质的悲剧将有可能大量被减少。

对一个人进行人格分析，主要有自陈量表和投射测验两种方法。投射测验法相对于自陈量表法有减少受测者的主动伪装和可以检查出受测者潜在心理问题的特点，但是相对于自陈量表法，其耗时更长、对施测者技术水平要求更高。

面对各行对人格特征分析的迫切需求，心理咨询行业的“三缺”问题（缺乏全国统一的从业人员考核认证管理制度、缺乏从业人员和机构评价等系列标准、缺乏机构监督、考核等系列规范）却限制了行业的发展，导致行业从业人员技术水平的参差不齐[1]。为了弥补部分从业人员对心理投射技术经验水平的不足，使心理投射测验更好地在心理咨询行业和人格特征分析中得到应用，本文提出了使用自然语言处理技术和有“心理投射测验之王”之称的罗夏墨迹测验对受测者人格特征进行评估的方法。

1 系统中的罗夏墨迹测验

1.1 罗夏墨迹测验简介

罗夏墨迹测验是瑞士精神病学家赫尔曼·罗夏发明的，用于分析人格特征的一种测验方法[2]。这种测验方法通过观察和记录受测者对十张带有不同墨迹图案的图卡的反应，来预测和推断受测者的人格特征。测验过程主要分为提问、回答内容、结果分析三部分。在提问部分：施测者依次向受测者出示10张不同的罗夏墨迹图卡，并询问受测者，图卡中的图案看起来像什么，然后根据受测者的回答进行一些非引导性的鼓励，让受测者说出更加具体的描述。在回答内容部分，施测者应该尽可能详细地记录受测者对每一张图卡的描述和态度，并根据反应的多少，给与适当的干预，避免记录冗长或过短。在结果分析部分，施测者需要对受测者对每一张图卡反应的记录内容按照一定规则进行编码，然后将编码进行统计，制成结构化表，展示受测者的各项心理特征。罗夏墨迹测验图片如图1所示，结构化表（样例）如图2所示[3]

1.2 系统中进行的罗夏墨迹测验

系统中的罗夏墨迹测验与简介中描述的流程相同，只是将测验中记录和结果分析的过程由计算机完成。测验的记录过程由语言转文本技术，将受测者的语音转化为文本，记录在文件中。结果分析过程中使用分词技术、单词向量化技术、深度学习技术，对文本进行编码，然后通过统计产生结构化表，供施测者和受测者参考。

2 研究方法

2.1 数据集来源

本文在西南民族大学的校园中对大学生随机抽取同学进行了罗夏墨迹测验，并收集了在多个出版物中罗夏墨迹测验的记录。整理成一个XLSX文件，并对编码进行标注。数据集样例如图3所示。

2.2 数据预处理

获取数据集后，本文首先通过Python结巴（Jieba）分词库将每个句子进行分词处理。然后通过bert-as-service使用chinese_L-12_H-768_A-12模型对每个单词进行Bert编码，使每个词的维度数变成了768维。然后将句子的矩阵进行Padding处理，因为数据集中95%的单词数量都在50个以内，所以，对于分词后超过50个词的句子，去掉末尾的向量，对于单句不足50词的句子进行了填充768的全零矩阵操作，使得到的每个句子的向量形态为50×768。结巴分词结果样例见表1所列。

2.3 Bi-GRU介绍

GRU（Gate Recurrent Unit）与LSTM（Long-Short Term Memory）类似，是循环神经网络（Recurrent Neural Network， RNN）的一种[4]，其是为解决长期记忆和反向传播中的梯度爆炸和梯度消失等问题而设计的[5]。GRU与LSTM在多数情况下表现十分相似，但是计算却更加容易。本文也使用了Bi-LSTM训练了数据，但Bi-GRU在准确率只以微弱的优势胜出，所以，综合效率与准确率，本文以Bi-GRU为例介绍。GRU的输入/输出结构如图4所示。

如图4所示，上一个GRU传输的ht-1和xt作为GRU单元的输入，GRU将根据ht-1和xt生成两个门控状态r和z。r为重置门控，z为更新门控，其中：

得到门控信号r，z后，首先使用重置门控将ht-1进行处理，（ht-1）'=ht-1⊙r，再将（ht-1）'与输入xt进行拼接，再通过一个余弦正切函数将数据放缩到-1～1的范围内，得到h'：

进而可以计算出ht和yt：

综上来看，前一时刻的状态信息带入的多少与更新门控z的大小成正比[6]。前一时刻状态信息被忽略的程度则由重置门控r的值决定，r的值越小，状态信息被忽略的越多[7]。

在单向的网络结构中，数据总是单向顺序地从前向后传递[8]。如果状态能够由前一时刻和后一时刻共同传递，那么这将更有助于对文本深层次的特征进行提取。Bi-GRU是由两个方向相反的GRU单元共同组成的，输出状態由两个GRU共同决定的双向网络结构。在每一时刻，输入会同时提供两个方向相反的GRU，而输出则由这两个单向GRU共同决定[8]。Bi-GRU的结构模型如图5所示。

2.4 识别模型

本文的识别模型将接收句子的向量矩阵（50×726）作为输入，首先输入到Bi-GRU中，然后将Bi-GRU的output作为Dense的input，最后由Dense输入结果One-Hot矩阵。识别模型如图6所示。

图6 识别模型图

2.5 结果

本文作者训练了多个分类模型，并记录了不同世代的测试集准确率，数据表明在训练20个Epoch世代时，准确率基本稳定，见表2所列。

3 结语

本文介绍了使用Bert和Bi-GRU模型对罗夏墨迹测验的编码进行分类识别的方法。经过验证，多个模型在验证集上的平均准确率可以达到89.20%，具有较好的准确性。罗夏墨迹测验在现有的人格分析领域有较好的应用，而且在职业规划、学业规划以及人员组织安排等方面有巨大的应用潜力。综合来看，本文所述方法可为罗夏墨迹测验在多个行业的应用提供支持。

參考文献

[1]谢斌.心理咨询行业在中国的困局与出路[J].心理学通讯，2018，（3）：175-176.

[2]马春玲.罗夏墨迹测验在中国发展状况研究[J].哈尔滨学院学报，2016，37（5）：133-135.

[4]张红阳.神经网络机器翻译中未登录词处理方法研究[D].哈尔滨：哈尔滨工业大学，2017.

[5]杨丽，吴雨茜，王俊丽，等.循环神经网络研究综述[J].计算机应

用，2018，38（z2）：1-6.

[6]孟乐乐.融合时空网络与注意力机制的人体行为识别研究[D].北京：北京交通大学，2018.

[7]桑海峰，陈紫珍.基于双向门控循环单元的3D人体运动预测[J].电子与信息学报，2019，41（9）：2256-2263.

[8]王伟，孙玉霞，齐庆杰，等.基于Bi-GRU-attention神经网络的文本情感分类模型[J].计算机应用研究，2019，36（12）：3558-3564.

[9]王郁.基于HO-DINA模型的学生心理多级评分认知诊断模型研究[J].现代电子技术，2018，41（2）：53-55.

[10]田西柱.基于从众心理的元胞自动机模型[J].物联网技术，2014，4（4）：83-87.