收听人工智能语音播报与阅读文本的短时记忆效果差异<br/>——以新华社客户端新闻为个案的实验法研究

收听人工智能语音播报与阅读文本的短时记忆效果差异
——以新华社客户端新闻为个案的实验法研究

2021-04-21姜泽玮

中国记者 2021年3期

□ 姜泽玮

内容提要人工智能语音播报的收听效果如何？其与阅读文本的效果是否存在显著差异？这些问题关乎人工智能语音技术在新闻生产中的应用与发展前景，本研究以新华社客户端新闻为例，运用实验法探究收听人工智能语音播报与阅读文本两种方式下用户短时记忆效果的差异。实验结果显示，在信息接收效果的短时记忆层面，收听人工智能语音新闻播报与阅读文本之间不存在显著差异。在智能媒体时代的新闻生产中，人工智能语音技术具有广阔的发展前景。

一、问题的提出

近年来，人工智能语音播报在新闻领域的应用范围与程度，正在不断扩大与加深，海量的网络新闻，难以全部通过职业播音员实现有声化，正是这样的现实需要，给智能语音新闻播报提供了应用窗口。先前相关定性研究，明确揭示了语音合成技术在汉语有声化传播中的应用优势与价值、问题与难点，并普遍认为，新闻播报领域是人工智能语音技术最主要的应用领域之一。为进一步探究人工智能语音播报的传播效果，已有研究有从语音角度出发，结合播音创作方法对人工智能新闻播报的效果进行了研究，揭示了现阶段人工智能新闻播报产品的质量及其问题。也有研究从用户角度考察用户对人工智能主播在情感与美感上的满足程度及不同类型用户的使用情况与评价，但尚无研究考察用户收听人工智能新闻播报在客观上的信息接受效果如何。根据传播学中对传播效果“认知、态度、行为”的三级分层，新闻中的“信息”是认知效果关注的焦点，比起受众在情感喜好与美感满足的层次而言，研究新闻信息的接收效果是最为基础的层次，也是首需解决的问题。对信息接收效果衡量最为基础性、也是最重要的指标是记忆效果，记忆效果的研究也被认为是“传播效果研究中认知层面的重要维度，是一个亟待深入探索与研究的课题。记忆效果可分为多个不同类型，在心理学上通常可分为瞬时记忆、短时记忆和长时记忆三种，瞬时记忆的时间通常只有0.25秒，短时记忆通常在1秒至1分钟之间。长时记忆建立在一次或多次瞬时与短时记忆之上，其存留的时间范围十分宽广，不是一种“活跃记忆”，相对而言是“被动记忆”。本研究是关于人工智能语音播报记忆效果的初步探索，将首先选择最具基础性、较易开展的短时记忆效果研究。目前，国内外仅有的一些关于信息记忆效果的研究，基本都是针对视觉传播的范畴，例如平面广告的记忆效果、新闻文本中文字与图片的记忆效果、印刷文字与网络文字的记忆效果等，尚无涉及听觉传播记忆效果的相关研究。从当今移动新闻客户端的传播实践看，阅读手机页面中的新闻文本，与收听对应的人工智能语音播报，是用户接受新闻信息时的两种主要选择方式，因而，本文所要研究的问题是：收听人工智能语音新闻播报与阅读新闻文本的短时记忆效果是否存在差异？

二、研究个案与研究方法

（一）研究个案

新华社是我国现阶段对人工智能语音技术应用程度最深的媒体之一，在客户端中，采用科大讯飞的语音合成技术，绝大部分新闻实现了文本有声化。新华社客户端中的人工智能合成语音与新闻文本呈对应形式，在内容上完全保持一致。在呈现方式上，人工智能语音播报的播放键位于新闻文本页面右上角，与新闻文本作为两种接收信息方式，同时呈现给用户。因而选择新华社客户端新闻的文本与其对应的人工智能语音播报具备对比性，最适合于本研究的目的。

（二）研究方法与研究过程

1.研究方法

本研究采用传播效果研究的实验法，探究收听人工智能语音新闻播报与阅读新闻文本的短时记忆效果，是否存在差异的问题。实验中所选取的新华社客户端中的新闻产品，均同时包含文字与人工智能语音两种形式，研究试图通过对照性的实验，来验证收听智能语音播报与阅读新闻文本对用户短时记忆效果的影响是否存在差异。先前研究对于信息记忆效果的实验，一般可分为行为实验和脑电实验两种，行为实验因其研究的经济成本较低，可操作性强，从而成为目前较多采用的一种技术路线，本研究所采用的实验方法也属于行为实验。一般认为，影响传播认知中记忆效果的变量主要有，“传播者特征”“内容特征”“传播渠道”以及“受众特征”四个方面，本研究所要测量的变量，属于“内容特征”中的“形式层（文字、图片、音频、视频等）”。为最大限度控制干扰变量，研究始终保持同一位研究者组织实验，实验的文本与对应的音频，均来自新华社客户端中相同的新闻内容，在对照组与实验组的分配上，保证了受教育水平、性别、年龄等人口统计学特征的对等，实验采用的语音性别均为男性。为保证受试对象的实验行为尽量符合自然状态的媒介使用，研究中只告知受试对象，根据自身习惯自然阅读及收听，不对阅读新闻文本与收听人工智能语音的时间变量作出强行控制。此外，环境因素也会对记忆效果产生影响，本研究采取了两次不同环境与控制程度的实验，试图通过两次实验的综合研究，得出更加全面与准确的结论。

2.实验过程

实验一：多元环境实验

研究过程由两种实验组成，实验一为多元环境实验，并未采取统一、固定的时间与场所，受试者之间所处的时空环境具有多元性。实验前由研究者逐一邀请受访者参与实验，共邀请到了30名受试对象，他（她）们分别在家庭、宿舍、办公室、公交车等不同环境中，进行了收听或阅读。受试对象的选择，采取方便原则与滚雪球抽样，均为全日制大学本科以上学历者，年龄范围应为18岁至40岁的中青年人，从而保证受试对象具备正常且相近的阅读能力与记忆能力。在最终参与研究的30名对象中，按学历层次划分，硕士研究生学历者6名，本科学历者24名；按性别划分，男性14名，女性16名；按年龄划分，18岁至26岁的青年人占24名，26岁至40岁的中年人占6名。研究将30名对象平均分为实验组与对照组各15人，划分时，尽可能平均两组成员的年龄、学历以及性别属性。最终选择的实验组与对照组的研究对象中，硕士研究生学历者各占3名，本科学历者各占12名；男性与女性分别为7名与8名；18岁至26岁的青年人各占12名，26岁至40岁的中年人各占3名。

在实验过程中，研究者首先与实验对象当面或通过远程通讯沟通，说明研究内容与要求，由实验对象自行完成指定文本（音频）的阅读（收听），之后立即作答研究者借助网络问卷平台发布的测评题目。其中，对照组的实验对象需首先阅读指定新闻文本，然后作答有关该新闻文本信息的10道测评题目。实验组的实验对象不能阅读文本，需首先收听新闻的智能语音播报，然后立即作答相同的10道有关新闻文本信息的测评题目。实验过程中，每位实验者收到研究者从三篇实验新闻材料中随机指派的一篇，每篇新闻在每个小组中均分发五次，以保证三种类型（社会、体育、政经）新闻在研究中占比相同。

实验二：同一环境实验

实验二为同一环境实验，选取了固定的实验场所集中开展实验，受试者均为西部某大学新闻传播类本科一年级学生，实验过程在固定教室内统一进行。研究者在两个同专业、同年级的班级中，根据参与意愿共招募了42人作为受试者（其中A班24人、B班18人），进而将每班的受试者按座位位置平分为对照组与实验组两组（尽量保证了男女性别的均衡）。其中，A班对照组中男性为2名，女性为10名；A班实验组中男性为3名，女性为9名；B班对照组中男性为2名，女性为7名；A班实验组中男性为1名，女性为8名。对照组首先需阅读指定的三篇新闻文本（与实验一材料相同），而后作答对应的测评题目；实验组则需收听同样三篇新闻文本的智能语音播报，而后作答对应的测评题目。两组测试中所用到的三篇新闻内容均完全一致，每名受试者在实验过程中总计完成了三份不同类型的新闻接收测试，最终在A班获取对照组与实验组测评数据各36份，B班各27份，共计各63份。在实验过程中，为保证受试者不重复获悉新闻内容，研究者首先将新闻文本与测评题目通过微信发送给对照组成员，待对照组成员阅读与答题完毕后，再播放同一新闻的智能语音播报，由实验组收听并作答。

表1：社会新闻测评卷

表2：体育新闻测评卷

3.实验材料

研究随机在新华社客户端中选择了社会、体育和政经三份新闻文本，选择时刻意避免了头条、热点以及重大事件新闻，从而尽可能降低受试者因已经阅读而产生的长时记忆的影响。三篇新闻的长度，在新华社客户端中均为适中，避免篇幅过短不易设置题目，与篇幅过长可能导致的视听疲劳与配合度低下的问题。分别为：《天津推出50条旅游精品线路》（社会）《第五轮“女超之星”陈巧珠：足球最吸引人的就是“激情”》（体育）《“中国公司治理50人论坛”在京成立》（政经）。研究者对三篇新闻分别拟定了对应的10道测评题目，用于测试实验者对新闻信息的短时记忆效果，实验题目均为单项选择题，不涉及观点、评价等主观问题。题目所考察的问题与选项均为时间、地点、人物、事件等新闻要素，不涉及形容词、副词等修饰性词语，题目所考察的信息点基本均匀贯穿全文，测评试卷中每道题目计10分，满分为100分（见表1、表2、表3）。

三、数据分析与研究发现

（一）数据分析过程

1.试验一数据结果：实验组与对照组间无显著差异

第一次实验结束后，研究者根据新闻内容对30份测评试卷分别计算了所得分数，共得到了实验组与对照组各15条数据。其中，实验组各样本得分间的差异性不大，仅有50分和60分两种情况，分别占比40%和60%。对照组各样本的得分呈现出明显的差异性，最低得分为30分，最高为80分，且其间每个分数段皆有样本存在。对照组中出现频率最高的得分是40分和50分，分别占比26.7%，其次依频率从高到低分别为60分（20%）、70分（13.3%）、30分（6.7%）和80分（6.7%）。

实验组与对照组得分的平均值分别为56分和52.67分，为比较两组得分平均数在统计学意义上的差异情况，本研究采用独立样本T检验的方式对数据进行分析，因本实验研究为小样本，在对两组数据的分布情况进行描述统计检验后，可知两组数据均为正态分布。平均值等同性t检验结果显示：t=-0.874，双尾显著性概率P=0.394＞0.05，按0.05的显著性水平，可以认为两组数据的平均数之间不存在显著差异。

2.实验二数据结果：实验组与对照组间无显著差异

第二次实验结束后，研究者根据新闻内容对126份测评试卷分别计算了所得分数，共得到了实验组与对照组各63条数据。其中，实验组与对照组样本内部的差异性均比较明显，两组最低得分均为30分，最高分均为90分。实验组中出现频率最高的得分为50分和60分（17.5%），其次为70分和40分（15.9%），对照组中出现频率最高的得分为70分（27%），其次为50分（20.6%）和60分（17.5%）。

实验组与对照组得分的平均值分别为60分和58.57分，为比较两组得分平均数在统计学意义上的差异情况，仍采用与实验一相同的独立样本t检验的方式对数据进行分析，在对两组数据的分布情况进行描述统计检验后，可知两组数据均为正态分布。根据两组数据的配对样本t检验显示，t=-0.469，双尾显著性概率P=0.640＞0.5，按0.5的显著性水平，可以认为两组数据的平均数之间没有显著差异。

（二）研究发现

两次实验研究数据的分析结果显示，实验组与对照组之间均不存在显著差异（P＞0.05），且当实验样本扩大时（实验二），两组得分的差异更不显著（P＞0.5）。由此可见，收听人工智能语音播报的实验对象，与阅读新闻文本的实验对象的短时记忆效果，不存在显著差异，甚至仅从实验样本的平均数看，收听人工智能语音新闻的得分（实验一56分，实验二60分），还略高于阅读新闻文本的得分（实验一52.67分，实验二58.57分）。由此可以看出，虽然人工智能播报被普遍认为缺乏情感、语气生硬、部分音节字音及声调有误、重音较少且不明显、断句停连多有错误，但收听人工智能语音新闻播报，并不会对信息接收效果造成负面影响。虽然通过本实验可以初步证明，收听人工智能语音新闻在信息获取的角度上，可以替代阅读文本，但从用户的角度出发考量，愿意主动收听AI新闻播报者仍不占多数。在实验过程中，研究者与受试者们进行了非结构化访谈，用以了解实验组受试者对收听AI新闻播报的直观评价，但几乎全部受试者都对收听过程表示出了“枯燥”“乏味”“不耐烦”的负面情绪。

表3 :政经新闻测评卷

四、结语

研究认为，在信息接收效果的短时记忆层面，相比阅读新闻文本而言，收听人工智能语音新闻播报，并不会影响受众对新闻信息的接收效果。后续研究还可以进一步关注人工智能语音播报对信息接收效果的长时记忆影响，或结合更广泛与多元的受试群体，以及多种不同主题、语速、篇幅的新闻材料，从而完善与细化这一研究结果。虽然从信息获取的层面看，收听人工智能语音，可以实现与阅读新闻文本相等的效果，但用户对于智能语音新闻播报的接收意愿与体验感，仍旧偏于负面。可以预见，随着我国语音合成技术的进步，大量高质量的智能语音新闻播报，将在智媒时代的新闻生产中具有广阔应用前景。

【注释】

[1]姜泽玮.听觉视域下网络短视频新闻制作反思[J].电视研究,2019（12）:41-42.

[2]翁佳.智能语音技术对播音主持专业与行业影响探究[J].电视研究,2017（12）:57-59.

[3]姜泽玮.A I播音与人工播音的语音差异性考察——以新华社APP智能语音新闻播报为个案[J].新闻世界,2020（09）:49-54.

[4]杨娜.媒体用人工智能主播发展研究[M].北京:中国文史出版社,2019:103-138.

[5]蒋忠波.受众的感知、识记和态度改变:数据新闻的传播效果研究——基于一项针对大学生的控制实验分析[J].新闻与传播研究,2018（09）:08.

[6][10]喻国明,韩婷.用户在传播认知中记忆效果的测量:研究框架与技术路线[J].出版发行研究,2019（02）:59.

[7]刘玥灵.不同诉求方式的手机网页广告效果研究[J].心理科学,2010(01) :178-180.

[8]张晗.消失的头条:新闻A PP的视觉影响因素与记忆效果[J].国际新闻界,2020（05）:121-137.

[9]Robert G Magee .Can a print publication be equally effective online? Testing the effect of medium type on marketing communications [J].Marketing Letters,2013,24(1),85-95.