智能写作视角下机器生成文本评价标准的构想

2019-07-16李培菡

科技传播 2019年10期

李培菡

摘要智能写作技术的发展正使得机器生成文本的应用变得越来越普遍，但发展至今始终缺乏一个客观的评价标准。如果选择继续使用已有的文本评价标准，应如何合理地评价机器生成文本？或可将人工智能技术原理和已有的文本评价标准结合，提出一套新的更适用于机器生成文本的评价体系。

关键词智能写作；机器生成文本；客观评价；评价标准

中图分类号 G2 文献标识码 A 文章编号 1674-6708（2019）235-0136-02

自20世纪70年代维诺格拉德（Winogand）通过程序算法成功实现人机对话以来，自然语言处理（Nature Language Processing， NLP）技术已经获得了长足的进步，与之密切相关的智能写作领域也因此不断发展并越来越多的应用在实际社会生活中。如今，机器生成文本已经悄然渗透进人们生活的各个领域，体育新闻、金融资讯、大数据预测甚至是小说出版行业都能见到机器生成文本的身影。随着技术的继续进步、实际应用的继续推广，在可预见的将来，机器生成文本必将会引起全社会的广泛关注。

然而，不同于以往由人创作的文本内容，机器生成文本受制于技术的发展水平，机器人写作虽然已在体育新闻、金融速报等某些确定领域拥有了很多成功的实践，但在大多数需要依靠人类情感以及抽象思维能力的创作领域，如诗歌、小说、散文等，仍然与人类作者的写作水平有很大差距；另外，涉及人工智能以及机器人的伦理问题。

因此，如果只单一地使用人类目前已有文本评价标准来看待机器生成文本，既会限制智能写作技术的长远发展，也会引发社会在机器人伦理问题上的困惑。提出一个立足于智能写作领域，同时又为大众所理解认可的机器生成文本评价标准势在必行。

1 根据已有文本评价标准看待机器生成文本

已有的文本评价标准自文字诞生之日起，发展至今已经形成了十分成熟的评价体系，并且衍生出了大量的相关学科，因此本章节主要对已有的文本评价标准进行框架性描述并将之与机器生成文本的评价相结合，从而整理出一条评价机器生成文本的逻辑过程，并且只介绍为大多数学者所接受的主流文本评价标准。

1.1 对机器生成文本文体选择的评价

在已有的文本评价标准中，要展开对文本的评价首先要对它的“文体”进行区别。文体，指能够独立成篇文本的体制、体裁或样式，是在长久写作实践过程中演变出的某种文本规格和模式。

通常情况下，文体被分为文章体裁和文学体裁两大类，针对机器生成文本的评价首先要在区分了文本文体的基础上进行，以文章体裁为区分的文本和以文学体裁为区分的文本拥有不同的创作目的和评价标准，因此是否能够准确选择符合创作目的的文体是评价机器生成文本好坏的重要准则。

1.2 以文章体裁进行区分的文本评价

文章体裁分为记叙文、议论文、说明文三类，不同的文章类型，拥有的写作目的也就不同，相应的评价标准也不一样。

1）记叙文的评价。对记叙文的评价紧紧围绕着所谓记叙文六要素展开，即时间、地点、人物、事件的起因、经过及结果。针对这六要素发展出了多种寫作方法，如叙事线索、叙述顺序、人物描写、环境描写等，这些方法也成为判断一篇记叙文好坏的评价标准。

2）议论文的评价。与记叙文类似，对于议论文的评价也是围绕其构成要素展开的。对一篇议论文来说，最核心的是其论点，论点要做到鲜明简洁，整篇文章都围绕论点展开；论据确凿有力，论证过程具有说服性。论点、论据、论证的写作同样拥有许多具体的写作方法，如例证法、对比法等，在此不做赘述。

3）说明文的评价。评价一篇说明文的方法简单来说就是，找准说明对象，弄清说明对象的特征，然后用巧妙的方法将说明对象解释清楚。

1.3 以文学体裁进行区分的文本评价

针对机器人创作的文学文本，可以采用文学批评的方法进行评价。文学批评是一个将科学理性同情感感性相融合的学科，它围绕着文学作品展开，同时也将与之相关的文学活动和现象纳入评价分析的范围，常常带有批评家鲜明的个人烙印。

主流观点下，文学批评方法分为六种，对于机器生成的文学文本也应根据这六种批评方法评价。

1）社会历史批评：站在历史发展角度，分析文学和社会生活的关系；2）精神分析批评：主要分析作家、作品的无意识内容，特别是对性的欲望；3）语义批评：阐释文本的语言意义，主要针对诗歌体裁；4）叙事批评：对叙事文的叙述结构和叙述方式进行分析；5）性别批评：站在女性意识的角度开展分析；6）读者生产批评：对读者在文学批评过程中发挥的创造性作用进行分析。

2 从机器生成文学的角度设定新的评价标准

2.1 新标准设定的目的

随着智能写作技术的不断发展以及在商业领域越来越广泛的应用，由写作机器人创作生产的文本数量正在不断增加。可以预见，未来由机器生产创作的文本数量必将增长到一个可观的数据规模，并将引发全社会的广泛关注。但作为一件新兴事物，机器生成文本目前处在一个尴尬的境地。因为技术的限制，其生成的文本质量不足以支持将之置于人类已有的文本评价标准之下，另外写作机器人不同于人，这之中还涉及机器人伦理的问题。

但同时机器生成文本又缺乏一套被广泛接受且适用于自身特点和发展方向的评价标准，对文本的评价仅仅取决于开发人员和读者个人的主观体验。因此，有必要为机器生成文本设定一套适用于自身特点和未来发展的评价标准，为技术人员的研发提供思路方面的参考；为读者判断一份文本的好坏提供客观的评价体系；促进智能写作技术的发展。

2.2 新标准设定原则

1）专业性。这份标准应该具备较强的专业性，能够为技术人员评价机器生成文本提供参考和改进思路。2）易读性。考虑到智能写作未来的发展趋势，机器生成文本必将渗透进普通人生活的各个方面。因此，这份标准还应该对普通读者态度友好，能够让普通读者依据这份标准合理评价机器生成文本，并帮助他们更好的理解智能写作技术。3）机器生成文本生产的基本步骤可以被简单地拆分为：依靠硬件设备平台，通过算法处理，输出文本。考虑到评价标准应该兼顾专业性和易读性，因此，该标准评价的重点应放在输出的最终结果即输出文本上，不对硬件设备以及机器算法过多涉及。4）该评价标准只针对机器生成文本，不将读者阅读文本后产生的感想延伸纳入评价。

2.3 理论基础

1）自然语言处理：Natural Language Generation， NLG旨在让机器基于结构化的文本、数据、音频等生成人类可以理解的自然语言形式的文本。2）符号主义：实现认知的基本单元是符号，认知过程即符号运算过程；人工智能的研究方法为功能模拟法，即通过使用计算机模拟人类认知系统的机理和功能来实现人工智能，主张用逻辑方法来建立人工智能体系。3）联结主义：认为思维的基本单元是神经元，思维过程是神经元并行联结活动的过程；主张用基于神经元的人脑工作模式替换符号主义主张的，基于符号运算的电脑工作模式。4）人工神经网络：一个用大量的简单处理单元经广泛并行联结构成的人工网络。5）语法、语用和语义：语法指，在一种自然语言中用来指出词汇间正确搭配关系以及句子合理结构的一套规则；语义指一个句子所要表达的真实含义；语用指语言使用过程中的外界环境因素。

2.4 评价标准

1）生成文本能否清晰准确地表达创作目的。具体评价需要对生成文本进行文体选择上的分析、词汇分析、词法分析、句法分析、语义分析以及语用分析。2）针对不同的文体、语境，是否选择了合适的硬件设备及算法。对于应用在体育赛事报道、金融信息资讯、行业简报等相似语境下的机器生成文本，这类文本对内容的逻辑性有很高的要求，而對文章的意境、创新性、启发性等文学元素要求很低。这与符号主义所主张的通过逻辑方法来建立人工智能体系的追求相符合，因此为了节约成本、提高写作速度，这类文本应选择由合适的NLG（Nature Language Generation）算法生成，对硬件设备没有特殊要求。如果对生成文本有较高的文学要求，比如，需要写作机器人创作诗歌、小说或者散文，抽象思维、形象思维以及灵感思维能力则成为了写作机器人不可或缺的功能。参考人脑的生理结构，这些活动的实现与人脑神经细胞之间并行式的生理结构密切相关，在这样的要求下，单纯以串行结构编写而成的二进制算法是无法满足机器生成文本的创作要求的。因此，需要使用特殊的硬件设备来满足这种需要，具有自学习、自适应、自组织、模糊推理、联想等与人脑类似功能的人工神经网络搭配合适的NLG算法应该作为生成这一类文本的技术要求。

参考文献

[1]Stuart J.Russell， Peter Norvig.人工智能：一种现代的方法（第3版）[M].殷建平，译.清华大学出版社，2013：34，106.

[2]欧阳友权.文学理论[M].北京：北京大学出版社，2006：321.

[3]王万森.人工智能原理及其应用[M].北京：电子工业出版社，2000：17.