一段人机共创私人史

2024-01-20陈楸帆

清明 2024年1期

究竟谁击败了莫言，

人还是机器？

2019年春节前不久，原《收获》编辑、作家、科技创业者走走告诉我，他们用名叫“谷臻小简”的AI软件“读”了2018年20本文学杂志刊发的771部短篇小说，并以小说的优美度，即情节与情节之间节奏变化的规律性，以及结构的流畅程度对这些作品进行打分。

截至2019年1月20日，分数最高的始终是诺贝尔文学奖得主莫言老师的《等待摩西》。下午7点20分，情况发生了改变。AI最终选定的年度短篇是我发表在

《小说界》2018年第4期的《出神状态》，

《等待摩西》被挤到了第二位，差距仅有0.00001分。

更不可思议的是，我的《出神状态》里恰好运用了由AI软件生成的内容，这个算法是由创新工场CTO兼人工智能工程院副院长王咏刚编写的，训练数据包括我既往的上百万字作品。

“一个AI，何以从771部小说中，准确指认出另一个AI的身影？”这是我们共同的疑问。

第一次产生和AI合作的想法还得追溯到2017年下半年。其实机器写作并不是新鲜事，但是作为高度复杂的文学金字塔的顶端，小说所要求的逻辑性和自然语言理解能力，目前的AI必然未达到这样的水平。王咏刚听了我的想法之后也非常兴奋，很爽快地答应帮助我编写程序。

经过一系列的调试，输入了上百万字的陈楸帆作品之后，AI程序“陈楸帆2.0”出世了。它可以通过输入关键词和主语，自动生成几十到一百字的段落，润色修改之后我将一些段落嵌入了我的小说《出神状态》。

王咏刚告诉我，经过大批量语料学习之后，AI程序已逐渐习得了我的写作偏好。在掌握了关于语句的统计规律后，AI程序便会从大量的语料中随机找到一些词，并把这些词汇按照写作规律拼接在一起形成句子。比起文学，它更像是统计学与数学。当然，进入具体实施的技术细节将更为复杂。

王咏刚在为我的小说集《人生算法》所作的序中写道：

AI对语义的解读，还只停留在肤浅的统计建模层面，远谈不上理解了人类语言。Word2vec的实用价值在于，它是主题、风格、情感等更高級建模或分析的基础。我曾抽取楸帆作品中代表性较强的词汇，计算得到每个词对应的Word2vec向量数值，再通过数学变换将百多维空间中的向量转换成二维或三维人类可见的图像——这是标准的、科学意义上的“降维打击”。

第一次看到AI程序写出来的句子时，我觉得既像自己写的又不像自己写的，有先锋派的味道，像诗歌又像俳句或者佛偈。可以肯定的是，它们没有逻辑性，也无法对上下文的剧情和情绪产生指涉性的关联，为了把这些文字不经加工（存在一定程度上的人工筛选）地嵌入到人类写作中去，我必须做更多的事情。

所以，究竟是谁击败了莫言？是来自我的语料，是来自网络的开源算法，是王咏刚的微调参数技巧，还是AI评委的评判标准？或者，这是一场人与机器的集体合谋？

如王咏刚所说，这是人类最后一个独立写作的纪元，它不单单是人+机器，而是人与机器的复杂互动，其中对于“作者性”的探讨重要性超出了故事与文本本身，可以称之为先锋的行为艺术。当然这只是一个开始，未来我相信机器将更深入地卷入人类写作和叙事中，未来的文学版图也会变得更加复杂、暧昧而有趣。

狂飙突进的大语言模型

巧合的是，2017年也正是谷歌发布自注意力机制与Transformer算法，并开启了机器学习在自然语言处理领域狂飙突进的历史性时刻。之后，我们见证了OpenAI推出的GPT模型不断进化升级，挑战人类对于智能、意识以及创造力的理解边界。

2020年，创新工场组织了人工智能训练营，参与者包括数百名与人工智能相关的高校学生。他们组成团队进行各种AI项目的开发孵化，其中的一个名为“AI科幻世界”项目的负责人找到了我。他们都是科幻迷，目标是构建一个能写科幻小说的大模型。我觉得这非常有趣。

这个模型的参数量相当于GPT-2，我们用科幻文类去微调它，让它知道怎么去创作小说，包括让结构、情节、风格等方面跟科幻类型更匹配。我们还开发了一些风格滤镜，例如刘慈欣风格、韩松风格等。也做了《共生纪》的共创活动，邀请了十几位科幻作家，如吴霜、王元、飞氘、凌晨等，主流文学的小白老师也参与到活动中，跟AI一起创作，然后将创作出的作品放在知乎上，跟网友互动，让他们去猜哪些是AI写的，哪些是人写的。

后面，我又和它一起创作了一系列的短篇作品，包括《火星奥德赛》，我会标明哪部分是人创作的，哪部分是机器创作的，最后给它一个署名，说明是由哪个模型生成的，背后的团队是哪个，保留了对它背后知识产权的尊重。

与“陈楸帆2.0”不同的是，“AI科幻世界”的交互界面有了巨大的升级，不再是简单的提示词生成语句，而是允许有“人机自由创作”与“人机对话接龙”两种模式。由此可以看到，交互方式的设计对于人机共创的内容有着决定性的影响。

在“人机自由创作”模式下，作者可以灵活地选择输入任意长度的语句，并点击按键生成4种建立在先前文本理解基础上的生成语句，作者可以选择“嵌入”或者“重新生成”，直到获得满意的内容，并进行自由编辑。而在“人机对话接龙”模式下，人类作者可以用问答的形式与AI进行对话，并可对前一回合对话进行“撤销”，甚至全部“清空”。

AI的进步非常快，达到了小学中高年级学生的写作水平，很难判断出哪部分是人写的，哪部分是机器写的，有时候甚至会出来一些令人拍案叫绝的句子，比如以下选自《火星奥德赛》的例子（下划线部分为AI创作）：

她邀请他去火卫二，那是另一个被遗弃的小行星。他们相信他能帮助他们制造出分子缩微器，这样，地球上的分子就可以被拼装成任何他们想要的样子。他们说，这将是人类历史的一大进步。

“可我怎么才能去到火星呢？”

“运用你的想象力。”老太婆笑着露出了粉红而空洞的牙龈，“只要你相信自己就在火星上，你就能去那里。”

他们让他看了几乎所有的火星照片，其中不乏经过处理的，高清晰度的。花花突然领悟到，所谓的新闻媒体只不过是一种掩人耳目的障眼法。他看到了其中一张照片，正面是地球，而反面是火星。

花花被这个想法震惊了。火星是地球的反面，而地球是火星的正面。从地球到达火星，只需要从这一面穿透到另一面。

当笔者输入“可我怎么才能去到火星呢？”之后，AI给出了意料之外的答案，不是乘坐飞船火箭而是一个近乎哲学性的诗意表述：“火星是地球的反面，而地球是火星的正面。”合理的推论便是“从地球到达火星，只需要从这一面穿透到另一面”的跨维度旅行。但在得出这一结论之前，还需要依据人类推理的逻辑步骤进行铺垫，于是有了之前的对话与火星照片的线索。

因此不难看出，尽管“AI科幻世界”在自然语言的理解与生成水平上相较之前的模型有了巨大飞跃，但作为创意写作工具，依然存在着逻辑跳跃、人称混乱、细节冲突等硬伤，更不用说更为微妙细腻的语言风格与文学表达了。

时间快进到2022年11月30日，一个能够回答问题，写小说、论文甚至代码的对话式AI，在全球掀起现象级热潮。它获得100万用户只用了不到5天，而推特用了2年，脸书用了300天，照片墙用了75天。相比于之前的GPT-3模型，InstructGPT增加了“依据人类反馈进行强化学习”的概念，能够更好地理解文本更深层次的复杂含义，无论是连续流畅的对话，还是对于错误想法的纠正，甚至能够质疑不合理前提或者干脆拒绝恶意提问，足以让对话者产生“以假乱真”的幻觉。

现在我会经常使用AI工具，就像使用鼠标、键盘、操作系统和写作软件，当AI变成一个生产力工具之后，它已经不再是一个需要去强调它存在的默认状态。我们不能再像以前一样使用和想象AI，它倒逼我们去思考怎样提升人机协作的效率和创造力。

日常工作中我会用AI帮我回邮件，草拟发言稿，做一些基础翻译，搜集资料、围绕资料进行头脑风暴等等。在创意写作中，在一个对话序列里，你给它一个语境或开头去续写，能看到它前后的连贯性保持得非常好，还能给出一些你意想不到的转折，甚至有一些语言带有更复雜微妙的文学意味。AI也可以学习历史上某位大师的所有文本，之后便可以用大师的思维方式去跟你沟通。比如说我想跟阿瑟·克拉克聊一个创意，听听他对这个创意的一些想法，它就能模仿阿瑟·克拉克的那种思维方式，通过对话，给我一些建议和灵感。我新书的封面就是用AI来做的，再通过专业的设计师加个字体，进行一些微调。

有专门为类型文学写作服务的AI工具，它里面有很多的功能。比如，我要写某星球的某生物，它可以生成很多关于不同星球的不同生物的描述，包括世界观的设定，人物、技术、情节上的转折等等，它都可以很快生成内容，给你提供意见，你只要在里面挑选你想要的。它也能够在风格上提供帮助，比如输入一段你写的文字，它可以很快帮你把它变得或诙谐幽默，或严肃，或更接近某位特定作家的风格。

如果说2017年的“陈楸帆2.0”语言模型还是混沌不堪的“随机鹦鹉”，2020年的“AI科幻世界”连简单的人称都搞不清楚，人物关系里面谁是谁，彼此的联系是什么，写着写着它就搞混或者颠倒了。但到了2022年的GPT-3.5和ChatGPT，它的写作能力已经超乎想象。现在我花非常多的时间探索怎么跟ChatGPT合作，这肯定不是我们原来想象的简单粗暴的“复制粘贴”，它是一个非常复杂的人跟机器共生的、迭代式、模块化的创作过程。在这个过程中我会对自己的写作有非常多的反思，它让你理解到人类的边界和局限性，同时也更好地理解机器的边界与局限性在哪里。包括目前AI还没能做到，但今后可能做到的事情。

我将在今后的专栏里进行进一步深入分析。

AI时代的文学挑战

五年的时间，AI技术的进步确实远远超过我们的预期，这一点是最可怕的。它的进步不是我们习惯的线性增长，而是一个指数性的增长，而且这个增长才刚刚开始。AI提供给我们非常强大的工具，创意的工具、写作的工具、设计的工具，同时也让我们思考到底原创性的边界在哪里，人类的主观能动性在哪里，包括知识产权，包括怎么尊重被采集数据的作者，他们是否也拥有一定的权利。所有这些问题都在一团迷雾当中尚待被理清和讨论。

如果说AI写作在此之前只不过是游戏式的实验，那么摆在每一个文学创作者面前的当下大语言模型时代，却挑战着所有传统文学对于现实的定义与理解。

我们生活在充斥着数据和比特的今天，人类的大脑却与数万年前石器时代的大脑没有太大区别，依然是亿万年进化而来的基于物理先验知识的信息处理系统，我们大部分的思考都是由一套强大的受控于情绪与生物本能的系统一，与另一套不那么强大的可以运用有限理性进行数据收集、分析、决策的系统二共同完成的，它们所动用的大脑区域是不一样的，我们往往要花很大的力气才能让系统二凌驾于系统一之上，作出所谓的理性判断，即便是这样的判断，有时也远不如简单的机器准确。

举个最简单的例子，只要把所有人的面孔调转一百八十度，人脑立马就会产生脸盲，而对于机器来说，这只是变换坐标系的简单操作，更不用说处理一些高维数据模型了。因此，这个看似信息极大丰富乃至爆炸的时代，其实是对人类大脑极其不友好的时代，得到的信息越多，其中的噪声、错谬、变形、误差，我们并没有办法通过某种程序自我消化纠正，它们沉淀下来，成为所谓的认知盈余与信息过载，成为我们的焦虑本身，影响着每一个人对于未来的判断，对于行动的选择。

如果说这是技术时代对于人脑认知不确定性的放大，那另一个方面的不确定则更事关重大，那就是对这个世界解释的不确定性。在这件事情上，不仅仅普通人焦虑，科学家也焦虑。

谷歌的资深工程师在颁奖典礼上说过一句话，这句话一石激起千层浪。他说：“人工智能就是炼金术。”这句话的意思是，在当下的人工智能研究领域里，大家用着许多看起来非常有效的技巧，能够提升机器解决问题的能力，但是我们对于背后的原理，如何运作一无所知，一切都像是炼金术一样，或者更直接点——玄学，但是大家仍然在不计后果地狂飙突进中。

从这场AI界关于真理标准的大讨论中，我们也能深深体会到科学家们在这个时代的焦虑。技术发展得太快，以至于每一个人都无法完全理解。

而在当下这个技术时代，任何对于技术的言说都只能借助于图像、比喻乃至文字，而技术核心本身是无法言说的，是纯粹的数与理念的存在，人工智能、引力波、量子物理、石墨烯，这些技术即便经过科普，对于大众仍然存在认知门槛，仍然是雾里看花，甚至会带来更深的误解。曾经有一个导演告诉我，读到《三体》里“整个宇宙为我闪烁”，顿时脑补出好莱坞大片般的炫酷场景，后来经过专家指点，了解到宇宙微波背景辐射根本不是他想象的那么回事。

真实与虚拟、现实与科幻、历史与未来、技术与人性、奥威尔和赫胥黎，在我们所处的这个时代无缝衔接、水乳交融。这种“超真实”时代的现实想象力，让很多虚构文学作者深感无力，也给写作者设下了种种不友好的障碍。

比方说，大家以前想象AI也许能够替代一些蓝领或者体力劳动者的工作，但现在却发现它其实更容易替代的是一些白领的工作，比如说各类创意人才，包括文案、设计、插画、动画制作、配乐等。我觉得这是创意的民主化。以前我们可能需要去上非常专业的课程，经过很多年的培训，甚至要有从业的经验，才能成为一个专业创意人才。但现在不需要了，用一个AI工具，每个人都能很快地做出一个像模像样的作品来。

但从商业角度来讲，创意的民主化会让很多人类的创意劳动贬值。以前可能一个文案做到了70分就可以有饭吃，但现在做不到95分，都会面临着失业的风险。等于AI把所有创意劳动的价格全都打下来了。

所以这是一个巨大的冲击。这个冲击以后会变成什么样？我现在也不敢断言。比如好莱坞的工会有比较完善的工会制度，它今年组织起来的罢工能够逼迫资方去签订一些让步协议来延缓这个趋势。但用AI去替代人这个过程在未来一定会发生，只是快慢的问题。

我觉得对于个体的创作者来讲，会变得跟那个笑话里一样：你在森林里遇到了一头熊，要做的不是比熊跑得更快，你只要比另一个人跑得快，就能保证不被熊吃掉。

我们只能去理解AI，学习AI，然后努力让AI成为提升你创作效率跟质量的一个杠杆，让自己能成为不可替代的创作者，这样的人就是头部创作者了。

对于头部创作者来说，在这个时代，他的价值可能不是单纯由作品的质量来决定的，他更多的议价能力是在创作者个人的身份。他要把自己打造成一个品牌，一个带有一定传奇色彩的精神符号。这样的一种身份角色的转换，可能是很多创作者都没有准备好的。但这个趋势来得非常快，我感觉可能三年之内，就会改变整个创意行业。

人工智能生成内容最后肯定会成为数字媒介最核心的部分，或者说流量最大的部分。当它的成本降到足够低的时候，各大平台就会把生成人工智能工具作为一个默认设置，将它直接嵌入到各种创作平台上，帮助用户更好地去生成他们想要的内容。

这样的好处是所有人都能创作，坏处可能是绝大部分人创作出来的东西都千篇一律。审美风格效果都是我们能预见的趋于同质化。

因为要让内容变得不一样，创作者自己首先要有审美判断力。判断力是需要经过长时间学习和实践才有的。这个经验可能是很多基础用户不具备的。这就会导致在某一个时间段里，生成式人工智能辅助出来了特别单一模板化的风格。这种风格反过来会变成一种主流，它又会去侵蚀掉很多异质的市场，甚至它在所有的媒介上都变成了一种新潮流。

当这种时尚到达一定的极限时，可能就会有一些新的尝试要去突破潮流，这些乍一看怪异的东西也会不断涌现，不断迭代。整个过程中可能AI会起到一个非常主导的作用。

当你看到一个由代码组成的算法机器，以如此简单粗暴的训练方式，也能写出让你觉得“有一些东西”的文字时，就会开始回过头想，那么多作家、画家、诗人，他们的艺术创作过程到底有什么人类的独特性？我现在的答案是，可能并没有那么独特，也没有那么不可替代。

随着AI不断以这种指数级的速度自我进化、自我迭代，接下来，非常多人类本体的定义、人本主义的基础会被动摇，这是一个更深刻的东西，可能现在还没有被讨论得特别充分。我观察到人文学者，包括一些传统作家，他们面对新的事物还是比较保守，甚至很多会有一种拒斥心理。他会觉得这东西无非就是排列、组合、拼贴，从那么多东西里这儿抄一点、那儿抄一点，但我觉得这个东西可能没有他们想象得那么簡单。原来大家会质疑AI无法创造新的东西，但现在意识到，人类创造的东西，很多也是通过原有的知识经验打碎重组，放到新的场景里去运用。

我相信在3～5年之内，机器辅助写作会成为普遍现象，这里指的是人类利用算法来辅助自己进行普遍意义上的写作，包括应用写作及创意写作，而那些更容易被结构化的数据比如财经新闻、医疗报告、法律文书等则将早于此被AI全面接管，因为那是机器擅长的领域，更加准确、高效、实时。

AI能做到的将会更多，比如说能帮助创作者打破媒介的边界。

之前，写青少年科幻的杨鹏老师，一直在找我谈，能不能把他的小说通过AI快速地变成漫画或者绘本。其实AI完全能做到，它可以让创作者高效完成这件事情。文字变成静态图片的下一步就是怎样把它变成动态的影视作品。现在有这样的公司，它可以帮我们快速地风格化。把实拍的真人场景视频在几分钟内“渲染”成新海城或宫崎骏的动画风格，也能够把静态图片经过运算变成流畅连贯的动态视频。相当于你自己可以是编剧，可以是摄影，可以是导演，可以是特效，甚至连音乐、配音、字幕都可以用AI去生成。等于说原本可能需要数十人甚至上百人的专业团队才能做到的事情，现在一个人就可以用非常低的成本来实现所有效果，只要你愿意去学习钻研一些工具。

从未来讲，每个人都可能是电影导演，每个人都可以去拍一部自己的大片，制造一个游戏，排演一台完全由AI或者机器人出演的音乐剧。到时候，我们拥有的是一个全民创作的海量内容市场，自然也需要有相应的平台渠道、推荐机制去让人看到，去获得相应的商业化的收益分成，让它变成一个可持续的行业生态。

于此，我认为我们正在进入一个“人机共生”的创作时代。我自己作为创作者在使用AI的过程中，通过重新理解人类与机器两种不同智能形态的优劣势，体会到的迭代式的共生关系是：从学习机器的创作逻辑，然后反推去提升自己作為人的创作逻辑。这样才能跟机器共同成长进化。比如，对于我来说，现在写作中最花力气的地方反而是从前最不花力气的地方。这么说可能有点玄，它不在收集信息、理解科技、编排人物与拿捏故事原型，而在于不经过理性思考判断，从潜意识层面涌现的直觉、具身经验、情感与记忆，也就是人类意识中“非计算性”的部分。你无法控制它的到来，很多时候只能等待，只能祈祷。这或许是AI尚未通过语言模型学会的一课。

最新的ChatGPT及各种变体已经能够以超乎想象的流畅程度与人类进行对话和特定领域的写作，比如财经新闻、体育报道、法律文书、论文摘要……甚至模仿历史上不同的作家风格进行创作。尽管生成内容的质量还不够稳定，且时常会犯一些常识性的错误，但目前已有科学家尝试教会机器理解我们所身处的“世界模型”。可以说，我们已经生活在这样的科幻现实中。如果科技真的到了我们无法分辨人类与机器的地步，哪怕只是语言层面上，都足以颠覆绝大部分行业及社会生活的面貌，因为人类无法离开语言进行思考、表达与交流。而随着AI技术的发展，基础大模型将进入各行各业，能帮助人类寻找最佳工程问题的方案，不管是土建、化学、生物、电路、芯片、机械等各种工程难题都能通过新的解题工具更快更准确地找到最佳方案。许多人类的职业会被替代，企业会高度自动化。新一代儿童会更习惯与机器进行交流，相比之下，人类的交流笨拙而低效，充满了误解。

当有朝一日我们抵达那样一个超越科幻的世界，机器能够无穷尽地生产出供人类娱乐的个性化内容，不输历史上任何经典的文学、影像或游戏，我们是否将迎来真正意义上的“文学已死”？

或许，文学本身的定义与边界也将被不断深挖拓宽。如果将人类类比为一部机器，那么阅读、写作无疑是极其重要的输入、输出模式。通过阅读、写作我们可以理解个体的认知与学习过程，甚至是跨个体间的情感如何传递并引发共鸣，不同语境下概念与符号系统如何传承流变，这是文学、语言学与认知科学的交叉领域。科学家们在研究如何通过光遗传学和视觉刺激将信息“写入”生物大脑，同样对于机器来说，理解自然语言指令就是这样的一个输入过程，那么在一个集成化程度足够高的智能时代，比如30年之后，我们真的可以通过语言，通过书写，通过文学，改变现实或者虚拟世界的运行秩序，所谓呼风唤雨，喝山开道，画符为马，撒豆成兵。那时就真的到了如克拉克所说“一切足够先进的科技都与魔法无异”的时代了。

那么到了那样的时代，文学的位置何在，文学又应该怎样去“读”和“写”呢？

责任编辑袁媛