APP下载

艺术生产的智能化变革
——微软“小冰”作品《我知我新》批评

2021-12-21单小曦黄凌伶

美育学刊 2021年6期
关键词:小冰乐段人工智能

单小曦,黄凌伶

(杭州师范大学 人文学院,浙江 杭州 311121)

在人工智能(AI,Artificial Intelligence)技术的加持下,人类的文艺生产方式进入了新的发展时代,人们对艺术的理解也不断突破原有模式和框架。由微软(亚洲)互联网工程院设计开发的人工智能机器人微软小冰已经更新到了第八代,目前已发展成为以情感计算为核心的完整人工智能框架。“她”不仅是“诗人”,是“画家”“设计师”“主持人”,还是“歌手”和“音乐家”。2016年7月,微软小冰登陆bilibili创作平台,至今已发布视频50多个,累计播放量达到70万余次。小冰的百度搜索指数日平均值在1千以上,最高达到2万以上。从这些数据中可以看出,人们对小冰艺术“创作”的态度逐渐从质疑和好奇转为接受和欣赏。

美国计算机学者斯图尔特·罗素和皮特诺·维格曾在《人工智能:一种现代的方法》一书中将智能实现分为四个维度,一是“类人思考”,二是“类人行动”,三是“理性地思考”,四是“理性地行动”。[1]目前,在满足大众精神文化需求的新道路上,人工智能文艺的确在沿着这四个维度发展着。然而,AI是否需要像人一样思考和行动?小冰的艺术创作能否被称为“艺术”?本文立足于小冰歌曲《我知我新》,研究其技术框架,呈现人工智能音乐创作的技术逻辑,从人工智能文艺应具有的独立性出发,反驳人文主义者对人工智能文艺的偏见和批评,论述智能体从人类艺术的创作工具转变为艺术实践“类人主体”的可能性和必然性问题。

一、AI歌曲生成的“技艺”框架

根据微软第六代微软小冰发布会,小冰已完成Deep Neural Networks(深度神经网络)模型第四次迭代升级,克服了此前无法对时间序列上的变化进行建模的缺点。接受海量云端音乐大数据的训练后,小冰能够自行学习并计算情感表达的合适强度,轻松驾驭各种风格歌曲的演唱,几乎达到行业内虚拟歌手的最高素养。2017年,“知乎”构想“知识×计划”,与微软公司进行跨界合作。微软亚洲互联网工程院发布了与知乎知识青年联动的新单曲《我知我新》,由微软小冰作词作曲并演唱。作为此次升级的示范性作品,《我知我新》彰显出与以往发布歌曲截然不同和领先行业的技术元素。

首先表现在作词框架上。《我知我新》歌词包含四个乐段:

他们都顺应潮流/他们问为什么改变/青春灼灼花样翩翩/却不向前/当世界还在变迁/若时间无垠/若探索无边/认知就不再有极限

我在我主场/世界就任我去狂想/我知我新/未知的世界那么惊艳/哪怕有伤/满手泥泞还眼神发光/当我身处困境/也要像跑在丛林

急风骤雨的前路/人潮汹涌的江湖/我问我答我听我想/不惧怕来日方长

不跟随的一个我/是倔强的鲸和自在的鸟/不妥协的一个我/是沙漠的舟和独特的岛/很有趣的一个我/是山川的海和海底的草/很好奇的一个我/昼夜四季轮转/现在我知我新

就这四个乐段歌词的编写,小冰首先利用LSTM的seq2seq模型(1)LSTM(Long Short-Term Memory)是一种长短期记忆人工神经网络,属于循环神经网络,可处理时间序列的数据。Seq2seq(sequence to sequence)是一种自然语言处理的序列模型,解决了传统的固定大小输入问题。,学习千万行以上的歌词语料。由于seq2seq模型对自然语言处理水平较高,小冰作词的输入输出间距比过去大大缩短,能够在不超过半小时的时间内通览知乎站内所有的内容,比如“2018全新品牌视频”,知乎官方发布的信息,以及用户公开的实时问答和想法,等等。接着处理不同输入点和输出点之间的信息,分析出知乎用户“新知青年”的构成和特征,搭建歌词主体“我”的形象。如第一乐段“他们问为什么改变”,展现了知乎青年与一般人眼中庸常年轻人的不同。开头写“他们都顺应潮流……认知就不再有极限”,以“他们”为观察点,讲述庸常年轻人的从众和守旧,同时由“他们”引出“我”。“我在我主场/世界就任我去狂想……”写出青年人应有的立场和奋斗历程,每一句都使用了情感色彩鲜明的词汇,如“狂想”“惊艳”“哪怕”“发光”“跑”等,处处洋溢着热血青年不服输、敢冒险的意气。

完成了词境主人公形象塑造之后,小冰模拟人脑的神经结构,学习乐曲或歌词数据中的符号及与之对应的抽象意义,根据某种意义反推其具象符号,筛选能调动人们视觉、听觉、触觉等感觉器官享受的词句,以唤起人们无论是身体还是心灵的全方位共鸣。第三乐段中的“疾风骤雨”“人潮汹涌”,营造使人身临其境的鲜活立体画面。听众可以真切地感受到文本空间中的风雨、惊雷,焦躁烦闷的心情不自觉升起。此时,宣誓一般的四个“我”的连用,打破了恶劣环境的桎梏,以独立冲锋的意志和自我坚守的精神不断前进。审美主体也从焦虑转为奋勇。第四乐段是主旨乐段,其文学品味在四个乐段中为最高,主要表现为修辞的运用。小冰借助象征和排比,从“不跟随”“不妥协”“很有趣”“很好奇”四个角度分别阐释这种精神品质在现实世界里对应的具体意象。鲸鱼飞鸟、荒舟岛屿、山川海草等意象优美,表现了年轻人崇尚并追求新事物的特征。此外,每个乐段都设置了各不相同的韵脚,每乐段内部的换韵频率也不相同。第一乐段每句都押“ian”韵,第二和第三乐段都是每两句换一次韵脚,形成错落摇曳之美。第四乐段则除了高潮末句,跨“……的一个我”句式押“ao”韵。韵脚虽多,却不至于俗滥黏腻,使审美主体通过声韵感受青春韶华的跳跃和潇洒。

其次表现在作曲框架上。《我知我新》的乐曲同样是通过算法生成的。小冰运用的算法是对现有音乐的切片和重新排序的方法,其实这也是传统声乐创作的重要方法。这种分割和重新排序的过程与其说是一种生成过程,不如说是一种随机生成过程。它修改现有的音乐,而不是从头开始创作新的音乐。因此,算法本身是一个严格的基于规则的创作机制。

可以对这样的算法过程作一个简要的描述。第一步,小冰在程序中编写一个音符列表(相当于音乐段落)。每个音符包含三个属性:音量、音高和八度。然后,在正在组成的列表的开始处为每个音符的音量、音高和八度指定一组发生概率,并为列表的结尾指定另一组发生概率。同时,程序根据作曲者的输入判定编写多少个音符,以及音符每个属性从其起始状态到结束状态的加速度。对于编写的每一个音符,程序都会自动询问它在列表始末中所处的位置,并根据它的每个属性中已被指定的加速度,计算一组瞬时概率(在此时刻选择给定音符的概率)。一旦计算出瞬时概率,程序将根据这些概率随机选择一个音符,前进到列表中的下一个点,并不断重复该过程,直至列表的结尾。程序输出的是一个音量、音高和八度的有序列表,该列表展示了从开头到结尾的属性的指定进程。最后,该列表被转换为合成或记谱的格式,如MIDI格式。(2)参见Xenakis, I. Formalized Music: Thought and Mathematics in Composition. Bloomington: Indiana University Press,1972.pp.110-130。

算法的结果是,《我知我新》前两个乐段节奏和力度强劲,以电钢琴和鼓的击打声为背景。这是因为小冰基于对知乎论坛氛围的感知,对广大知识青年得出“摇滚”“朋克”的印象,故而以极具质感和青春色彩鲜明的金属乐声为主旋律。但架子鼓的强度有所弱化,与人类世界较为浮夸的摇滚乐相比,其节奏和力度更加平和。第三乐段以近乎RAP的形式过渡,旋律淡化,节奏转快,大有缥缈入云之感。不稳定的尾音滑向下一乐段的首音,承接自然,巧妙圆融。第三和第四乐段的衔接之处,曲调向高音方向大幅度上行,音频振幅阶梯式提高,节奏瞬间增强,各种金属音交织翻滚。在四次循环往复后,曲调戛然而止。数秒后,又响起了最开始的旋律,与歌词“不惧怕来日方长”形成呼应,象征青年的初心和志向永恒不变。

再次体现在歌唱声音框架上。在训练声音颗粒度并统一声区之余,小冰对声音进行了许多人性化的处理,例如自动预测合成换气声,为最终效果添加感染力。这种换气技巧属于适配第八代小冰框架的歌手软件X Studio的成果。该软件由Wave Land Team发布,是全球同类软件中第一个支持云端更新的软件,具备深度网络学习引入的自注意力机制和判别模型。音乐人将乐谱和歌词导入X Studio后,其中的虚拟歌手会根据乐谱和歌词信息,计算出一系列的声学特征,决定用什么样的力度和长度换气,从而调整前后的谱参数,保证自然的音高起伏。《我知我新》的每句歌词开头或结尾都有微弱的换气声,在第四乐段每两句的相接部分尤为明显。此外,小冰没有机械地划分层次设定换气位置。如第三乐段“我问我答我听我想”和“不惧怕来日方长”之间没有换气声,而其他地方大都一句一换气。这是因为这两句的节拍数增加,旋律更紧迫,缺少停顿空间。此处换气会中断两句节拍的衔接。这种换气技巧对于人类高水平歌手而言,也是难以达到的。X Studio软件还支持小冰进行转音、颤音等多风格装饰性演唱。作曲者可通过开放的音素参数调教、音高参数精调等功能,以锚点绘制的方法,对发音增加控制,生成转颤音,并调整转颤音的起伏,使音符与音符间的过渡更加连贯,大幅度提高平顺度。如果想要达到更深切的真实感,还可以运用画笔工具在音头和音尾改变音高线,以实现收紧嗓音的效果。转音可见于第二乐段每两句开头的第四个字“主”“新”“伤”“处”,以及第四乐段的“一”和每个形容词的首字(倔、自、沙、独、山、海)。小冰对这些音符作了节拍重音和转音处理,加强了起承转合的节奏感。颤音主要出现在每句句末,如第三乐段中“不惧怕来日方长”的末音“长”,第四乐段“现在我知我新”的末音“新”。它们由快速交替的升降音符构成,以主音符结尾。由于颤动幅度和频次较低,小冰的颤音容易被误解为振动时间的简单持续。这种唱法刻意切分了节奏,使韵律变幻莫测,情感张弛有度。

和声为《我知我新》增添了丰富的层次感。在和声技术方面,小冰能搜索相同或相似的曲目,分析这些曲目的所有和声变化,并在具体的MIDI中找出每一个和声序列发生的频率,然后通过概率决策组成和声的级数,以相同的比例生成该曲的和声序列,自动判断哪些位置需要构成多声部。换言之,小冰框架充分学习人类世界的乐曲库,提取和存储和声这一关键特征,按照要求输出有类似特征的新歌曲。《我知我新》仅出现了一处和声,即最后一句歌词“现在我知我新”。该句中,除了明显的高音层之外,还可以听到充当和声的两层低音声部。多层声部打破了横向运动的单一声部形式,扩张了歌曲的纵向空间,形成一种类似空谷回声的缥缈感。此外,“我知我新”的三层音并不重叠,而是呈时间上的梯度交错,仿佛海水涨到最高处,逐渐降落,退潮平息。

二、传统人文主义艺术观念对AI创作的质疑

毫无疑问,小冰的《我知我新》充分展示了AI技术在艺术创作方面的成就,但文艺理论与批评界常常将小冰这样的AI创作视为数字计算的结果,站在人文主义立场质疑AI艺术是否算是真正的艺术。换言之,在很多人看来,基于数字技术的AI艺术创作彻底打破了那些习以为常的艺术规则和惯例,打破了那些理所当然的美学意义和价值。在传统的美学和艺术理论视野中,AI创作有违艺术创作的“本质”。情感和具身感受、创造力和想象力以及主体性这些核心概念,在AI“艺术”制品中已不再有效。不仅在大多数保守学者那里存有这种观念,甚至很多前沿研究者也有着类似看法。比如超文本理论先驱乔治·兰道(George P.Landow)曾不无担忧地指出,可计算文艺缺少主体经验。[2]机械伦理学学者帕特里克·林(Patrick Lin)采用伦理视角去探究人工智能文艺,认为AI艺术将冷冰冰的技术理性无限放大,是对人类艺术的威胁。[3]

确实,按照传统人文主义的艺术理论范式,艺术生成的两大基本要素是情感和具身感受(具身性),而这些要素在目前的AI艺术创作中几乎是完全缺失的。AI艺术的否定派通常就是从这两个密切关联的方面提出质疑,得出AI艺术并非艺术的结论。音乐和其他绝大多数能被称为艺术的事物首先是情感的产物,最著名的表述莫过于华兹华斯的浪漫主义美学宣言“一切好诗都是诗人强烈情感的自然流露”。在当下这个基本上只能实现弱人工智能(ANI)的阶段,人工智能体的“智能”更多地还展现在特定逻辑、符号识别、实用工程、精准技巧等“智能”方面,而展现情感、情绪方面的“智能”则非常薄弱。

小冰团队原本对小冰的定位是“以情感计算为核心的完整人工智能框架”,但小冰在歌曲《我知我新》中对人类情感的表达既有局限又缺乏灵活度。歌词中“他们都顺应潮流/他们问为什么改变”二句突出了小冰反思庸常青年人的立场,她的确在此为人们标画出不随波逐流、追求改变、面向未来等宏观的愿景和目标,但“她”没有计算出人性在自由和妥协的天平上难以抉择的复杂心绪。就人类而言,自由追求和任意改变常常会滑向任性的泥潭,现实中的复杂性较大程度上超出了小冰的情感计算框架。而在旋律方面,基于数字运算和处理所造成的过于规整也在一定程度上导致了作品情感的单薄性和幼稚化。通过声道波形图可以看出,激昂进取、不畏艰险的情感层层递进,在高潮处彻底爆发,并在最强音处以波状结束(如图1所示)。全曲仿佛愈升愈高的阶梯,缺乏“一波三折”的复杂感和曲折度,可谓激情有余而戏剧性不足,难免流于简单和表面。根据《我知我新》的情况看,AI创作的歌曲可能在艺术表现上更类似于大多数游戏背景音乐而非电影配乐。因为AI音乐表现出缺少戏剧化的乐音曲线进路,没有展现出类似电影的戏剧化情绪曲线,更接近许多游戏背景音乐那种从低到高线性推进的一般设定。

图1 《我知我新》背景音左右双声道波形图

所以,若以人类情感为衡量指标,人类复杂的情感并没有被AI艺术很好地表现出来,多数情况下只是AI通过算法模仿出人类情感并外化成艺术文本而已。从人文主义的艺术理论范式来分析,这主要是因为AI由机械的、程式化的算法逻辑所决定。AI艺术所匮乏的不仅仅是情感,更有产生情感所必需的对于世界的具身感受以及与此息息相关的生命意识。AI不具有能够像人一般“感受”的具身性,它与世界的接触和联系,它对于世界的反映和对于自身的表达,都无法像人类一样,自然也就难以真正去“情动”。而根据分析哲学家约翰·塞尔(John Searle)的观点,“程序不是心灵,它们自身不足以构成心灵”[4],硅基机器无法产生碳基生命那样的意向性,AI也就不可能进一步具备生命意识。

在人文主义艺术理论看来,除去情感和具身感受,那种内在包含着想象、灵感等各种审美主体性要素的创造力,也尤为重要。即使小冰作词作曲的策略和技巧再精妙,其缺乏人类作者那样的创造力也是一个不争的事实。可以看到,在小冰创作的不同歌曲中,象征手法的使用频率相当高。例如《桃花梦》中频繁出现的“雾”“雨”“风”“烟”,皆暗示梦境与往事;2020世界人工智能大会云端峰会主题曲《智联家园》中“星河”意为未来的征程,“天梯”指代人工智能。而在《我知我新》第四乐段,更是将运用了象征手法的每句歌词组成一个排比片段,使青春意气具象化,解除了此前的“人潮汹涌……”这一片段产生的压抑感。然而,由于对意象所作的繁多甚至冗余的陈述,歌词拼凑雕琢的痕迹突出,整首歌曲的创新性反倒被削弱了。另外,第二乐段最后一句“当我身处困境/也要像跑在丛林”,实际上是有语病的。“身处困境”和“像跑在丛林”无法衔接,使听众不知所云。由前文对小冰作词框架的描述便可知,“困境”和“丛林”正是小冰依照词义相关度刻意拼凑的结果。换言之,以人类审美标准看,小冰的创作还很粗糙,也很幼稚。

究其根本,是因为小冰对音符和语词的创作依托于一种创建音乐作品的数字拷贝方法——采样。无论是单一的鼓声、复杂的旋律还是各式语词,小冰都可以利用采样捕捉音乐史上经典歌曲的每个组成部分,以便后续单独播放和操作,而具体操作包括改变样本的速度、音高或音长,进行循环、分层、添加、消除或增加背景噪音等。从声音到歌词的一系列样本的采集,可以使跨流派、跨时空的作品都被融入一部全新的作品中,近似于一幅拼贴画,但AI拼贴的质量无法与人类充满灵性的创作相比。这是因为从决定性环节来说,AI创作的质量取决于“输入”。所谓输入,即电脑算法传导过来的数据,包括对过去事实、事件的知识和曾作用于创作对象的诸多技艺,是有限且已知的。人类的艺术创作思维其实也是如此,艺术想象力总是来源于知识、记忆和经验,艺术创造在某种意义上总是对过去的再创造。但是,小冰的创造力、想象力虽然与人类有相似或者说模仿之处,却总是被批评不具有创新色彩。并且批评者断言,运算程序不能创造任何新事物,只能以不同的方式在总数据库中筛选组合,其结果有时会引起人类的惊叹,但更多时候则纯属低质量的重复创作。不得不承认,如有的学者所言,AI艺术创作尚不完善,独立性不强,缺乏真正的想象力,“比起人类感性的想象力而言更多是理性博弈的结果”,并且“没有个人好恶之分,它并不能划定想象范围、选择想象方向”,而“人类的想象力并不会具化成轨迹与策略,因为人的心理和精神世界博大精深,意识与潜意识处在随时转换的活跃状态中,有时候创作者的灵感往往只存在于一瞬间”。[5]

其实,关于小冰《我知我新》这样的AI艺术创作所引发的巨大非议,无论是情感和具身感受等方面,还是创造力与想象力等方面,都可以归结为艺术创作的人类主体性问题。而在考察AI艺术创作所带来的问题时,美学与艺术理论历史脉络中曾经关于“艺术终结”的讨论似乎会伴随着这种艺术创作的主体性匮乏再次凸显出来。就像有学者所强调的,艺术终结的四种模式:在黑格尔那里终结于本体,即终结于对理念的显现;在丹托那里终结于自我,即艺术叙事模式的更迭;在波德里亚那里终结于媒介,即艺术蜕变为无意义的能指符号;在卡斯比特等人那里终结于生活,即生活与艺术的同一。现在,在人工智能的作用下艺术终结不再是艺术内部的嬗变,而是针对整个人类艺术存在,人工智能艺术的出现提供了新的艺术终结模式——艺术终结于主体。[6]也就是说,在世界上的“存在者”中,艺术曾被视为专属于人类的领域,只有作为主体的人类才能从事这种高级精神活动,如今AI改变了一切。由此可以引出一系列值得探讨的问题:《我知我新》是否必须符合人类偏好才能成为艺术?AI技术所能实现的排列组合是否能称得上是艺术?AI艺术创作是否需要接受人类主导的审美模式的审判?这些问题并非一时能获得定论,但对这些问题的思考拓宽了人工智能艺术的问题域。

三、作为独立性存在的AI艺术

实际上,作为艺术创作智能体的小冰并非必须模仿人类创作主体,AI艺术也并不需要以人类艺术为衡量标尺,或许可以有不同于人类艺术的独立性,只不过这种独立性的获得可能无法完全杜绝争议,并伴随着AI艺术的演化而逐渐确立。

众所周知,文艺复兴时期以来,人文主义思想是艺术发展的圭臬。人文主义艺术观念中,艺术或者被作为主体的人对世界的模仿、再现,或者是人的心灵、情感的主观表现。18世纪到20世纪上半叶,西方主体性哲学突出人的理性精神,康德等德国古典哲学家将人之为人的根本确立为“自由意志”。美学上强调人的想象力和审美自由性。文艺理论上,先有浪漫主义者主张文艺是心灵、情感表现,再有克罗齐等表现主义者主张艺术即直觉,直觉即表现。弗洛伊德的潜意识学说则向主体深层意识挖掘,强调艺术是个体“力比多”的升华。这一历史时期和稍后的20世纪下半叶,还出现了文本论和读者接受论流派,尽管具体观点各异,但终极衡量尺度仍然没有离开人的主体审美能力。(3)文本论极端观点主张清除“作者”“读者”的所谓“意图谬见”和“感受谬见”,但多数论者的观点中最终还是没有离开作者和读者的主体审美创造力。

后结构主义、后现代文论对人文主义思潮中的人类中心主义和宏大叙事模式进行了解构和批判。后人类理论则提出立足后人类文化,建构“克苏鲁纪”学说[7]、“普遍生命力”哲学[8]等主张。后人类理论的出现,改写了人的定义,改变了传统的人性观,进一步瓦解了人文学科的人类中心主义。而人工智能作为后人类最显著的表征之一,激发的是关于人的境遇和命运的完全不同的思考。如果说信息模式被视作生存的常规状态,那么在此意义上身体存在与机器人存在没有本质区别,这也就从根本上增强了AI创作形成未来艺术之焦点和常态的可能性。目前,AI艺术研究也随着AI自身的发展和理论探索而悄然兴起。当一些人用“意识”“情感”等问题来剥夺AI艺术的合法性时,其实仍旧囿于人类中心主义。但正像当代艺术的一条重要路径最终走向了观念艺术,AI艺术也是完全可以拥有一种挑战传统的前卫身份的。就有学者提出,AI艺术是一种极具探索性的观念性艺术,挑战了人们目前对既有艺术形态与观念的理解:不需要类似于人类的“生活经验”表达;思想或概念成为可形式化进而可编程的代码;挑战了人类艺术家的“创造性”主体地位。[9]不管怎样,AI艺术已经提醒我们,在原本仅仅强调对情感进行表达、对世界进行体认的专属于人类的艺术领域,还有“另一条道路”的存在,让我们可以暂时性地跳出“主体”的限制。

当我们带着将AI艺术看作处于人类主体性之外的独立性存在的观点,回到《我知我新》这样的作品会看到,小冰的创作按照人类艺术的创作标准虽然是有很多局限和粗糙之处,但又初步展示出了AI艺术自身非常具有价值的特点,以及建构以AI为主的新型艺术体系的可能性。首先,AI艺术的新型主体是“智媒介”。这是因为它具备将世界上所有事物数据化和信息化的技术力量,颠覆传统人文主义的思想与审美,从而脱离限制性的人类视角,作为非人类成员的形态或身份,在人类主导的世界中获得位置,同时成为艺术表达的另一个中心。然而,这个建构过程并不像后人文主义者想象的那样简单。微软小冰是大众较为熟悉的AI,但它只处于弱人工智能的高度。根据前文对《我知我新》的技术分析,小冰的创作是分裂的,即小冰强行融合了“人类”与“后人类”这两种特征。《我知我新》创作程序有着广义“后人类”的智能特性,但创作内容完全合乎“人类”的审美标准。这说明小冰虽然可以自我学习和训练,但还不能进行真正的自我探索,只是按照人类的设计和指示进行艺术生产,因此《我知我新》这首歌曲显得十分人性化,甚至可以被看作人类通过小冰参与了创作。总的来说,小冰本质上是根据人类的目标、价值观和信仰被塑造出来的部分“拟人”的机器程序,而真正独立于人类的智能体仍有待实现。

其次,AI艺术创作的各项机能远超当代所有的人类创作。原因在于AI的“智媒介”特性,似乎一切事物属性都可转化为计算机信息被上传、下载和共享。以情感和智力为例,IBM托马斯沃森研究中心的AI音乐研究员艾比奥卢(Kemel Ebcioglu)认为,人类的复杂情感与智力不过是对客观事物的反应的综合,是现实世界中知识与经验的附属。[10]这种逻辑关系遵循了一种趋势,即认为人的情智是写在大脑中的信息模式。图灵提出了“模仿游戏”来测试数字计算机的人类相似度(4)参见Turing, A. “As we may think”. In P. A. Mayer(Ed.), Computer Media and Communication, a Reader. Oxford: Oxford University Press. Original edition 1950,Chap.1,pp.23-36。,得出智力和情感是可存在于神经系统和计算机中的信息。香农(Claude Shannon)认为,信息能够被分离出其存在基础,移动到另一种介质上并维持原状。用维纳(Noebert Wiener)的话说:“信息是信息,而不是物质或能量。”[11]库兹韦尔(Ray Kurzweil)和莫拉维克(Hans Moravec)进一步提出将大脑中的信息下载或者扫描到计算机中来搭建全新的智能体。(5)参见Kurzweil, R. The age of Spiritual Machines: When Computers Exceeded Human Intelligence. New York: Penguin,1999.和Moravec, H. Mind children: The future of robot and human intelligence. Cambridge: Harvard University Press,1988。海尔斯也指出,人类的本质存在可以作为可传输的信息被载入计算机中。[12]这些理论表明,智能体能通过信息中介吸收人类机能,甚至还有可能以技术力量将机能超能化。实际上,创作了《我知我新》的小冰已经展现了其未来成为更高阶智能体的潜能。以歌词编写为例,小冰将人类用语习惯整合为有一定规则的数据串,当“知乎青年”的字形浮现,便在“智脑”处理器中开启转换、编码、解码三步骤。准确获取对应信息,即字形的意义之后,以其自身解释数据的模式,在短时间内连接语义相似的基块,以漫射形式构成同义网络,做出丰富的音乐联想,写出“我在我主场/世界就任我去狂想/我知我新/未知的世界那么惊艳”这样两句个性鲜明、令人惊艳的青年口号,并为其谱上朝气蓬勃的动感旋律。可见小冰融合了人类的高级情智机能,并且在它的基础上进一步发展到超能层次。微软小冰首席架构师周力等人曾提出了一个原则:“人工智能创造的主体(如小冰),须是兼具IQ与EQ的综合体。”[13]与小冰保持合作的独立音乐人陈鸿宇设想:“将来的某一天,小冰能以其本身的模式去分析一首给定的歌曲拥有怎样的含义。”[14]如果有比小冰更高阶的AI出现,真正突破情和智这种人类机能的束缚,未来的艺术形式都将会有更巨大的变化。

最后,AI艺术创作的前期设计、中期的形式和内容以及后期传播都有可能跨越人类所处的感官世界,呈现难以估量的、有待探索的生长态势。从纯技术的角度来看,如牛津大学信息哲学与信息伦理学的教授卢西亚诺(Luciano Floridi)所述,现代社会是一个复杂的第二级技术社会。技术与技术联通连锁,人类则对技术进行发明和干预,于是构成一个人类—技术—技术的相互制约且相互强化的循环。未来,人类被排除在第三级技术,即技术—技术—技术的闭路循环之外,仅作为技术的享受者和消费者。(图2)[15]这表明,AI革命将不是一些未知新技术的纵向发展,而是把所有事物都联系起来的横向发展。

图2 第三级技术(third-order technology)

所以未来的艺术创作空间很可能是一个完全自动集成的信息域,AI会提升到超越人类感官和人类特性的另一个层面,很难预测其艺术创作的内容、主题、风格、语言等。曼诺维奇(Lev Manovich)指出:“只有在AGI取得足够进展之后,创造出在人类及宏大世界的美学上令人满意和语义明确的媒介艺术品才会成为可能。”[16]唯有AGI即强人工智能实现之际,AI艺术的全貌才能从模糊转为清晰。在那种最理想状态下,人类才能切实地感受到AI艺术所具有的惊人创造力,并获得难以想象的全新审美体验

从现阶段看,AI艺术仍然受限于弱人工智能(ANI),AI提供了“与人艺术”的可能,即作为一种工具协助人类、由人类参与的艺术创作。至于上文所述的强人工智能(AGI)阶段,AI有可能具有了类似于人的意识和情感,在很大程度可以进行“类人艺术”的创作。而到了超人工智能(ASI)阶段,AI或许可以完全突破人的感官、情感和意识,其“超人艺术”完全凌驾于人的创作之上。或许在未来,这些不同类型和阶段的AI可能会出现重合或共存的情况,若想真正去理解和阐释,归根到底是需要运用媒介论来进行统合的。关键就在于,“按照媒介论,人工智能体既非一般性工具(机器),亦非主体,而是处于工具(机器)和主体之间动态发展的‘智媒介’”[17]。

四、结语

必须正视的情况是,在人文主义的审美标准下,即使AI可以生成巴赫、莫扎特等大师之作的完美摹仿品,许多人仍然会持排斥的态度,认为它们不过是被切碎的音乐片段的重新排列。就小冰的《我知我新》而言,即使它表达的思想内容符合知乎青年的理想志向,人类中心主义者仍然批评这首歌曲缺乏人文精神,因为AI艺术对人类艺术的实质性僭越已经威胁到人类艺术的权威。[17]但事实上AI艺术和人类艺术不应存在这样的纠葛,人类不应对AI创作抱有如此大的偏见和忧虑。“人工智能给我们艺术创造带来的可能不仅仅是目前表现出来的对人的能力的‘攻城掠地’,相反,它很可能以另外一种方式提醒我们,人的创造更可能往哪个方向行进。”[18]真正值得探索的应是人类如何与智能体结合,如何通过发展AI艺术,甚至后人类艺术来打破现有艺术和人类自身的边界,并在这种探索中保持对世界的宽容和对自我的确信。由数据之美和算法可能性驱动的小冰为代表的AI创作,昭示出智能体正在创造一种新的艺术形态,同时也正在改变人类的存在状态。人类可能开始认识到自己在宇宙中的位置和角色已发生了非常深刻的变化,开始理解自己在媒介维度上的信息属性,“一种超人文主义、超人类主义的价值观可能得以建构”[17]。

猜你喜欢

小冰乐段人工智能
贝多芬降e大调第十八钢琴奏鸣曲(第三乐章)曲式分析
画眉
2019:人工智能
江南丝竹器乐合奏曲《三六》
人工智能与就业
视唱练耳与钢琴
第六代微软“小冰”正式发布
“微软小冰”发布首个MV 马来西亚女神朱主爱献唱
数读人工智能
下一幕,人工智能!