浅谈人工智能对电影行业的影响：应用与挑战

2023-09-07孙见昕

现代电影技术 2023年8期

孙见昕

中影动画产业有限公司，北京 101400

1 引言

电影是科技和艺术高度融合的产物。随着计算机技术不断革新，人工智能（AI）在电影行业的应用正逐渐深入到电影创作、后期制作、营销推广等各个领域。从节约时间和成本到提高工作效率和质量，再到深入分析受众群体和市场趋势，人工智能可以为电影制作提供全方位的支持和帮助。

2 人工智能在电影摄制中的应用

2.1 前期准备阶段

电影的前期准备阶段是奠定电影基础的重要环节，是确定电影创作基调以及影片风格的决定性环节。人工智能在此环节的主要作用是辅助创作和方案生成。

2.2 前期开发阶段

通过分析电影市场和观众偏好的数据进行计算，人工智能能够预测哪些电影类型可能更受欢迎、票房收入会更高，并指导他制片方选择更适合的电影概念和创意方向。美剧《纸牌屋》的成功并非偶然。2013 年奈飞（Netflix）利用AI 技术搜集并分析用户的收视选择、评论、浏览习惯后，发现喜欢关键词为“大卫·芬奇”和“凯文·史派西”的用户存在交集，于是决定买下《纸牌屋》的版权，并选定大卫·芬奇担任导演，凯文·史派西担当男主角。《纸牌屋》上架之后迅速成为奈飞有史以来观看量最高的剧集之一。该平台其他项目如《女子监狱》《怪奇物语》等，都采用了类似的测算流程。

2.3 剧本编写阶段

在剧本编写阶段，AI 可以辅助编剧生成创意和故事概念，并根据电影风格提供一些指导性建议，以帮助他们快速生成高质量的剧本。AI 在剧本创作中的应用主要有两种：自动剧本生成和剧本智能编辑。前者是通过大语言模型生成新剧本，以OpenAI 公司的ChatGPT、百度文心一言等多模态大语言模型为代表，而后者是通过自然语言处理（NLP）技术对已有剧本进行分析并进行多层级的智能编辑和修改（图1），以谷歌Dramatron 语言模型系统[1]为代表。Dramatron系统根据编剧提供的剧本摘要进行分层，分为剧本标题层、角色层、情节层、场景层等，之后生成整个剧本。编剧可以在分层生成的任何阶段利用提示词（Prompt）对生成结果进行调节，以实现编剧和AI 共同编写剧本。自动剧本生成是一种基于Transformer的多模态大模型技术，其核心在于多维度数据的深度学习算法。这种技术需要使用大量的数据作为输入，并对数据进行清洗以及编码，设定学习目标和模型结构、训练模型，通过提示词生成全新的剧本内容。剧本智能编辑技术则是一种自然语言模型技术，它可以生成剧本，也可以对已有的剧本进行智能编辑和修改。通过自动检测和修复剧本中的错误，优化剧本结构和情节，接收编剧的指令与编剧共同完成剧本。类似的剧本编辑系统还有ScriptBook 公司开发的DeepStory 剧本创作系统。

2.4 角色设计和演员选择阶段

通过分析演员的表演能力、人气、流量、粉丝活跃程度、市场价值等多个指标，AI 可以帮助电影公司更加准确地选择演员。通过采集演员的表演历史和作品，评估其表演能力和风格，从而找到最适合某个角色的演员。分析社交媒体和短视频平台上的演员热度和关注度以及粉丝的活跃程度，帮助电影公司更好地把握市场需求，选择更具市场潜力的演员。电影角色可以通过智能图像技术提前进行虚拟试镜，运用该技术还可对每个演员的表演进行分析和比较。根据虚拟试镜的结果，综合流量、人气等数据，选择最适合的演员（图2）。

图2 智能角色设计和演员选择流程图

Cinelytic 平台的TalentScoresTM能够基于电影人才（欧美市场）分析功能对演员的商业利润标准进行分析并给出排名，以便电影公司根据排名选择商业价值高的演员（图3）。国内猫眼平台和灯塔平台也陆续跟进这一功能。

图3 Cinelytic 平台TalentScoresTM电影人才分析排名页面[2]

图4 Stable Diffusion 通过提示词生成图片流程图

2.5 美术设计阶段

2014 年，人工智能生成式对抗网络（GAN）技术产生，原理是通过两个神经网络相互竞争来产生图像。运用这项技术生成的艺术作品《埃德蒙·贝拉米的肖像》在2018 年佳士得拍卖会上以43.25 万美元的价格售出。CompVis 和Runway 团队于2021 年12月提出潜在扩散模型（Latent Diffusion Model，LDM），运用该模型生成的绘画作品《太空歌剧院》,一举获得2022 年8 月美国科罗拉多州博览会美术比赛第一名,这一事件在业内外引起了广泛关注和热烈讨论，进一步推动了AI绘画的开发和应用热潮。

训练大模型需要大量的时间和金钱成本，对于电影剧组而言，以少量数据快速训练成为一种迫切的需求。LoRA（Low-Rank Adaptation）模型是一种轻量化微调（Parameter-Efficient Fine-Tuning,PEFT）模型，可以通过低秩矩阵（Low-Rank Matrix）的方式完成短时间训练成型，LoRA 模型参数不会破坏大模型的数据，通过参数注入的方式调整模型的生成风格从而生成图片。简单文本输入无法满足美术部门对构图和画面精准控制需求，PEFT 微调模型Control-Net[3]控制network block 的输入条件，使得生成图像更加可控，从而实现了线稿上色、风格迁移、局部重绘等诸多实用功能（图5）。这类微调模型的出现使得可控图像生成领域得到进一步发展。

图5 基于ControlNet 微调技术，通过输入线稿引导扩散模型生成不同风格的图像

2.6 中期拍摄阶段

电影拍摄是个复杂的过程，其中不乏重复且枯燥，但不得不做的环节。AI 技术已能从多方面辅助人员从这些事务中解脱出来，得以更专注于电影创作本身，进而提高电影的拍摄效率和质量。

(1)制定拍摄计划及拍摄方案：根据剧本和美术设计生成拍摄计划和拍摄方案，包括摄影机的摆放和移动位置、摄影师的拍摄角度和光线选择、场面调度、演员走位等。

(2)摄影技术优化：摄影优化目前广泛应用于智能手机、微单、短视频创作等领域。在电影长片摄影中这些技术多用于辅助拍摄，如智能对焦、智能色彩校正和图像稳定等方面的技术。现阶段AI在此领域无法完全替代人工操作。

(3)摄制现场监测：视频监测技术广泛应用于安防监控、流量监控、自动驾驶等领域。但目前在电影摄制领域，这项技术仍处于探索阶段。谷歌公司开发的MediaPipe Solutions 是基于预训练的TensorFlow Lite（TFLite）模型，能够实现摄像机感知、视频目标监测（图6）等功能。

图6 基于MediaPipe Solutions 的摄制现场目标监测

(4)面部识别和跟踪：使用MediaPipe Face Mesh结合OpenCV 进行人体面部实时计算生成面部的3D拓扑结构，其计算过程采用机器学习(ML)来推断这个3D 结构表面点的空间位置（XYZ），从而形成动态几何体动画，输出几何体动画数据得以驱动三维CG角色（图7）。该方案在整个数据计算过程可以利用轻模型架构和GPU 加速，做到实时输出有效数据。目前该项技术的精度和稳定性不足以生成直接可用的电影级别数据，不过其意义在于可以在现场实时驱动用于电影预演（Previz)、预拍摄等环节的虚拟数字人角色。

图7 通过MediaPipe Face Mesh 进行面部识别,并根据相应数据驱动三维CG 角色

(5)动作捕捉：传统的动作捕捉技术是通过身体佩戴传感器(惯性捕捉）或者身上粘贴反光点（光学捕捉）的方式，利用终端接收传感器信号或者光点信号进行匹配三维角色以完成动作捕捉工作。传统动作捕捉流程对场地和设备都有一定要求，而人体姿态估计技术可以只利用一个摄像头或者一段视频，通过一个轻量级的卷积神经网络（Convolutional Neural Networks，CNN）架构实现身体姿态实时追踪(图8）。尽管目前通过这种方式获得的动作捕捉精确度无法达到光学捕捉的程度，但在遮挡物体不多的情况下，其精度接近惯性动作捕捉。由于电影预演环节对动作的精准度和流畅度要求只需达到对后续现场拍摄有一定的动作参考作用即可，因此身体姿态实时追踪技术可应用于电影预演环节。

图8 基于MediaPipe BlazePose 动作捕捉数据生成不同风格的AIGC 角色

(6)素材归档分类：利用图像分割模型(Segment Anything Model，SAM)识别技术实现拍摄素材自动分类和归档，提高后期制作效率（图9）。

图9 通过SAM 模型对画面进行分割[4]

2.7 电影视效制作阶段

(1)视觉效果合成:通过自动识别、分类、匹配等算法来进行自动合成和处理，实现智能抠像、擦除威亚、更换背景、物体追踪、物体移除（图10）等工作，有效提升后期合成效率。

图10 后期调色软件DaVinci Resolve 物体移除效果[5]

(2)生成特效:目前通过人工智能生成内容（AIGC）获得的特效精度和动态尚未达到电影级别，但可用于电影预演的部分工作，包括示意特效位置、大小、动态等信息。例如，根据提示词或者提示画面直接生成天气变化、物理碎裂、爆炸（图11）等特效视频。

图11 通过Runway 的Gen-2模型生成一段连贯的爆炸视频[6]

(3)画面修复和上色:人工智能可辅助修复视频素材中的瑕疵问题，如面部修复、去坏点、去噪点等。基于生成式对抗网络（GAN）技术广泛应用于老电影的修复工作（图12），《红日》《开国大典》《决胜时刻》《永不消逝的电波》等多部经典老电影经过AI修复后得以重映。

图12 通过生成式对抗网络对电影《红日》黑白画面进行上色测试截图

(4)三维建模:通过提示词或者提示画面生成虚拟角色和场景，从而减少三维制作环节的工作量和时间成本。在一些历史题材的电影中，AI 能够通过分析历史资料和文献，自动生成符合历史风貌的三维场景。目前基于AIGC 生成的场景模型大多面临布线和精度的问题，还是需要人工重新进行拓扑并增加细节以满足电影标准。

(5)换脸技术：使用深度学习算法在视频中生成逼真的人脸交换。在影片《爱尔兰人》《流浪地球2》中用于改变演员面部以达到改变年龄的效果。

2.8 声音创作制作方面

1957 年，列哈伦·希勒用计算机写出的弦乐四重奏《伊利亚克组曲》；20 世纪80 年代大卫·库佩开发了能模仿巴赫音乐风格的作曲程序音乐智能实验（Experiments in Musical Intelligence，EMI）；到20 世纪90 年代，运用神经网络学习模式进行和声生成的Musact 系统被开发出来[7]。受限于当时高昂的研发成本，加上当时商业上没有成熟的运营模式，在之后很长一段时间内各国对AI 技术的投入逐渐收紧，导致AI技术没有取得重大突破。

互联网时代的到来使得数据规模急速膨胀，通用图形处理器（Graphics Processing Unit，GPU）、张量处理器（Tensor Processing Unit，TPU）等算力硬件设备的性能得到大大提升，为AIGC 的快速发展奠定了基础。2014 年，深度学习算法的提出以及互联网的海量可用数据，促使AIGC 快速发展时代的到来。音乐领域基于深度学习技术的AIGC 系统百花齐放，可以根据提示词和图片自动生成音乐和音效的AIVA、MusicLM、Jukebox，此外结合卷积神经网络（CNN）和长短期记忆网络（LSTM）技术的AutoFoley，可以实现从无声视频生成拟音音效和音乐。除了对音乐和音效的直接生成，目前还有智能降噪、人声提取、音色转换（“AI孙燕姿”所使用的So-VITS-SVC 技术）等，被广泛应用于声音的创作生产中。

2.9 电影视频剪辑方面

(1)视频标注：使用图像和文本分割技术来标注或分类视频。例如，通过视频识别出现的物体、场景和人物等元素，将视频分类为不同的主题和类型并为它们添加标签和描述，提高剪辑师对素材的搜索和浏览效率。

(2)智能剪辑：根据用户输入的提示词或者文案脚本，自动抓取视频素材并匹配相应的音乐，完成一段视频的剪辑制作。目前抖音推出的剪映、Adobe 推出的Firefly 均提供智能剪辑服务。2016 年，科幻片《摩根》（Morgan）成为全球第一部由AI 剪辑完成的电影预告片。智能剪辑目前广泛应用于短视频、宣传片等的创作，但现阶段智能剪辑在电影长片的应用还处于探索阶段。

3 人工智能在电影制片中的应用

现今电影拍摄逐渐成为新技术的高度融合体，电影工业化也是业内外的热点话题之一，拍摄现场利用运动控制系统（Motion Control System，MoCo）、无人机等设备进行拍摄，视效团队也使用先进的技术制作令人惊叹的视觉效果。人工智能生产管理[8]被广泛应用于工业生产中并发挥着越来越重要的作用，但由于尚处于探索和尝试阶段，其在电影制片管理的应用并不多。

(1)预算分配优化：通过分析数据[9]、预测模型，人工智能帮助制片公司更加准确地预测电影制作过程中的成本和时间，并根据各个部门的需求和工作量，优化预算分配，确保每个环节获得适当的资源。

(2)风险评估：通过对数据和相关因素分析，对可能出现的风险进行预测和评估，并提前制定相应的预算措施，降低制片风险。

(3)物料采购管理：电影制作需要大量的物料采购，人工智能可以帮助制片公司根据预算和需求，分析、优化并跟进物料采购计划，以确保如服装、道具、特效材料等物料的质量和数量。

(4)进度跟进管理：通过智能化进度管理系统，实现电影制作项目的计划、进度跟踪、资源调度等方面的全流程自动化管理，以期更好地控制和协调制作进度。

(5)人员管理：优化人员管理，包括招聘、考核、培训等方面，提高人员效率，控制项目成本。

(6)在线审片：智能在线审片系统实现了自动化管理电影的审片流程和评审结果，确保审片过程的公正性。

目前如ScriptBook、Cinelytic、Merlin 等基于AI 的影视服务公司均提供智能制片服务。此外，华纳兄弟（Warner Bros.）、20 世纪影业（20th Century Studios）、奈飞（Netflix）等影视公司也正在尝试使用AI辅助制片工作。

4 人工智能在电影发行放映中的应用

移动设备逐渐成为大众获取信息的主要渠道，观众观看电影的习惯随之发生改变，更多的人选择通过视频平台、流媒体等移动端观影。观看方式的改变致使电影制片公司和电影院不得不调整商业模式和宣发策略。在这个新的市场环境中，制片公司和发行商需要更好地了解受众喜好，并制定相应的宣发策略。影片《八角笼中》宣发团队利用AI模型分析并最终选择将短视频和社交媒体平台作为宣发的“主战场”，根据社交媒体和短视频平台的观众行为及数据进行有效分析，同时按照观众喜好制作宣发物料，并进行相应的精准投放[10]。根据物料投放的实际效果和有效数据，实时调整宣发策略，使得影片的宣传视频多次登上各平台的热门榜，围绕影片的相关话题也持续发酵，进而吸引大批观众进入影院观影，使得影片票房理想。

发行公司还可以通过人工智能所分析的数据，预测电影在不同地区的票房收入以及观众对电影的口碑反馈，从而助力制定匹配的市场策略，包括宣传时间、放映周期、排片场次等。例如，AI 分析显示某个地区的观众对恐怖电影的喜爱度很高，那么就可以将该地区的放映影片类型调整为恐怖类电影，从而提高影院相应时段的票房收入。

智能化影院票务和座位分配系统，是为确保观众能够获得最佳的观影体验，影院可以根据观众的偏好和历史购票记录，通过AI预测观众选座需求，从而制定最佳的座位分配方案。

5 面临的挑战和不确定性

人工智能为电影制作、发行、放映带来了巨大的机遇。通过自动化、高效能的流程应用和数据分析技术，更快地生产出高质量影片，更好地满足观众的需求，匹配投资者利益。但同时也会带来一定的风险和挑战。

（1）技术限制：虽然AI可以辅助电影制作中的许多流程，但这些大多应用于机械性、重复性的工作环节，而在关键创意环节，AI 仍无法完全替代人类。如导演、摄影师、演员、作曲家等创造性岗位，目前难以通过算法替代。

（2）成本限制：训练和优化大模型需要大量的计算资源，时间成本高昂。电影的制作周期及预算通常比较紧张，在有限的时间内完成模型的训练和优化，也会给制作团队带来额外的压力和成本。

（3）降低电影创作水平：智能技术的发展及广泛应用可能会导致电影作品逐渐缺乏独特性和艺术性，降低行业的创作水平和作品价值。AI 并不具备人类艺术家的思考能力和表现能力，目前的智能系统只能通过学习现有的数据和算法，从中提取规律和模式，进行推理和决策。过度依赖AI 可能会降低人类创作的参与度，进而影响行业创造力、想象力。智能分析和预测电影的时候，AI 往往只选择那些有可能获得高回报的电影进行制作，长久下去这可能会影响到电影制作的多样性和艺术性。

（4）决策可信度：目前主流的AI大多基于深度学习算法，这种算法具有不可解释性的特点（图13），深度学习神经网络分为三层：输入层、隐藏层、输出层。隐藏层中的每一个节点就是一个神经元，神经元在学习过程中自主选择对应参数的特征。这些参数的具体含义不是人为设计的，即使开发者了解智能神经网络的结构和训练数据，也无法解释为什么它会给出特定的结果或决策以致预测很可能不会被采纳。

图13 深度学习神经网络结构示意图

（5)管理边界：AI 的计算过程并非完全由人类控制，存在一定的自主决策能力。这些决策可能会产生不利影响，如何让人工智能承担决策的责任，以及如何划分AI 的管理边界是一个需要思考和解决的问题。

（6)数据隐私和信息安全风险：在电影行业中，AI涉及到的数据包括剧本、演职人员的个人信息、财务记录、拍摄地点和安全措施等敏感信息。如果这些信息被泄露或遭到黑客攻击，可能会给行业内参与单位、人员等带来巨大的损失。

（7)产生不公平和歧视：尽管当前的人工智能并不能理解歧视和偏见等概念，但基于数据收集的方式、数据样本的不平衡，以及数据标注者的主观观点等因素，在现实世界应用AI 仍可能产生不公平的结果，也可能会对某些群体造成不利影响。

（8)著作权归属问题：虽然各国正在积极制定人工智能相关法律法规，但目前AIGC 作品著作权的归属问题仍存在一定争议。

（9)对就业的影响：通过深度学习、机器学习等技术，AI 可以更快、更准确地完成简单、重复性工作，一些传统的劳动密集型工作可能会被自动化和机器人取代，进而对就业市场产生一定影响。美国编剧工会（WGA）自2023 年5 月开始罢工；2023 年7 月，美国演员工会（SAG-AFTRA）宣布罢工。AI 可能取代电影从业者的威胁成为本轮罢工的主要原因之一，这是自1960 年以来的好莱坞首次编剧和演员工会同时罢工。

6 结语

人工智能对电影行业的影响是一个复杂而多维的问题，需要从技术、商业、文化等多个角度进行思考和研究。2023 年7 月13 日，国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》[11]，该办法的出台是国家促进AI 产业在我国发展的清晰信号，可以预见未来AI 技术在中国影视行业将会取得长足的发展。当前，电影制作公司和从业者需要在技术发展和商业变革中保持冷静客观的思考和适应能力，在保持创意性、人性化的前提下充分利用AI 的优势辅助影片的创作和生产，电影本身仍然需要内容、艺术以及观众的共鸣，这些关键因素是无法完全由算法和数据取代的。