APP下载

AI技术能为出版业提供哪些支持

2023-10-10顾捷昕

出版人 2023年10期
关键词:考克斯布鲁克斯出版业

文| 顾捷昕

AI 将承担大部分烦琐的日常工作,充分释放人类的创造力,并倚重人类的判断力。

生成式人工智能到底将给出版业带来什么样的变化?这些变化不仅前所未见,而且令人震撼:行业内的工作流程、经营模式以及读者获得的最终产品可能都会发生实质性的变化。然而,这项技术仍处于萌芽阶段,通往未来的道路仍在建设之中。作为亲历出版业技术巨变的一线出版人,肯·布鲁克斯(Ken Brooks)在美国书业媒体Publishers Weekly杂志上发表文章称,对生成式人工智能的前景持有坚定的信心:它的应用范围广泛而多样,同时具备颠覆整个行业的巨大潜力。

肯·布鲁克斯是咨询公司Treadwell Media Group的创始人,也是Publishing Technology Partners 的创始合伙人。他曾担任Wiley 出版集团的首席内容官和Macmillan Learning 公司的首席运营官。他说,日常工作中,自己目睹了生成式人工智能多项用途的开发过程。它不是一个局限于纸上谈兵的理论工具,而是一种目前正在发挥作用的操作工具。生成式人工智能具有什么样的广阔前景?其运用过程中又存在哪些误区?肯·布鲁克斯借此提出问题并阐释他个人看法,希望帮助同人更深入地了解这项强大的技术及其彻底改变出版业的潜力。

肯·布鲁克斯表示:“生成式人工智能工具大大提高了我的工作效率,以前耗费大量时间和精力的任务,如今可以轻松搞定。一朝神器在手,营销文案不仅手到擒来,而且目标明确,读起来引人入胜;利用它争取到的宝贵时间,我能够手动定制信息并实现迭代传递——若是没有人工智能的帮助,这几乎是不可能完成的任务。此外,实践证明,人工智能非常擅长生成图书元数据,简化了一个烦琐但对图书发现和销售至关重要的过程。”

他还尝试运用人工智能应用完成如下任务:处理客户服务电子邮件,破译长篇累牍的讨论部分;对内容和供应商合同进行初步分析,提取合同中的权利授予和版税条款;整理提取的文本以创建电子书;找到竞争性图书,以及识别手稿中潜在的问题。他认为,运用过程中,大多数情况下,人工智能全面碾压真人操作:迅速、精确地完成多项任务,不仅节约时间,而且避免人为错误。

就上述用途而言,人工智能展示出巨大潜力,但是在运用过程中,还存在某些问题。事实证明,要想在出版业充分利用人工智能的力量,并不像即插即用那么简单。作为AI 技术的使用者,我们需要谨慎思考、努力钻研,并深刻理解人工智能技术、其运用方式以及出版业自身的特殊性质。实际操作中,用来执行任务的提示词通常需要大量的迭代,其结果也需要真人仔细地检查和编辑。

在运用人工智能提取合同条款的过程中,布鲁克斯感叹又一次深切感受到这项技术的强大力量。生成式人工智能具有高超的模式识别技巧,可以对密集的法律术语进行筛选,有效识别和提取关键术语,其精确度令人惊叹。在审查版税协议、期限和授予的权利类型时,每个元素通常都隐藏在一堆法律术语中,解读起来可能很耗时。生成式人工智能接受训练之后,可以用来识别这些特定条款,从而大大减少在合同审查上花费的时间。

产品编辑往往需要从PDF 等格式的文档中提取文本,甚至还得从打印页面的扫描件中提取文本——这也是编辑日常工作必须面对的常见困难。提取出的文本往往有百般疏漏:字符编码错误,换行符错位,成段文字缺失。按照业内标准流程,往往需要第三方服务商采取额外的步骤整理文本,确保适合进一步使用。布鲁克斯透露:“我使用了生成式人工智能来取代这整个过程。应用程序甚至可以突出显示已更正的元素,以便快速查看。”

AI 技术在出版业的运用不仅限于提高操作环节的效率,在数据分析方面,它同样具有强大效力。采用OpenAI 发布的Code Inspector(代码解释器),出版业内日常操作生成的市场和物流数据成为可以任意取用的宝贵资源。比如,在教育出版领域,对交货时间的分析至关重要——在销售旺季,更是必须关注其中细节。将物流数据输入AI 模型,用来分析趋势,找到影响交货时间的关键限制性因素。AI 模型熟练地处理大型数据库,迅速找到问题症结所在;这项工作如果靠人力来完成,则要耗费数天或是数周时间。运用过程中,我们必须有明确的考察目标,并且创建合适的可视化图表,确保AI 模型能够清晰地展示分析过程和结果,但是它只需数分钟就能完成海量基础数据运算。AI 工具会尝试不同途径,如果此路不通,会迅速转换方法,直至得出恰当结果。

高能高效,但并非万无一失

生成式人工智能技术在出版业到底会起到什么样的作用?如下各个实例中反映出问题的实质:AI 具有强大功效,但是绝非准确无误。AI 工具确实有卓越的技术性能,但是我们必须谨慎解读它输出的结果。

以发现竞争性图书为例。表面看来,使用生成式人工智能,我们不费吹灰之力就能得到结果;但实际上,为合理运用AI 工具,我们必须对出版行业及其数据有深刻的了解。肯·布鲁克斯说,与他共事多年的萨德·麦克罗伊在电子邮件往来过程中曾指出:“人们声称,AI是用来发现竞争性图书的强大工具;但是我认为,说这话的人并不理解这句话到底意味着什么。我们到底出于什么样的目的,才要去找寻竞争性图书?这涉及数据处理中的推荐引擎系统。我们想要找到与我们计划出版的书稿在风格/内容等方面最具相似性的图书。这是一项棘手的工作……我们也得以避开那一道几乎无解的难题:将仍受知识产权保护的图书纳入竞争性图书数据库。”

只要输入一个或两个词组,AI 就能够生成一系列可能的竞争性图书标题。布鲁克斯说,在他实际操作的案例中,当使用AI 查找竞争性图书时,它生成了一个每个书名听起来都很合情合理的竞争性图书书单,但实际上这些图书并不存在!实际上,AI 背后的开发商,推出ChatGPT 的OpenAI公司也承认AI 确实会“无中生有”。他们还就AI 输出结果发出警告:生成的书名体现出用户的搜索需求,但是列表中的图书未必真实存在,其结果没有权威性。

即使AI 具备分析数据的能力,能够生成权威的揭示问题实质的输出结果,用户依然得满足以下要求:有的放矢地提出问题,知道自己想要什么样的答案。这意味着在AI 应用过程中,真人参与始终都是重要环节。AI提供工具,作为用户,必须明确重点,并负责解读结果。

乍一看,这貌似是AI 系统的不足之处,其实它可能恰恰又是优点。这表明AI 确实只是赋能用户的工具,而非人类活动的替代者。AI 有助于提高我们的工作效率,为我们提供更多信息,让我们具备处理更多任务的能力——无论从规模还是速度角度看,若是没有AI,我们不可能具备如此惊人的能力。但是,AI 并未降低行业知识和人类判断力本身的价值;实际上,为了实现AI 的全部潜力,这些要素反而显得更加重要。

布鲁克斯认为,真正具有扩展性的企业应用程序必须具有可预测性、一致性和精确性——你肯定不想公司的财务系统编造公司运营数据。生成式AI 尚不具备这样的精确性,开发商一直努力做出改进,试图消除AI生成结果的不确定性,确保AI 提供的答案无论从格式还是内容上,都具有一定的精确性。他们的目标是,AI将承担大部分烦琐的日常工作,充分释放人类的创造力,并倚重人类的判断力。

OpenAI 公司持续推出新的功能产品,为实现上述目标提供辅助。比如,它的开发人员最近发布一项新的产品功能,使得智能自动语音呼叫更加系统化,并具有可预测性。但是,AI 技术仍有很长的路要走。

出版人对AI技术的态度

在法兰克福书展公司于9 月5 日举办的法兰克福版权会议上,美国企鹅兰登出版集团前首席执行官玛德琳·麦金托什就提出,AI 是有效工具,但出版人仍然应该关注自身,而非纠结于软件。

首先,她提到在企鹅兰登出版的一本书《明天,明 天, 明 天》(Tomorrow,and Tomorrow,and Tomorrow)中,作者加布瑞艾拉·泽文(Gabrielle Zevin)写出了十分吸引人的开头。麦金托什以这段金句中的一个词语作为提示词,输入AI 虚构写作工具“Sudowrite”中,但是得到的文本让她有不忍卒读的感觉,与泽文的精妙原句相比,完全是天差地别:“我根本不愿意在此转录生成结果,因为它如此枯燥,让我只想跳过开头。总之,生成的内容读来令人昏昏欲睡。”

“所以,我再次重申许多创作者对AI 技术的评价,”麦金托什说,“若是用它从事创造性写作,其结果流于平庸”。由此看来,把AI 技术妖魔化为“图书创作机器”,并且由此产生恐惧心理,未免言过其实。

麦金托什指出,由于缺乏沟通,作者不知道出版商有什么看法,出版商则担心作者会因立场不同,对AI 抱有不同的态度;而许多业内人士在谈起AI 技术对出版业的影响时,态度又过于轻率,仿佛这个问题根本不值得严肃讨论。“出版人不必相互防范,以秘密小圈子的方式,私下讨论AI 在出版业内的运用情况,我真心希望,全行业应该聚在一起,分享观点,分担焦虑,并探讨可能的AI 运用领域。”

谈起对AI 的相关疑问,以及它对内容的调用,麦金托什说:“如果说,与AI 相关的风险正在蚕食我们的部分业务领域,最好的应对方式就是,尝试利用技术实现行业的整体增长。不要认为,AI 会替代小说家,其实,AI 只是复制人类作者作品的机器人。”

她认为,AI 真正的才能,在于其发现能力。“任何从事大众图书出版的业内人员都清楚。”麦金托什说,“内容生成根本不是我们的最大难题。早在很久以前,这就不再是出版商心中的头号问题。实际上,我们的第一要务是,在浩如烟海的海量内容中,如何发现某一本书,或是一系列书,无论它以图书、流媒体电影,或是其他形式出现。”

“我不知道到底哪一家开发商会解决这一问题,但是我认为,我们应该有信心:总会有创业者解决这一难题,我们将采用这样的AI 利器,加速出版流程,提高出版效率,因为我们能够找到最有可能和我们出版的最新流行小说产生共鸣的消费者。有了AI 工具,发现之路将更加畅通。”

托马斯·考克斯(Thomas Cox)是位于牛津附近的Arq Works 公司的总经理兼董事,一直对AI 系统在出版业内的运用有独到的见解。

在法兰克福版权会议上,考克斯介绍了出版业内重要的AI 应用程序开发项目,以及ChatGPT-4 之外正处于开发过程中的(二级)开源项目。这些开源项目获得了微软,以及谷歌各类产品的支持。考克斯还详细介绍了Llama 2(由Meta 公司于7 月中旬推出)的开发情况:“它是开源大模型,所以用户不仅可以访问,还能自主运行和加以调整,由于整个开源社区都参与开发,所以模型会高速发展。”

考克斯又谈到Anthropic,这是一家“由前OpenAI员工创建的”AI 系统开发公司。Anthropic 的用户能够输入整本书,然后向AI 提出相关问题,比如这本书的主要情节是什么,有哪些人物,而AI 那里拥有所有信息,能够做出分析。考克斯又谈到自己的公司:“我们开始发现,大批基于AI 技术的应用程序面市。许多程序供应商都声称,他们的AI 是自主开发的,但实际上,他们使用的依然是ChatGPT,或是谷歌等其他主要的AI 系统供应商提供的AI 系统。”

多年来,考克斯与法兰克福版权在线交易项目合作,在版权交易方面积累了丰富的经验。他说,“版权业务是私人业务:人情味、人际关系,以及沟通谈判依然是业务核心。书展是开展版权业务的关键时间节点,目前情况并未改变。所以我认为,版权交易程序的核心也依然如故”。

“但是,这并不意味着这种局面以后也不会改变。如今业内已经出现了AI 辅助创作——有些人会坦率承认自己在写作过程中使用AI 作为辅助工具,有些人不会,但事实是AI 创作辅助工具正在发挥作用。”

“业内还有由AI 配音的有声书,如今这类书籍也越来越常见。谷歌和苹果年初都推出了AI 配音服务,还有很多地方也能生成有声书。AI 辅助翻译已经屡见不鲜,而且其效果越来越好。围绕上述所有服务,都存在与版权和合同相关的担忧,这些还会影响流媒体版权。毕竟,我们将使用的AI 工具会发生日新月异的变化,出版业的变革也同样迅速。”

如今看来,由AI 生成的文学内容依然是个遥不可及的概念,但考克斯认为:“这并不意味着就在数十年间不会出现针对某一特定时期,抑或是特定体裁而开发的新模型,这些模型会有自己的人格,就是所谓虚拟作者。”

他说,到那时,人们会逐渐接受由AI 生成的长篇内容。

AI应用程序前景可期

目前,技术开发商们正在紧锣密鼓地开发多个出版业专用的生成式AI 应用程序,其前景值得期待。比如,PanOpen Education 将AI 技术合成至课件平台之中。AI 起到辅导老师的作用,提供各类辅助,帮助学生改正错误理解,节约出的课堂时间则用来开展深层次的讨论。PanOpen 总裁布莱恩·雅各布说:“长久以来,打破教育的工厂量产模式,实现以个人为中心的学习一直是我们的梦想,如今有生成式AI 来相助,梦想正在变为现实。从这一点看,我们认为,AI 工具为教育者与学习者赋能,与之前的应用程序相比,其神奇效果远超人们的想象。这类工具绝非教育者创造力的替代品,而是以新的形式,强力激发这种创造力。”

同样,Gutenberg Technology 公司也运用AI 技术增加其创作工具产出内容的可访问性。公司利用AI 解决如下问题:可访问性补救措施(适用于所有出版商的服务方案),合规性,试题生成(教育出版商专用程序)。公司总裁Gjergj Demiraj 说:“我们引进AI 技术,旨在提高精确度和一致性,给作者和出版商带来真正的福音。有了AI 的帮助,我们能够确保出版商提供的内容符合标准,能够被所有用户访问,而且不会限制创作者的创造性观点。”

上述实例表明,生成式AI 具备技术优势,而人类的创造力和判断力无可取代,开发商努力实现强强联合,打造出更高效、精确的创新性平台,而且他们进步神速。他们还可能针对出版行业推出其他AI 应用程序,比如图书内容开发、销售、营销以及运营和会计部门专用程序。

出版业已经踏上革新旅程,作为亲历者,必须与时俱进,掌握前沿知识。生成式AI 创造机遇,出版人不应弃之不顾,而是应该尽快掌握相关应用技能。出版人可以尝试使用AI 工具,在新项目中纳入这一元素,并探索其用法;参与相关讨论,思考如何以符合道德规范的方式,运用AI 技术,辨析该技术的局限和前景。更重要的是,出版人应思考,如何塑造这一技术,为出版行业所用,为读者所用,以创造我们共同的未来。AI 是否会在出版业内占据一席之地,这已经不是问题。问题是,在什么时候,AI 会以什么样的方式,在出版业内发挥作用。如何保证这些“方式”符合出版人最远大的抱负,最纯粹的初心。■

猜你喜欢

考克斯布鲁克斯出版业
以按需出版为抓手,推动出版业数字化转型
“守株待兔”
布鲁克斯樱桃在西安灞桥地区的栽培表现及栽培要点
巧克力
一朝承诺,八年坚守
AR与VR技术在儿童出版业中的应用
对出版业供给侧改革的思考
南宋出版业考述