APP下载

自动化新闻的边界与前景展望

2018-04-01赵晗阳山东大学威海文化传播学院

视听界(广播电视技术) 2018年1期
关键词:机器人生产算法

赵晗阳 山东大学(威海)文化传播学院

1.引言

自动化新闻指的是在新闻生产过程中“在没有或者有限的人类干预下,由预先设定的程序将数据转化为新闻文本的自动算法过程”①,是随着技术提升和数据库资料的扩充,由计算机辅助报道演化而来的新闻生产新方式。

计算机辅助报道和自动化新闻的分流发生在2006年,美国信息供应商汤姆森金融公司开始运用电脑程序来替代财经记者,自动撰写经济和金融方面的新闻。该公司称其机器人记者可以在公司发布信息后的0.3秒内提取有效数据,并分析整合成一篇报道②。特别是在2013年后,为新闻产品提供自动化生产内容的技术公司不断增多,让自动化新闻成为了新闻生产领域里的重要一支。自2015年始,国内的自动化生产技术与新闻内容也进入蜜月期,相继推出腾讯的“Dreamwriter”、新华社的“快笔小新”、阿里巴巴与第一财经的“DT稿王”、今日头条的“Xiaomingbot”、百度的“度秘解说”、南方都市报的“小南”以及广州日报的“阿同”等机器人写手,让自动化生产成为了前沿领域的重要内容。

2.自动化新闻的三个误区

与当前自动化新闻广泛的生产实践活动相较,自动化新闻的学界研究呈现出滞后的状态。笔者将从三种关系层面对自动化新闻的边界进行探析,以理清自动化新闻研究领域存在的三种误区。

2.1 自动化新闻而非机器人新闻

在前述的由预先设定的程序将数据转化为新闻文本这一新闻生产过程中,国内学界一直存在机器人新闻与自动化新闻这两种称谓,笔者认为,这两种概念之间有很大区别:

一方面,从形式上看,机器人新闻强调存在机器人这样一个实体,或是肉眼可见的一个科技产品,通过此类产品形成新闻稿件;自动化新闻并无较高的产品形式要求,生成新闻的依赖是抽象的计算机软件、代码或数据。

另一方面,从内容上看,机器人新闻的外延更广,强调新闻生产需从新闻采集一直延伸到新闻产品呈现的全自动。而从当前的实践情况看,自动化新闻只需根据相关人员更新的数据,在相应的数据库中搜寻符合某种算法的数据进行新闻生产,对新闻的采集与分发无具体要求。从这一界定我们不难发现,机器人新闻与自动化新闻是两种不同的概念。当前我国研究领域对此种新闻生产行为的研究应是更注重“算法”的自动化新闻。笔者下文将统一运用自动化新闻这一称谓代替机器人新闻这一模糊概念。

2.2 自动化新闻与大数据的关系

有学者认为,自动化新闻是一种基于大数据的生产模式,大数据时代的到来将自动化新闻的分析对象由结构化转为半结构化乃至非结构化,笔者看来,这种观点实为对大数据与自动化新闻的关系强扭。

从自动化诞生的时间上看,其早于舍恩伯格2013年的大数据开元之作《大数据时代(生活、工作与思维的大变革)》的发表时间,所以简单的讲大数据的出现带动了自动化新闻的发展显然是站不住脚的。若想使自动化生产方式与大数据相连结,至少需要理清何时才可动用大数据:

首先,从数据量的角度看,此数据应为单机处理不了的内容(如内存限制、时间过久等),定量来说至少是PB级别以上的数据才能算是大数据。

其次,复杂算法也是动用大数据的基本条件之一。如自动化新闻所需数据只是PB级数据库中数据的简单累加或简单计算,也不能称之为真正动用了大数据的方式进行处理。

真正的大数据运算是同时满足数据量和复杂算法这两个因数时才会动用的手段。因此,自动化新闻生产和大数据的处理技术基本没有关联。自动化新闻的工作人员会构建一个相对有限的数据库,拿一场篮球比赛来说,新闻算法动用的数据也不过是历史上相关篮球比赛的所有数据,对于球员的度假信息,教练是如何参与当地政治一类的延展性信息并没有过多涉及。即使是自动化写手计算了该领域全部报道者的语言文字特点,算法所基于的数据也只是有限的结构化数据,而非半结构化甚至非结构化数据,更不用说大数据所谓的全量数据。基于此的算法只需要计算一下诸如两球队历史上交锋次数与胜率,某球员获得职业生涯最高分等数据,用较为简单的算法嵌套在预先写好的模版中,便可生成新闻内容。从以上分析可以看出,那些强扭自动化新闻与大数据关系的观点显然是站不住脚的。那么大数据与自动化新闻的关系是什么呢?

大数据时代的核心是预测,这种预测精神才是大数据带给自动化新闻的最大贡献。通过这种思维的创新,数据处理人员可以在相对结构化的数据里通过某些算法找出所研究对象的发展趋势,对其进行基于海量数据的合理预测,以此更好地研判自动化写手不太擅长的分析类报道。

2.3 自动化新闻与新闻信息的推送

当前学界对自动化新闻的生产流程基本达成共识:是经由一个结构化的数据处理、新闻性的测量、报道角度的选择及排序、报道角度与数据点的匹配及报道文本的生产过程。从流程中我们不难看出自动化新闻是一种从信息数据经由特定算法到达新闻文本的生产过程,但其所生产的新闻文本并不是最终投放界面的新闻产品,而是上传到发布者的内容管理平台就结束了整个流程。

从当前学界对自动化新闻的研究看,对其积极影响中的满足个性化需求、放大长尾效应以及消极影响里的形成“过滤气泡”“信息茧房”以及造成“单向度的人”的观点笔者不敢苟同。

推送分发软件可以通过分析用户的浏览记录和喜好,运用某种算法,点对点地为用户推送其喜闻乐见或关心的新闻信息。具体来说推送机制主要依靠用户资料与用户浏览记录等建立的与新闻内容相似的匹配模型,并通过用户的点击收藏等正向反馈与标记“不感兴趣”的负反馈不断优化和提高投放的精准度,但这都已经超出了自动化新闻这一生产流程的范畴。如果我们强行认为,正是因为自动化新闻可以在短时间内生产海量的新闻,才使得推送的算法拥有更多可以个性化精准投放的资源,那无异于《寡人之于国也》中所描述的:“刺人而杀之,曰:‘非我者,兵也。’”介于以上观点,我们可以做出判断,自动化新闻旨在进行新闻文本生产成型以及之前的流程实践,至于如何推送,是由其它算法进行的,基于此可以做出判断,自动化新闻与新闻信息的推送机制无直接关联。

3.对自动化新闻发展的展望

当前学界普遍认为,自动化新闻的发展,不会带给新闻业和人类记者毁灭性的打击,相反我们要利用好自动化写手,使之与人类记者在新闻写作的广度和深度方面互补长短,助推新闻业的全面进步。与当前研究领域的观点相同,笔者也相信自动化新闻的发展会带给新闻界更多积极的变化与发展,但发展的方面和程度,需要我们仔细考究并提出特色化发展建议。除去已有研究成果中的扩展信息采集库、提高相关技术水平、增加算法信息透明度、“术业专攻”地生产专业新闻外,笔者将在新闻信息搜集、新闻事实核查与新闻产品融合角度对自动化新闻做出展望。

3.1 新闻信息搜集

在上文中笔者指出我国当前研究领域的自动化新闻是由提取数据库中有效信息而进行的新闻生产,但随着技术的发展,自动化新闻的外延应更为广阔。2016年3月,《华盛顿邮报》研发出聊天机器人Feels,在美国总统大选三周前,“Feels”聊天机器人每天晚上以一个简单的问题与读者互动:“今天的大选让您感觉如何?”随后的第二天早上,聊天机器人便向用户推送关于前一天大选的感觉图表和关于用户感觉的原因摘录③。通过此种方式,Feels将用户信息采集并储存在自己的信息库中,直接充当了传统自动化新闻中的数据库。学者匡文波提出:“技术总是会让新闻报道增色”④,我们有理由相信自动化新闻的光明前景。如若将机器人的信息采集、自动化新闻生产与新闻信息推送的算法整合到同一产品之中,自动化新闻就将由半自动化转向全自动,当前新闻实践就会有突破性的进展。

3.2 新闻事实核查

2016年,英国的一家事实检查机构 Full Fact发布了测试版的监控系统,旨在从几十个英国新闻网站(BBC、卫报等)中搜寻信息,自动分析英国议会记录和其他一些内情,目标是捕捉每个谣言的生命周期,进而粉碎这些谣言。Full Fact下一步的计划是以概念验证的方式进行自动化地检测和核实统计出来的报道,在确保数据机器可读的情况下提高人工智能的情景分析能力⑤。

这个实践活动向我们展示了自动化新闻作为客观无思想的科技产品,不仅在新闻生产领域有重要作用,在事实的核实方面也有人工无法达到的优势。正如Full Fact 的主任 Will Moy所言,事实核查在信息来源中监控媒体、确认关于事实的报道、检验真假和公布核实结果的四个阶段都可能实现自动化。

3.3 新闻产品融合

在美国学者简·斯蒂文森(Jane Stevens)的定义里,融合新闻是文本、照片、视频段落、音响、图表和互动性的集合体,它以非线性结构呈现在网站上,不同媒介的内容互相补充且不重复。若想真正拓宽自动化新闻的报道领域,提高新闻内容的深度和适用性,应使其所生产的新闻产品呈现出融合的形式。

自动化新闻一个很大的问题在于其涉足领域局限在天气预报、体育赛事、公司财报、信息汇编、突发快讯等,但这种劣势恰恰也是自动化写手占领上述领域的有利条件。自动化新闻的算法不仅可以选取海量数据中相对应的数据嵌套进模版以生成文字,运用其准确高效的算法生产图表、链接相关新闻及图片,未来甚至可以在技术从业者将所采集到的音频、视频上传到材料库中后,对其音频和图像信息进行解码后的重新编码,最终形成嵌套文字、图片、音频、视频等小模板的融合型大模板,直接生成融合式新闻内容,再由相关从业人员进行简单的人性化处理即可形成新闻产品。2016年10月,美联社战略企业发展部高级副总裁JimKennedy在接受采访时透露了其人工智能应用的下一个方向:将文字新闻自动转换为广播⑥。该项目的设想是,开发团队集中于一项特定的体育项目,制作出将文字转换为广播的模板,在此基础上开发出适用于这一转换的算法。这种融合式的新闻既保证了新闻时效性,又使自动化写手所生产的新闻内容得到更充分的展示,是吸引用户关注、增加用户在特定领域中黏性的可行之举。

4.结论

在此篇文章中,笔者首先理清了自动化新闻研究领域的三个误区,修正了当前学界将自动化新闻称之为机器人新闻的错误称谓;指出大数据与自动化新闻并非简单的产生与被产生或产生震荡影响的强关系,而是更新预测性思维的相对弱关系;并对自动化新闻这种生产方式与新闻推送的特定算法进行区分。在此基础上,指出自动化新闻应在线索搜集、事实核查、产品融合三方面有所提升,以期对自动化新闻的学界研究与业界发展贡献微薄之力。

注释:

① 许向东,郭萌萌.智媒时代的新闻生产:自动化新闻的实践与思考[J]. 国际新闻界,2017 年5月23日,第29-41页

② 孙振虎,张馨亚.机器人新闻的发展与反思[J].电视研究,2016年6月5日,第64-66页

③ 《聊天机器人是新一代资讯App?《华盛顿邮报》最新开发手记曝光 | 独家编译》[EB/0L],“传媒狐 ”,http://www.sohu.com/a/121939061_465296,2016年12月19日

④ 匡文波.记者会被机器人取代吗[J].新闻与写作,2017年9月5日,第59-62页

⑤ 《在人工智能和新闻的结合上,国外媒体已经飞起来了?》[EB/0L],“刺猬公社”,http://36kr.com/p/5058392.html,2016年12月6日

⑥ 《美联社黑科技:机器人写稿,还要转换成广 播 》[EB/0L],“ 传 媒 狐 ”,http://m.sohu.com/n/473268658/?pvid=000115_3w&_once_=000022_shareback_wechat_flow,2016年11月5日

猜你喜欢

机器人生产算法
用旧的生产新的!
“三夏”生产 如火如荼
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
代工生产或将“松绑”
进位加法的两种算法
S-76D在华首架机实现生产交付
一种改进的整周模糊度去相关算法
机器人来帮你
认识机器人