APP下载

大数据在出版行业的应用初探

2019-12-27程新晓

出版广角 2019年23期
关键词:出版单位选题精准

【摘要】 大数据正在重构众多的传统行业。文章结合国内外重要出版领域的发展情况,以及大数据的特点,总结大数据在选题策划、内容生产、营销推广环节的应用,以期给广大出版工作者带来新的思考和借鉴,让出版业在大数据时代获得更好更快的发展。

【关  键  词】大数据;选题策划;内容生产;精准营销;用户画像

【作者单位】程新晓,河南大学,河南大学出版社。

【中图分类号】G239.2 【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2019.23.010

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”这是全球知名咨询公司麦肯锡最早提出“大数据”时代到来时所说的话。当前,大数据快速渗透到包括医疗、教育、工业、农业等行业,并且给各行各业带来了深刻的变化。过去,人们做出决策,往往是凭借一个人或者一部分人的经验,甚至是依靠直觉来做出判断。而现在大数据最大的作用便是通过对数据的感知、采集、建模、分析、共享,给人们提供一种看待世界全新的方法,甚至以此来做出决策。

大数据正在重构众多的传统行业,传统的零售企业沃尔玛通过数据挖掘对产业链进行重塑并优化,淘宝、亚马逊等电商则基于对海量数据的掌控、建模、分析,给用户带来更专业化、个性化、精准化的服务,出版业也不例外。长期以来,每一项重要技术的发展,从造纸技术、印刷技术到当下的信息技术、互联网技术,都给出版业带来了深远的影响,而大数据无疑会渗透到出版业的各个环节。从选题策划、内容生产,到推广营销、广告投放,甚至到随着互联网技术发展而得以延伸的读者服务,除了传统的结构性数据,读者的购买行为(浏览、选择、购买)、阅读行为、对图书的评价以及信息的反馈等过程,都会产生大量的非结构化数据,这些数据都可以通过大数据采集、保存、建模、分析,為图书的选题策划、内容生产、精准营销等奠定基础。笔者将结合大数据的特点,梳理大数据在出版领域的应用思路及途径,以期给广大出版工作者带来新的思考和借鉴。

一、大数据在选题策划环节的应用

好的选题不仅可以满足人们多样化的精神文化需求,而且可以给出版单位带来高额的利润,是出版单位实现社会效益和经济效益的基础保障。传统的出版选题策划,通常是编辑通过听取发行人员的反馈意见及建议,或者通过较为传统的问卷调查方式来完成。这种方式容易导致选题与市场需求有所偏差。大数据时代,无论是信息收集的准备阶段,还是选题的策划阶段,都可以借助大数据来完成。

1.大数据成为选题收集信息的辅助手段

编辑可借助大数据收集信息,通过多平台、多途径、多技术手段搜集并建立数据库。在信息搜集准备的阶段,出版单位除了可以使用单位内部的销售数据、用户数据等,还可以通过各种新媒体平台,如微博、微信、贴吧等获取信息。在这一环节中,出版单位需要利用专业的数据挖掘和舆情分析软件,构建出版单位、编辑、作者、读者以及行业意见领袖的数据库,进而获得选题数据的源头。进入选题策划环节,出版单位则可以利用大数据挖掘技术优化选题。在选题策划环节,包括题目、基本内容、作者、读者对象、完稿时间等,大数据都能给编辑带来辅助。譬如对作者的选择,在信息收集的阶段,大数据已经采集到知名作者或者草根作者的众多信息,包括身份信息、标签信息、粉丝数量、作者作品数据库等,出版单位经过分析聚类、异类等关系网络图,就能制定出目标作者的名单。

2.大数据成为挖掘选题热点的手段

编辑可综合利用大数据、人工智能等技术手段,协同处理出版机构、卖场零售、电商平台、网络媒体等的数据,进行市场监测与数据的实时采集,还可定向重点关注特定的出版领域,或者相关的产业动态、特点等,即时跟踪热门选题。譬如,实时监测百度、谷歌、360等搜索引擎的搜索指数,监测微信、微博等实时数据,关注贴吧、知乎的意见领袖,实现热点选题的挖掘。《纽约时报》根据Facebook和Twitter上对12名滑雪爱好者遭遇雪崩的报道,以及对这一话题的转发、分享及评论,及时策划了“雪崩”这一经典的大数据新闻。

3.大数据成为选题创新的工具

虽然我们都知道大数据对选题策划的影响重大,但大众出版的读者群体较为分散,一家出版企业所能采集的数据极为有限,因此,出版单位与数据量庞大且具有强大数据分析能力的互联网企业、平台合作,就成了突破口。如中国农业出版社与百度知道的深度合作。百度知道拥有大量的用户群体,但其能够提供的内容较为浅显,更加难以提供专业的指导,难以吸引专业人士。但百度知道拥有庞大的读者群体,拥有大量的用户行为数据、用户画像数据,出版单位对海量的数据进行分析,就可以挖掘出用户的需求。

二、大数据在内容生产环节的应用

大数据在内容生产环节的应用,实质上是重构和再构非结构化数据,是利用大数据再生内容,从碎片化数据中挖掘内容,或是用数据驱动内容生产。

1.从碎片化数据中挖掘内容

从碎片化数据中挖掘内容意味着海量的公开数据需要经过清洗、分析和处理后,才能真正产生价值,或者是发现新的现象,得出一个新的评价,或者是要不断进行思考。不管怎样,要生成内容,都需要有强大的收集、挖掘、分析以及再构的方法和能力。在数据收集方面,出版单位可以采用百度、搜狗等全网搜索引擎,或者使用垂直的专业类搜索引擎;也可以利用专业的爬虫技术进行数据收集,如集搜客、八爪鱼、python等,不仅支持对各类网页的抓取,最终还可以生成专门的数据库,供编辑随时取用。除此之外,出版单位也可以自主研发专门的抓取工具,进行专业的数据抓取。如英国《卫报》早在2009年就建立了数据博客、数据商店等新闻平台,数据博客的核心功能就是收集新闻事件的所有相关评论,继而利用大数据对评论文本进行分析,再将不同的分析结果通过多样化、可视化的数据和图标等形式进行专题报道,深度展示新闻事件的来龙去脉。在对数据进行分析及再构时,一方面,出版单位需要挖掘数据间的关系,从对比的角度分析数据才能展现数据的意义与价值。另一方面,出版单位需要根据内容的特点,从空间、时间等多维度对数据进行处理。比如在新闻事件中,从时间的角度来分析,可以延伸新闻事件的深度;从空间角度来分析,则可以扩展新闻事件的广度,进而利于聚焦主题和内容。

2.利用数据驱动内容生产

第一,编辑可以分析用户对已经传播的内容的阅读行为数据,进而驱动内容的生产。《纸牌屋》就是一部用大数据算出来的热播剧,其完全通过大数据分析进行定制化生产,实现了根据用户的需求决定内容的生产。仅2013年,《纸牌屋》的数据库就包含了约3000万名用户的收视选题、300万次主题搜索,以及400万条评论。《纸牌屋》的内容就是由这庞大的数据来决定的,出品方兼播放平台Netflix根据数据分析用户的喜好,从而决定拍摄的内容,以及导演和演员人选,内容生产根据用户的喜好随时进行调整。这一部由大数据算出来的电视剧,正因为恰好满足了用户的需求,获得了极高的收视率。

与之相似的是出版业的“粗剪”出版模式。在这种出版模式中,读者只要购买了图书的粗剪服务,就能在线阅读或者打印正处于编写或编辑阶段的图书,同时给图书提供建议、评论。这意味着在内容的生产过程中,读者是直接影响图书出版的。例如,由中国农业出版社和易书科技纸上博物团队联合策划研发的《田野里的自然历史课》,全书向读者展示了近500个知识点,配有800多幅精美的手绘插画,展示的是美好的中国农耕文明。图书出版后,中国农业出版社和易书科技并没有停下对数据和内容的再构。易书科技深度分析了百度知道上200多条知识问答的反馈数据,并从中筛选出100条受欢迎的问答,进行内容形式的创新升级,使其从原本的文字形态升级成短视频形态,再在百度知道上线。这样一来,易书科技不仅对原有内容进行再创新,使得内容进行二次销售,同时还大大提升用户体验,促进原有图书的销售。

第二,编辑可以根据用户的画像生产小众化内容。当前,随着互联网技术、数字化技术的发展,越来越多的小众化需求浮出水面,创造了强大的市场价值。而且以往很难大众化、批量化、商业化的内容,如今也可以通过数字技术得到生产、传播、转化。小众化内容就是符合具有共同特征的小众群体阅读需求的内容,这就要求编辑从每一个个性化的用户身上挖掘出群体的共性。在小众内容的生产过程中,最关键的是用户画像,要准确描绘用户画像,靠单个维度的数据是很难完成的,需要将线上线下的多维度用户数据整合起来,包括用户的基本社会属性数据、消费金融数据、场景位置数据、在线行为数据、社交数据等。只有充分整合多维度的数据,才能更深刻理解用戶的需求,生产出满足用户需求的内容。

罗辑思维最开始是从大众内容切入,获得了众多读者的认同,再通过分析用户数据,进行用户画像,逐渐形成独特的社群,继而以社群用户为对象,专门为社群用户提供喜好的内容。得到APP则是基于罗辑思维的用户群体,邀请相关人士加盟,共同打造符合社群用户的产品。《三联生活周刊》在2018年7月策划推出了中读APP,并且以“我们为什么爱宋朝”为主题,邀约了10位学者围绕宋朝的生活、社会风尚、习俗等进行讲解,并同步上线10节音频课程。仅一个月的时间里,这些课程就销售了2.8万份,获得了近300万元的收益。其实,这些内容的生产是根据《三联生活周刊》推出的两期封面报道“我们为什么爱宋朝”所产生的读者反响、评论等数据,综合分析读者的用户画像所定制生产出来的。

三、大数据在精准营销环节的应用

可以说,大数据在出版领域中最擅长的就是销售环节。大数据通过提供海量的数据,帮助出版单位建立起精准的市场定位,并准确细分读者市场。通常,利用大数据实现精准营销主要有以下几条途径。

1.根据用户画像为用户精准推荐产品

用户画像主要是通过采集用户的性别、年龄、爱好、职业、地理位置等,以及用户的浏览记录、购买记录、收藏记录、评价记录、反馈记录等信息,让出版单位清楚地知道读者是谁、每个读者的特点是什么,进而发现群体的共性,再根据用户画像给用户推荐相关产品。这在电商平台、新型互联网出版领域应用得最为广泛。作为国内用户黏性较高的新闻客户端,网易新闻充分利用大数据助力内容的精准营销推送。网易新闻有包括Storm、Spark、Hadoop等计算组件,同时基于开源软件,进行二次软件开发,包括缓存集群、搜索集群、消息队列等,而且能够从多个维度搜索用户的访问轨迹及用户的信息,继而推送精准的内容。

传统的出版领域也有不少应用大数据实现精准营销的案例。如《中国国家地理》很早就重点分析用户在网站上留下的各种痕迹,包括用户在网站各栏目中停留的时长、浏览某个栏目的频率、购买内容以及购买记录等,总结他们的兴趣爱好及内容偏好,继而进行个性化的内容推荐。《中国国家地理》网站的收入主要依靠广告,因此在广告推送方面,其根据数据分析来实现精准投放。首先对用户的兴趣爱好进行分类,在推送内容上实现个性化;接着分析用户的忠诚度,包括非用户、潜在用户、非忠诚用户、忠实用户,并按忠诚度分类来决定投放广告的力度和频率;同时还分析用户对媒介的使用数据,包括移动端用户、PC端用户产生的数据,进而确定广告投放渠道。在确定推送内容、力度、频率、渠道之后,《中国国家地理》还会进入试投放环节,快速利用大数据分析试投放广告的效果,并根据分析及时调整方案,最后进入正式投放环节。在正式投放环节,《中国国家地理》还会根据数据分析、反馈不断进行调整。

2.利用大数据做好产品推介

出版单位除了根据用户画像给用户精准推荐内容,还可以利用大数据拓展产品的推广营销渠道。如企鹅集团与社交数据分析站点PeerIndex公司合作,联合推出了《神没有男人》(Gods Without Men)这一畅销书,企鹅集团很好地在营销环节利用了大数据来提升营销效果。在PeerIndex公司提供的大数据支持下,企鹅集团精细化地分析了主流的社交媒体,并从中筛选出不同领域的意见领袖,继而与这些意见领袖达成深度合作,充分利用他们的影响力来进行营销,最终实现了良好的营销效果。

在推广时间上,大数据也能为出版单位提供良好的决策参考。如通过实时关注搜索引擎和新闻数据,出版单位更容易做出预测判断,从而调整推广的方式和节奏。2016年,阿尔法狗战胜李世石的一段时间内,和人工智能相关的图书就取得了很好的销售成绩。同样是2016年杨绛先生去世时,她的作品《洗澡》《我们仨》也有不错的销售成绩。大数据分析的结果可以引导出版单位及时捕捉热点,并在电商平台、微信、微博、贴吧、论坛、豆瓣等各种渠道做好促销和营销活动。

大数据已经发展了数年,无论是国内还是国外,无论是传统的出版单位,还是新型的互联网出版商,都积极采取措施,在出版的不同环节里探索大数据的应用方式,优化甚至变革出版流程。对于大数据的应用,不同的出版单位应用的程度不同,但首要工作都是进行用户画像,继而应用到选题策划、内容生产、营销推广等环节。大数据最重要的功能是预测,目前出版单位还极少使用大数据预测出版趋势及方向,希望出版单位能够更多地参与到大数据的应用研究中,利用大数据助力出版。

|参考文献|

[1]陆利坤,游新冬. 大数据技术在出版行业中的应用研究[J]. 出版科学,2017(6).

[2]孙晓敏. 浅谈大数据在图书出版中的应用[J]. 中国编辑,2017(5).

[3]钟邹俊逸. 大数据时代传统出版的精准营销[J]. 新闻研究导刊,2017(13).

[4]孙玉玲. 大数据时代数字出版产业的发展趋势[J].出版发行研究,2013(4).

猜你喜欢

出版单位选题精准
山西医学期刊社荣获我国新闻出版领域最高奖
——第五届中国出版政府奖先进出版单位奖
精准防返贫,才能稳脱贫
刘慈欣科幻作品年表
精准的打铁
精准扶贫二首
中国最美的书
全国经营性图书出版单位首次等级评估完成