APP下载

广电媒体大数据整合与应用的问题及路径研究

2023-01-09冯结兰文诗妍

中国传媒科技 2022年9期
关键词:广电人才

冯结兰 文诗妍

(广西财经学院 新闻与文化传播学院,广西 南宁 530022)

大数据目前已广泛应用于各行各业。在残酷的市场竞争中,企业利用已掌握的数据,为客户提供精准服务。广电行业对于数据的敏感度不太高,所以前几年的数据应用一直落后于竞争对手。随着近年移动互联网的飞速发展,以及视频网站和OTT TV的全面兴起,广电媒体面临着异常严峻的形势,大数据进入了广电媒体的视野。

不过,对内部流程、分工已经相对固化的广电媒体而言,面对一门新近崛起的技术和学问,在人才、技术、规范等方面都面临着诸多难题,需要加以解决。

1.广电媒体大数据整合与应用中存在的问题

1.1 大数据来源问题

缺少可靠的数据来源,再高超的技术都是无本之木、无源之水。广电媒体不仅大数据资源匮乏,数据孤岛还普遍存在。

广电媒体的大数据主要是自身的业务数据,它们主要来源于广电网络、IPTV、各频道频率、新媒体部门,包括内容数据、用户数据、收视数据、报料数据等。这类数据可控性较好,数据质量也有一定的保证。但最大的问题在于:数据资源不够广泛,覆盖范围有限。

关于数据来源,普遍认为互联网与物联网是形成且提供大数据的平台。互联网是产生大数据的源头,能够在社交、媒体、交易等不同领域持续产生各类数据。物联网设备则时时刻刻都在形成新的数据,数据量伴随着时间持续增加。这两类数据资源作为大数据金矿,正在不断产生各种应用。[1]广电系统是以行政区域为边界的,各省、直辖市、自治区广电媒体互不相通,广电的台与网分离,这使得各家广电媒体手中的数据都是有限的。即便是中央级媒体,对于自己在各省市的精准收视状况,也无法掌握。广电在鼎盛时期时一直是单向传播,无法收集用户行为数据。双向网改后,高清互动机顶盒的普及和置换需要很长时间。广电网络一直未研究出数据精准到人的方法,“大模样”数据使广电难以实现用户画像。可以说,广电媒体手中的数据量有限,且现有数据在技术应用上有一定难度。

当前,数据孤岛在各行业普遍存在,整个社会中数据开放度低,数据难以共享。这也导致数据应用难以深入,限制产业发展。近年来在国家政策推动下,政府数据加快了共享开放的步伐,但是很多基础性、关键性数据仍被政府束之高阁,民众难以共享。大量数据资源毫无关联地沉淀在各部门信息系统中,缺乏统一开发利用,难以发挥利民惠民、支撑政府决策的作用。[2]我国信息数据资源80%以上掌握在不同政府部门。各地政府往往通过行政手段来进行公共管理,能够根据需求获取各类海量数据。全国各地政府部门均拥有大规模的数据库作为支撑。从广电大数据产业发展来看,数据孤岛是很大的障碍。目前在大数据的采集、分析和应用过程中,各部门各自为政,资源难以整合,都只是在自己手头起着有限的作用,未碰撞在一起发生化学反应。比如,广电媒体的呼叫中心有很多用户数据,购物频道也有很多数据,广电网络的数据更是主要资源,广电媒体的IPTV、移动客户端,也有很多的数据资源,但至今未打通,没有实现整合。

1.2 大数据人才问题

经济社会发展中,人才的质量和数量决定着科技水平的高低。大数据技术从引进到迅猛发展期,只用了短短几年的时间,这导致人才储备问题尤其突出。

大数据人才短缺的问题,是一个带有世界性的普遍问题。对我国来说,这一领域的矛盾尤为突出。数据显示,2016年以来,我国大数据产业规模逐年增长,2021年大数据产业规模超1.2万亿元。中商产业研究院预测,2022年中国大数据产业规模将超1.4万亿元。

大数据产业对人才的需求日益增长,但目前的人才培训体系无法满足企业的大数据应用需求。[3]领英(LinkedIn)发布的《2016年中国互联网最热职位人才库报告》则显示,数据分析是当下中国互联网行业最热门的需求职位之一,数据分析人才的供给指数最低,仅为0.05。它还特别强调,数据分析人才将伴随着大数据在互联网行业更多的应用而愈加重要。

大数据人才缺乏,是目前整个社会的普遍现象,电视行业亦如是。广播电视台有很多技术人员,但他们都是后期制作、通信工程领域的,大数据技术、大数据分析人才十分稀少。于广电媒体,大数据专业人才不仅需要具备大数据领域的技能,还需要理解广电媒体的业务。比如对新闻线索的收集以及数据新闻写作,需要大数据技术人才具备较高的新闻敏感性,具有一定的新闻传播学基础;对广电网络收视数据分析、对电视及手机客户端的精准推送业务,也需要技术人员对媒体特点、栏目需求有一定程度的了解。

1.3 大数据技术与成本问题

数据正越变越大。据中国信息通信研究院发布的《大数据白皮书(2020年)》[4],2020年全球数据产生量约47ZB,而到2035年,这一数字将达到2142ZB,全球数据量即将迎来更大规模的爆发。中国信息通信研究院要对极其庞大的数据进行统一管理、高效分析,还面临着技术层面的挑战。

首先,数据压缩技术是巨大的挑战。中国的数据体量超大,对存储空间、数据压缩技术、能源消耗等方面要求高。PB(千万亿字节)、EB(百亿亿字节)级数据量要求改变传统的数据存储方式,使用专用的设备和压缩技术,对存储系统进行相应等级、操作简便地扩展。传统的结构化数据库难以承受数据量级和复杂性的增长,需要探索适合大数据的数据存储模式。

其次,技术的主要挑战来源于对大数据的采集和分析。微软大中华区董事长兼CEO柯睿杰认为,数据智能并非那么触手可及。要想从来源众多、数量巨大、形式各异的大数据获得一目了然的信息,就需要真正高效、可靠的数据管理和分析平台,从而为用户提出一个切实可行的方案。[5]对于大数据处理的技术专业而复杂,包括数据清洗、数据分析发掘、数据可视化等领域有很多关键技术,还需要用到自然语言理解、机器学习、深度学习等人工智能技术创新,需要运用到包括数学、经济学、社会学、计算机科学和管理科学在内的多学科技术。我国在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,我国关于大数据的底层技术基本都来源于谷歌等国外大公司。这些年我们的商业模式有所创新,但通过技术手段来推动创新的能力有限。[6]

1.4 大数据应用问题

当前广电媒体的大数据应用,还处于一个初级阶段,从应用程序上讲是描述性、预测性的东西多,指导性应用少,从数据源的角度看,以单一数据源进行分析的多,多元数据的应用少,主动去收集数据的应用偏少。[7]概况而言,广电大数据应用方面存在如下问题:行业应用不深入、数据范围较单一和片面、数据变现难。

赛迪顾问股份有限公司大数据产业研究中心提供的数据显示,互联网、金融和电信三大领域的大数据应用在各行业总规模中所占比重超过70%;健康医疗领域和交通领域近年不断“上架”新应用,但行业规模占比相对较小;而在其他众多民生领域,大数据应用仍处于浅层次信息化层面,行业发展水平参差不齐。[8]广电媒体的数据应用还很初级、很零散,主要以数据收集为主,在基础统计分析、风险预测等方面还需改进。由于没有互联网平台,电视台难以利用大数据技术开展业务,传统运营体系也无法得到提升。广电网络和IPTV对于用户收视行为数据的挖掘分析才刚刚开始,距离应用还有较远距离,大数据并未与广电业务深度融合,应用场景也不足。

广电数据范围较单一和片面。广电媒体大数据在收集样本信息的时候,因为传播方式的多样化、传播端口的差异,致使样本代表性有限,信息难以全面,因而分析出来的结果并非百分百准确。目前应用较多的是有线网络的机顶盒数据,全媒体数据因为用户有限、收集和处理方法复杂,因而应用的频率和范围都有限。广电媒体行业数据来源相对单一,各媒体主要坚守在自己的活动范围内,收集和应用的都是广电媒体自己的数据,对外部数据的引入和应用较少。但是,对大数据而言,其价值往往在于不同种类、不同业务范围的数据的碰撞组合。要增加大数据的价值,应加大对外部数据的引入和应用。[9]

数据变现难。广电媒体由于使用范围的局限性,较少用于为第三方提供服务。广电网络的收视数据限于地域,未能连通全国的数据,因而收视统计结果基本只用于本台的节目制作和研究部门作为参考,难以得到广告主和广告企业的认可,没有人愿意为之付费,因而仍无法替代数据公司的抽样调查结果。即便对于本台节目制作和研究部门,因目前市场普遍认可的衡量标准仍是第三方的抽样调查结果,因而自己的全样本数据分析也只是作为辅助和参考。[10]目前广电大数据主要应用于企业的自我管理,也涉及帮助企业做产品设计、营销推广。

2.广电媒体大数据整合与应用的优化路径

面对大数据应用面临的难题,广电媒体需积极应对,在数据源、人才、资金、技术等方面为大数据应用创造条件。

2.1 成立大数据部门:解决数据人才、技术的问题

广电媒体应在保障薪酬待遇的基础上,一方面完善配套措施,力求引进一流的大数据人才,保证业务发展的需要,另一方面,应从现有员工中挖掘有潜力的跨界人才,重点培养。广电可与相关的大数据培训机构合作,对已有的优秀采编及技术人员开展相关的业务培训并进行考核,使其具备承担大数据分析工作的能力。在建立健全多层次、多类型的大数据人才培养体系的同时,广电媒体还应建立适应大数据发展需求的人才评价与考核机制,以保证人才的可持续发展。[11]

广电媒体可以设立专门的机构作为大数据收集、整理、开发、应用的主体,以保证相关工作的顺利开展。该机构应既掌握大数据技术,又有广电业务经验,对广电大数据应用的方向和痛点了然于心。

贵州省大数据管理局的设立和定位对广电媒体的大数据整合工作而言非常有启发性。广电要想实现数据应用,也需要设立统筹管理大数据的部门。

目前,广电数据散落于各个部门或单位,大数据应用一般只局限于部门内部,加上各部门的壁垒和数据保密的需要,很少将所有数据集中利用。零散的数据难以发挥其价值。数据只有足够大,才能实现其真正的效用。广电媒体的数据,存在于不同的子系统中。只有将这些零散的数据进行归类并整合,才能发挥最大效益。另一方面,大数据知识体系繁杂,技术应用门槛较高,需要对业务了解、技术娴熟的专业人士操作。各部门、频道集中的媒体技术人员,主要是视频编辑、通信工程、设备操作人员,有大数据知识和技术的人才还相对偏少。这类人才主要集中在技术中心的互联网管理部门。[12]单是依靠各个频道或者部门,很难摸索出大数据应用之道,需要由专业人士进行专门的开发应用。建立专门的大数据部门,才能打破数据孤岛,实现大数据的整合应用。

2.2 建立大数据库:解决数据共享的问题

广电媒体要解决数据共享的问题,就需要建立属于自己的数据库。广电媒体的数据分散在不同部门中,只有将这些零散数据进行归类并整合,构建广电大数据库,才能发挥最大效益。

大数据库本质上是一个用户数据管理系统,它并没有推翻以往数据库的基础,但是相对于以往的数据管理系统而言,它的数据数量剧增、数据结构多样、数据处理速度更快、数据价值更高。

广电媒体各部门一直是各自为政,各部门都有自己的数据,但都相对独立和私密。概而言之,这些数据可以分为:一是内容数据,广电媒体过往及现今每天源源不断生产的内容;二是用户数据,运营多年从电视端到电脑端、手机端所拓展的用户群体;三是收视及评价数据,双向网改、开通移动端App后,广电媒体可以直接收集到用户的反馈;四是广告及营销数据,广电媒体做了几十年的广告和营销活动,有很多优质客户和活动数据。

打通数据孤岛,加快数据开放,就要统筹搭建数据共享平台,建设广电行业大数据库,助推广电行业建立统一的数据开放、共享平台。

2.3 数据挖掘与数据交易:解决数据源的问题

随着大数据的广泛普及和应用,人们对数据资源的价值越来越重视和认可。但囿于单个组织的局限性,数据应用一般需先经由数据交易扩展数据源。

互联网与物联网是形成且提供大数据的平台。[13]这两类数据资源作为大数据金矿,正在不断产生各种应用。还有一些企业,比如商品交易、特定群体消费信息等在业务中也积累了许多数据,他们是获取、加工处理相对便宜的数据资源,也是当前最常见的应用资源。

这些数据中,既有公开数据,也有非公开数据。在需要运用公开数据时,利用大数据挖掘技术,对可获取的数据进行挖掘即可拓展大数据来源,对非公开数据,则需要以数据交易的方式获得。

2.3.1 公开数据采用数据挖掘

目前,有很多公开的数据来源或数据分析,可免费供研究者或企业使用。比如政府机构、职能部门、行业协会的统计数据或分析报告,还有百度等互联网公司、亿赞普等数据调查机构收集、发布的数据。尤其是政府部门掌握的数据资源,普遍被认为质量好、价值高,是最重要的公开数据来源。对一些政府公开数据、企业官网数据、社交数据等,可以通过图像识别、语音识别、语义理解等技术获得。

中国政府也着力推动数据开放。政府大数据和产业大数据中,必然有大量的数据属于公开数据。未来,数据开放和流通的市场会更健全。与民生保障服务相关的信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、环境、统计、气象等领域的数据均可方便获得,

这必将促进不同行业数据的融合。

相对于互联网企业,广电媒体的数据体量并不大。广电媒体要实现对大数据的应用,仅仅依靠自身数据是远远不够的,要充分利用外部数据。外部数据可以帮助广电媒体更好地了解客户、拓展应用。比如电商、医疗、出行、教育等行业的数据,可以使得广电媒体的营销更精准,还能促进广电与其他行业的融合,设计出更多基于场景的传媒产品。无论是用户收视分析、企业经营分析,还是营销设计、产品设计,都在呼吁广电媒体推进与其他领域数据的融合应用。

广电媒体应与这些拥有数据的机构展开充分合作,首先是将这些拥有新闻价值的数据资源作为素材,进行报道;其次应加大投入,对这些数据机构所发布的数据,进行二次分析处理,深入思考数据应该怎么用,形成有逻辑的数据资产;再者,广电媒体还应将这些数据资源与自身数据相结合,开展跨行业数据应用,服务于自身业务的发展。广电媒体还应结合自身的传播渠道优势,或通过专题活动宣讲,展示广电大数据的行业应用成果及在各个行业领域的融合应用成果,增强社会关注度。[14]

2.3.2 非公开数据开展数据交易

数据已被视为固定资产。既然是资产,就可以交易。广电媒体有自己的数据,但也有开展业务需要的数据,这都需要去数据交易市场买和卖。不同种类的数据,需要“相遇”。数据交易解决了数据流通不畅的痛点。未来,跨行业、跨领域的数据叠加整合之后产生的数据产品最有价值。每个单位,既可以将自己的数据放入交易市场,也可以从数据交易场所买回自己需要的数据,求得业务的发展。正如神州数码控股有限公司董事局主席郭为所言,“整个大数据产业存在的问题,一个是数据交换问题,一个是商业规则问题”。数据的属性只有与其实际应用相融合才能实现应用价值。数据交易对社会发展影响巨大,建立数据交易中心,明确数据商业化运作的规则非常重要。

广电媒体有自己的数据,用户数据、收视数据、内容数据,都可以进入数据交易市场,在脱敏之后进行交易、交换;广电媒体的业务发展,也需要更多数据的指导和支撑,所以需要在市场上购买源数据或者数据分析结果。比如可以向电信运营商、生活服务提供商、电商等购买用户数据,以推广自己的业务;向百度云、腾讯云等购买新闻热点分析、节目播放反馈数据等;也可以向影视节目制作机构出售收视分析数据,为影视节目制作提供参考。广电媒体应多思考和运用数据交易方式满足自己数据变现和数据应用的需求。

综上,大数据应用是广电媒体要面对的重要课题。面对广电媒体大数据整合与应用中存在的资源、技术、人才等诸多难题,可以通过成立大数据部门、构建广电媒体大数据库、开展数据挖掘与数据交易等方式加以解决和优化,推动广电媒体在新时代的发展。

猜你喜欢

广电人才
人才云
南岸:聚人才之智 建创新之城
同心守“沪”上海广电人在战“疫”一线
探讨大数据在广电新媒体中的应用
人才的开发和使用是一门科学
忘不了的人才之策
留住人才要走心
“人才争夺战”
如何加强基层广电系统财务管理
广电新媒体发展需要“融合”什么样的人才