APP下载

“大数据”时代如何做新闻?

2013-08-28

中国记者 2013年3期
关键词:结构化数据挖掘大数据

清华大学新闻与传播学院教授、副院长陈昌凤在2013年第1期《新闻与写作》刊文,介绍了“大数据”对于媒体的价值。“大数据”是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,其主要特点是海量、非结构化和半结构化、实时处理,业界将其归纳为4个“V”:Volume(数据量大),Variety(数据类型多样),Velocity(处理速度快),Value(价值密度低)。

新闻界是数据的重要应用者,在互联网时代媒体经营、新闻实务等几乎一切都离不开“大数据”、数据挖掘。西方媒体出现了不少专门与数据打交道的记者,通过数据挖掘的方式进行新闻报道,在繁杂琐碎的非结构化数据之中,发现常规新闻中不能体现的逻辑,帮助读者对新闻事件进行深度解读。参考他们的经验,可以发现:正在或刚发生的、读者关注的重大新闻事件,通过用数据挖掘得出的不同视角,可以丰富读者对事件的认知。数据挖掘也用于日常报道,从而对现实世界做出更深入的解释。如彭博社以2004年底联想和IBM签合同为起点,对比了世界五大个人电脑生产商的股价变化,发现联想和IBM股价8年中上涨均超过100%,其它则有不同程度下降。数字很说明问题,也是对质疑者的有力回击。而除专业金融数据机构外,媒体有很多途径可获得相关数据。如网络公开的股票市场数据等。此外,读者的“大数据”也蕴藏着尚未挖掘的巨大价值,数字发行的价值被严重低估,读者的个人资料和其浏览的内容,以及它们与互联网“噪音”之间有怎么样的对比?这些是尚未被挖掘的最大价值来源。

猜你喜欢

结构化数据挖掘大数据
促进知识结构化的主题式复习初探
探讨人工智能与数据挖掘发展趋势
结构化面试方法在研究生复试中的应用
基于并行计算的大数据挖掘在电网中的应用
基于大数据背景下的智慧城市建设研究
一种基于Hadoop的大数据挖掘云服务及应用
基于图模型的通用半结构化数据检索
基于软信息的结构化转换
基于GPGPU的离散数据挖掘研究