APP下载

百度大数据:软硬兼施?

2014-05-22何菲

IT经理世界 2014年9期
关键词:引擎百度大脑

何菲

《超验骇客》这部科幻电影正在上映,如果你对电脑深度学习系统和人工智能感兴趣,不妨去看看,一个高智商技术宅男如何差一点就接管了世界。这部电影试图回答一个疑问:当具有高度学习能力的电脑全面接管人们的基本生活,对后者可能带来哪些改变?《超验骇客》所描绘的场景依然很遥远,百度大数据却近在眼前。“百度大脑智商相当于两三岁小孩,可能很快超越成年人。”李彦宏在百度第四届技术开放日上扔下一枚重磅炸弹。

这位 “小孩”的智力还在不断增长。“根据摩尔定律,每隔18个月计算机计算能力会增加一倍,成本会下降到原来一半。”李彦宏说,“这是一种量变,摩尔定律继续做十年二十年,质变就会发生,这样的一个大脑很有可能比人脑还要聪明。”百度试图通过包括“百度大脑”在内的大数据技术开放平台敲开各个重点行业甚至政府机构的大门。为此,百度已做了不少铺垫。

今年春节期间,中央电视台《晚间新闻》与百度合作,首次启用百度地图定位可视化大数据播报了国内春节人口迁徙情况。这个报道建立在百度推出的人口迁徙大数据项目上。“百度地图春节人口迁徙大数据”(简称“百度迁徙”)。利用百度后台每天数十亿次LBS(基于地理位置的服务)定位数据进行计算分析,展现了春节前后人口大迁徙的轨迹与特征。

海量的语音数据可以帮助年轻的父母们听懂孩子的哭声。百度大数据技术可以把中文语音转换成中文的文字。在把海量的婴儿声纹上传到大数据中心提取特征之后,年轻父母在录下婴儿哭声上网比对,就可以知道孩子因为什么哭:是饿了,还是只想撒撒娇。

在吊足了业界胃口之后,百度依然面临一个问题:在各家都在兜售自己的云和大数据的时候,百度应该怎样使自己脱颖而出?接管行业甚至政府数据,是百度大数据战略的下一步。针对这一方向,百度的策略是:软硬兼施。

最近,百度宣布正式发布大数据引擎,将包括开放云、数据工厂、百度大脑三大组件在内的核心大数据能力开放,通过大数据引擎向外界提供大数据存储、分析及挖掘的技术能力,这也是全球首个开放大数据引擎。

“百度开放云”是大数据引擎运行的基础构件,通过分布各地的百度新一代高效能数据中心为传统行业提供超大规模的数据存储和分布式计算。在此基础上,“数据工厂”对行业数据进行一系列规范化处理,提供强大的数据管理和分析能力。更上一层,则是百度人工智能的精华——“百度大脑(Baidu Brain)”,基于百度深度学习研究院的领先成果,

按照百度的说法,百度大脑融合了全球领先的深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了无时无刻都在学习与成长,它拥有200亿个参数,构造起世界上最大的深度神经网络。

因为数据无法互联互通,不少机构、传统企业甚至政府部门正在成为一个个数据孤岛,其数据存储与管理的规模、数据分析挖掘以及智能化能力也处在从数据累积的量变过程转化为“数据智能”质变过程的临界点上。

百度也需要前者的数据。这家公司需要把各个行业存在本地的所谓小数据通过百度云和数据工厂处理变成大数据,以丰富自己的数据库资源,通过机器学习,使自身的数据库更为智能和精准。

从可行性上看,制造业、交通管理部门甚至餐馆服务业,都因摄像头设备而产生各种各样的视频。但这些行业和部门没有更多的技术对这些视频进行解构和识别,以便于检索和分析。比如在交通行业,各个监控路口的摄像头24小时监控着各个路段的交通流量。通过百度地图大数据和搜索大数据的建模分析,百度大数据引擎可以提供出行趋势预测。此外,移动互联网时代,手机(尤其是定位器和照相机功能)、移动传感器、可穿戴设备等各种移动设备也产生了丰富而多样的数据。

但是百度需要强化自己对硬件的控制力。今年3月,“百度智能硬件品牌日”正式上线京东商城。此次上线的百度旗下智能硬件产品,涉及家庭娱乐、运动健康、视频安防、车载导航等多个领域。

上述传统行业是百度必须拿下的市场,不少行业的单行业产值都在万亿级以上。目前的消息是,百度大数据引擎将逐步开放,当下先采取邀请制和免费模式,在政府、NGO、制造、医疗、金融、零售、娱乐、教育等传统领域率先开展项目合作。

哪些行业会接受百度抛来的橄榄枝呢?

一个可以确定的消息是,北京交通运输管理部门的部分应用正计划迁移至百度开放云平台,利用大数据引擎对行业监测数据进行挖掘分析。

猜你喜欢

引擎百度大脑
Robust adaptive UKF based on SVR for inertial based integrated navigation
百度年度热搜榜
蓝谷: “涉蓝”新引擎
无形的引擎
百度医生
基于Cocos2d引擎的PuzzleGame开发
百度“放卫星”,有没有可能?
One Engine Left只剩下一个引擎