APP下载

破译百度“框计算”的“达芬奇密码”

2009-11-19

软件工程 2009年9期
关键词:图形界面语词后台

顺 风

8月18日,在“百度技术创新大会”上,百度CEO李彦宏首次对外公布了“框计算”平台的理念和构想。该平台以百度的搜索框为核心,用户只需要输入服务需求,系统就能明确识别这种需求,并将需求分配给最优应用或内容资源提供商处理,最终返回给用户相匹配的结果。本文对百度“框计算”进行了全面深入地剖析,并首次提出“智能机”的概念,并预测这将是继“上网本”之后未来PC的重要趋势。

“框计算”带来人机界面的革命

李彦宏说,“‘框计算对于老百姓的意义就是说,未来你打开电脑,一秒钟就可以看到一个框,而且电脑的屏幕就只有这么一个框,你不管干什么,你告诉这个框,完全用自己的语言告诉它就可以,你不需要学习一个新的操作系统,不需要有各种各样复杂的语法。”

从这个“框”,已经可以看出未来智能化的人机界面,这个界面为未来的语音界面打下了基础。语音界面肯定是要替代Windows图形界面的。现有图形界面的输入和输出主要是靠键盘。从纯粹的图形界面转向语音输入图形输出,从纯粹的图形界面向语音输入和输出,这两种转变需要有语音介入的人机对话,从技术上不难实现。

这两种界面组合的实现,是一种巨大的飞跃。而这种飞跃需要做两件事:一是底层的后台的智能系统,二是语音转化。笔者相信,后者是水到渠成的,这是系统的创新。前者是这种革命性转变的核心任务。这需要做长期的探索和积累,需要做好知识储备。百度长期积累的中文分词技术是具有核心商业价值的,现在又开始做界面升级的创新,百度将具有先发优势。“框计算”奠定了新的人机界面的基础。如果百度充分认识到这一点,“框计算”的未来会走得更好。如果微软认识到这一点,必然会采取应对措施。

“框计算”是搜索的更高级形态

百度的“框计算”是在“框”(搜索框)的简易入口基础上发展出一系列的后台的智能化处理的新搜索。“框计算”必须具备两个基础条件:一是对用户意图的具体分析,这实则是需要建立一个百度的局部语义网;二是做好后台的智能化匹配。这两个条件明显反映出,“框计算”与原来的搜索不是一回事,这是一种更高级的搜索形态,是智能化的搜索。

传统搜索引擎的原理是利用被称为网络蜘蛛(Spider)的自动搜索机器人程序来连接每一个网页上的超链接而搜集信息,然后保存搜集的信息并进行整理和建立索引,最后接受用户查询并向用户输出信息。现在“框计算”是围绕用户的需求给出最终答案,这就是一种更高级的新的搜索形态。

传统的搜索引擎在输出结果时会有“排序”的重要环节,而“框计算”则不再存在“排序”的必要性。在“框计算”的后台具有很强大的自组织能力,能够甄别出信息的重要性、相关性、完整性等,这都是在后台完成的,是一项庞大的工程。

“框计算”的索引将发生两个转变。第一,“框计算”在建立索引时,将从单索引向双索引转变,同时还将新建立一个答案库。“框计算”的索引实际是二次索引,纳米化的索引。传统的搜索以语词为索引并且是单向的索引,现在仅仅依靠语词索引已经不够了,语词本身就是很复杂、庞大的。“框计算”在利用现有的语词库的基础上再建立一个“答案库”,也就是维基(wiki)化的搜索。“框计算”对索引进行了一次叠加比对处理,是“或”和“且”的关系,这里有一系列复杂的处理。“框计算”从单索引向双索引转变,建立答案库,将会需要引用很多的维基和知识问答网站,尤其会整合百度百科和百度知道。

第二,“框计算”在建立索引时,将更多地增加“人机协同”的成分。“框计算”的索引是建立在百度知道的基础上,这个索引库有些部分具有人工的构成,因此,“框计算”在响应用户查询时,不再是传统搜索那种由机器完成,也不纯粹是由人工完成,而是由机器和人工共同作出的综合响应。“框计算”是人机协同的系统。根据百度“框计算”官方网页披露的“框计算”技术架构显示,在分析用户需求时使用了语义分析、行为分析、智能人机交互、海量计算。在这个过程中,就增加了“人机协同”。人的成分包括传统搜索的核心技术分词技术,“框计算”还将深入地把握在哪些关键领域和环节需要有人的接手,比如从搜索引擎的现有信息库中找不到答案,这时,就需要有人工的加入。

“框计算”的“框”是语法框

“框计算”让笔者想起了生活搜索——结构化的搜索。“框计算”就是框架搜索,也就是结构化的搜索。百度的“框计算”就是要对用户需求进行语义分析,否则肯定不能实现从“反馈信息”向“告诉答案”的转变。

“框计算”的“框”实际是语法框。搜索一般是“谓宾结构”,如哪里可以买到二手自行车、火车站在哪里;“是”和“不是”也是一种“谓宾结构”;所有的搜索其实都隐藏了一个“问”字,只给用户显示了一个搜索框。当然,语法框内也会出现定语、状语、补语,以及主语。

人的需求往往都跟动作有关,工作、学习、恋爱、交往等人在生存中的动作行为都必然可以作为谓语。框中的某一个语法项就是谓语项。框计算的“谓语项”要建立一个库,就是把汉语中的所有的动词建立一个库,并且把同义词、近义词进行分析、“合并同类项”,这样就建立了一个语法结构的索引库。所有的宾语、状语、定语放在一起,而且可以有好几种排列组合,在用户输入的时候,百度需要完成智能化的分析。“框计算”的秘密就是:框是建立在语法库的基础上的索引库的“理解”。百度把最常用的语词已经在后台储备好,它往往是一次性的。而任意取几个语词组合,维基上查不到,就需要人工的参与。首先在百度知道里找问过相关语词的问题,如果百度知道里有这样的问题,就会立刻把百度知道的答案头一个反馈给用户。

此外结构化的知识库如火车车次价格、租房信息等,这种知识库是非常有限的。语法框引导的结构化搜索就是对输入、输出、后台都要结构化。传统的搜索只有后台结构化,而现在搜索的“头”和“尾”都结构化了。智能化就是对话,所有的一切都是在语法的前提下实现的。

语法框是可以扩展、排列组合的。搜索库一般是矩阵式的,可扩展的,现在在框里也是可以扩展的。语法框的结构是可以叠加的,可以进行逻辑处理的。如果发展得更好,可能会引入数理结构。语法框里可以加入很多注释、补充、约束性的条件,这些注释以后可以成为标准语言。从这个角度看,语法框是传统结构化的升级版。

“框计算”迎来智能机时代

李彦宏表示,未来上网的需求都可以通过这个“框”来实现,今后打开电脑或许不再需要经过打开操作系统、打开浏览器、登录百度网页这样的程序,而是在打开电脑或手机之后,就可以直接利用“框”实现各种应用。

通过“框”可以进入各种应用,如文字处理、影音播放、排版、游戏等,通过“框”可以完成多项任务,这给人的启示是,事实上这个“框”已经在改变现有的操作系统的架构:“框”已经代替了开始菜单。“框”对用户的需求结构化,菜单就是将不通的运用的结构化。在“框”里面就可以实现这种结构化,如在“框”的右侧就可以弹出让用户选择进入。把搜索人、搜索事物进一步诠释就是对话,这是最基本的对话。操作系统在中英文输入、对运用进行选择,这也是最基本的人机对话。所以说,“框”成为操作系统不是危言耸听。现在已经可以整合各种应用,要发展出一个全新的操作系统,技术上不存在障碍。

在操作系统上增加了智能化,对Windows而言,“框”带来的操作系统就是有生命的“Windows”。有生命的“Windows”包括技术层面的底层的“Windows”和智能化的构成。两者一结合,就是智能化的操作系统。安装智能操作系统的PC不再遥远,可以说,“智能机”的时代,必然来临。

“框计算”与“云计算”不具备可比性。“云计算”是对用户资源、对储备资源的分享,改变了互联网的宏观结构;而“框计算”改变了互联网和操作系统的结构,增加了一个计算和互联网中的智能构成成分在互联网和操作系统的构成。

猜你喜欢

图形界面语词后台
Epigallocatechin-3-gallate exerts antihypertensive effects and improves endothelial function in spontaneously hypertensive rats
你是那样美 唐心语词
《老子》“自”类语词哲学范畴释要
后台暗恋
用VMRun快速置备千台虚拟机
前台、后台精彩花絮停不了
从文化理据看英汉语词翻译
以“后台”的名义节省电池用量
电力调度中后台监控系统的应用
基于数据驱动的图形界面开发方案