APP下载

语义网介绍及体系结构分析

2015-03-04张海亮

声屏世界 2015年13期
关键词:网页语法语义

□张海亮

随着网络的迅猛发展,网页上的信息成指数增长,网页已经成为最主要的信息交流渠道。由于HTML 本身的局限性而导致网页上缺乏足够的语义信息,难以实现WEB 信息的自动化处理,因此WWW、HTTP 和HTML的创始人Tim Berners-Lee 在一般万维网的基础上提出了语义网的概念,从而大大改进了人类思维和机器思维之间的差异,提高了机器自动处理网络上信息的能力。

语义网是对未来网络的一个设想,现在与WEB 3.0 这一概念结合在一起,是3.0 网络时代的特征之一。简单地说,语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使交流变得更有效率和价值。语义网和人工智能中的语义网络是两个不同的概念,所以它采用的方法与自然语言处理不同。它对现有的WEB 进行了语义扩展,从而使其上面的信息能够被计算机理解和处理,从功能上看它将是一个能够“理解”人类信息的智能网络。

在其体系结构中,第一层是Unicode(统一编码)和URI,它是整个语义网的基础。Unicode 是处理资源的编码,URI 负责标识资源;第二层是XML+名空间+XML 模式,用于表示数据的内容和结构;第三层是RDF 和RDF 模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间的联系;第五层是逻辑,在前面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。其中,第二、三、四层是一个语义网的关键层,用于表示WEB 信息的语义,也是现在语义网研究的热点所在。可扩展标记语言XML 让每个人都能创建自己的信息标签,来对网页或页面的部分文字进行注释。资源描述框架RDF的基本结构是对象、属性和值所组成的三元组,也就相当于一个句子中的主语,动词和宾语。这些三元组可以用XML 语法来表示。用这种结构描述并由机器处理大量数据,是非常自然的方法。RDF 模式是一个描述RDF 资源的属性(Property)和类(Class)的词汇表,提供了关于这些属性和类的层次结构的语义。

语义到底是指什么?我们可以将语义简单地看作是数据(符号)所代表的概念的含义,以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。以关系数据库为例,数据库中的数据可以简单地存储在一张张表中,例如我们将学生基本信息存入到一张“学生”表中。这时,对于表中的每一列数据所构成的集合,其所隐含的意思就是该列数据所要表达的对应的概念,这个概念往往体现为设计人员对该列数据对应的属性所给定的名称,例如“姓名”“性别”等。这些属性之间的关系就相当于数据对应的概念之间所存在的关系,它们都是学生这个实体的属性。数据库表中的属性和关系都可以看作数据的语义信息。

在了解了什么是语义之后,让我们来进一步讨论语法和语义在数据描述和交换中的作用。对于人类来说,我们可以通过相同的语言进行交互,交互双方以他们共同遵守的语言组织规律(相当于语法)对所要表达的信息含义(相当于语义)进行组织才能使对方理解。人与人之间信息的传递并不需要非常严格的语法,即便是对方在语言表达上存在着一定的错误,我们仍然可以理解对方想要表达的意思。但对于计算机之间的信息交换来说,语法与语义缺一不可。数据正确的语法表达是保证计算机之间能够进行信息交换和处理的前提,而数据语义的描述则是数据可被计算机正确理解和推理的基础。

信息的语法描述是有差异的,我们往往通过必要的数据格式转化让目标应用能够处理,理想的情况应该是所有的信息都采用同样的语法来描述。XML的出现使得不同类型的数据表示成同一格式成为可能。XML 已经成为WEB 上数据表示和交换的事实标准,是应用之间或者机器之间共享数据的一种有效方式。但是XML 除了给我们提供了一个可以被应用自动化读取的格式外,并不能进一步促进数据交换的自动化,我们还需要通过专用的程序来对XML 数据进行解释,以获取目标应用能够处理的数据。

XML 存在的问题是XML 不具备语义描述能力,因此万维网联盟推荐以RDF 标准来解决XML的语义局限。RDF 提出了一个简单的模型用来表示任意类型的数据。这个数据类型由节点和节点之间带有标记的连接弧所组成,节点用来表示WEB 上的资源,弧用来表示这些资源的属性。因此,这个数据模型可以方便地描述对象以及它们之间关系。

RDF 和XML 是互为补充的。首先,RDF 希望以一种标准化、互操作的方式来规范XML的语义。通过引用RDF,XML的解析过程与解释过程可以相结合。也就是说,RDF 可以帮助解析器在阅读XML的同时,获得XML所要表达的主题和对象,并根据它们的关系进行推理,从而做出基于语义的判断。XML的使用可以提高WEB 数据基于关键词检索的精度,而RDF 与XML的结合则可以将WEB 数据的关键词检索推进到对象检索。其次,由于RDF 是以一种建模的方式来描述数据语义的,这使得RDF 可以不受具体语法表示的限制。

由于RDF的数据语义描述仍然可能存在语义冲突,所以我们在描述数据语义的时候可以通过引用本体的相关技术,对语义描述结果作进一步的约束,以消除语义冲突。RDF(Schema)在提供了简单的机器可理解语义模型的同时,为领域化的Ontology 语言提供了建模基础,并使得基于RDF的应用可以方便地与这些Ontology 语言所生成的Ontology 进行合并。因此,RDF的这一特性使得基于RDF的语义描述结果具备了可以和更多的领域知识进行交互的能力。

[1]Tim Berners-Lee,endler J,Lassila O.The semantic WEB [J].Scientific American,2001,284(5):34-43.

[2]TimBerners-Lee.SemanticWEB-XML 2000-slide”Architecture”[EB/OL].http://www.w3.org/2000/Talks -xml2k -tbl/Overview.html.

[3]Dan Bricley,Guha R V.RDF vocabulary description language 1.0:RDF schema [EB/OL].2003.http://www.w3.org/TR/2003/WDrdf-schema-20030123/.

[4]Asunción Gómez-Pérez,Mariano Ferná-nedz-López,Oscar Corcho.Ontological Engiceering [M].Springer,2003,5-25,230-240.

猜你喜欢

网页语法语义
语言与语义
跟踪导练(二)4
基于CSS的网页导航栏的设计
Book 5 Unit 1~Unit 3语法巩固练习
基于URL和网页类型的网页信息采集研究
“上”与“下”语义的不对称性及其认知阐释
网页制作在英语教学中的应用
认知范畴模糊与语义模糊
10个必知的网页设计术语
语义分析与汉俄副名组合