国内外重要的本体系统

2022-05-03 16:28:15   第一文档网     [ 字体: ] [ 阅读: ] [ 文档下载 ]
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。下载word有问题请添加QQ:admin处理,感谢您的支持与谅解。点击这里给我发消息

#第一文档网# 导语】以下是®第一文档网的小编为您整理的《国内外重要的本体系统》,欢迎阅读!
本体,国内外,重要,系统

国内外重要的本体系统

1. WordNet

WordNet是基于心理语言规则的英文词典,它以同义词集(Synsets)为单位组织信息,对查询结果的演绎比较符合人类思维定式。WordNe是由美国普林斯顿大学的心理词汇学家和语言专家米勒(MjllerGeorge A)以及他的研究小组于1985年着手构建的英语词汇知识库。目前已发展到WordNet3.0版,它的设计思路来源于心理语言学和人类词汇记忆的计算理论。迄今为止,被认为是计算语义学、文本分析等相关领域研究者可获取的最为重要的资源。

WordNet根据词条的意义将它们分组,每一个具有相同意义的字条组称为一个

synset(同义词集合)WordNet为每一个Synset提供了简短,概要的定义,并记录不同synset之间的语义关系。在WordNet中,名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集合之间也由各种关系连接。(个多义词将出现在它的每个意思的同义词集合中)。名词网络的主干是蕴涵关系的层次(上位/下位关系),它占据了关系中的将近80%。层次中的最顶层是11个抽象概念,称为基本类别始点(uniquebegirmers),例如实体(entity“有生命的或无生命的具体存在”),心理特征(psyehologiealfeature,生命有机体的精神上的特征)。名词层次中最深的层次是16个节点。

WordNet概念层次树

WordNet的顶层分类如图1所示,体现了最抽象概念间的包容关系。每一个WordNet类的含义,一方面由它在从抽象到具体的层次结构中的位置所决定,同时又由相关的公理来定义。



1 wordNet顶级分类

WordNet的根节点是Entity,它包括了一个领域中存在的万事万物,此概念又

包括PhysicalAbstract,前者包括在空间上和时间上占有一定位置的一切事物,而后者包括剩下的一切。

对于WordNet层次树中任一概念,可以得到这样一些信息:概念的描述性定义;概念的所有直接或间接的超类;概念的所有并列的类;概念的相关WordNet同义词集;念的相关函数、公理等。

WordNet可被看成是模块性的本体,所以它能被划分成几个域,如图2所示。




2 WordNet的构成

2. FrameNet

FrameNet是美国加州大学伯克利分校于1997年开始构建的基于真实语料库支持的计算机词典编撰工程。采用称为 Frame Semantics 的描述框架,提供很强的语义分析能力,目前发展为 FrameNetII

FrameNet的理论基础是框架语义学。该理论是由美国菲尔摩(Fillmore C.J.)提出的研究词语意义和句法结构意义的方法。菲尔摩从计算机科学中引入“框架”的概念,建立语义框架(semantic frame)词义是用框架来描写的。词语可以通过其所在的语言结构,按照一定的原则或方式选择和突出基本的语义框架的某些方面。框架语义学认为,要理解词语的意义,必须首先具备概念结构,即语义框架的知识,而这些知识通常同一些情境如相关实体、行为模式、社会制度背景等相关,如“hit”一词既可表示“击中”,又可表示“产生意外或不良的影响”如何区分其含义?一般来说,一个词的不同义项与该词所参与的不同语义框架相联 系。当一个词的词义是基于某一特定的框架时,我们则说该词激活了一个框架,因此,hit这个词可以在一定的上下文环境中激活一个“击中目标(hit-target)”框架,也可能在另外的上下文环境中激活一个具体的“引起伤害(cause-harm)”框架。要理解一个包含“hit”这个词的句子,要求考虑在给定的上下文环境中哪一个是与该词相应的框架。这种将词汇意义的描述同一定的语义框架相联系的方法,使得研究者从词汇层面进行概念抽象,将具有共同认知结构、支配相同类型的语义角色的一类词语集中用一个框架描述,同时构建框架与框架之 间的静态、动态的复杂关系。 3. Cyc

Cyc 是一个致力于将各个领域的本体及常识知识综合地集成在一起,并在此基础上实现知识推理的人工智能项目。其目标是使人工智能的应用能够以类似人类推理的方式工作。个项目是由Douglas Lenat1984年设立的,Cycorp公司开发并维护。该项目的一部分以OpenCyc形式发布,OpenCyc项目以开源许可的形式向开发者和使用者提供API,可下载的数据集(特别是为语义万维网实践者提供了OWL版本的数据集)等。

Cyc知识库中表示的知识一般形如每棵树都是植物植物最终都会死亡。当提出是否会死亡的问题时,推理引擎可以得到正确的结论,并回答该问题。该知识库中包含了320万条人类定义的断言,涉及30万个概念,15000个谓词。这些资源都采取CycL语言来进行描述,该语言采取谓词代数描述,语法上与Lisp程序设计语言类似。

目前Cyc项目大部分的工作仍然是以知识工程为基础的。大部分的事实是通过手工添加到知识库中,并在这些知识基础上进行高效推理的。最近Cycorp正致力于使Cyc系统能够和最终用户用自然语言进行交流,并通过具机器学习来辅助形成知识的工作。


4. SUMO Suggested Upper Merged Ontology

SUMO是由IEEE标准上层知识本体工作小组所建置的。这个工作小组的目的是发展标准的上层知识本体,这将促进数据互通性、信息搜寻和检索、自动推理和自然语言处理。上层的知识本体被限制在meta的概念、一般、抽象或者哲学,特殊领域具体的概念不被[3]包括在上层知识本体中,但是这样的知识本体确可提供特殊领域的知识本体结构的建立。SUMO希望藉由最高层次的知识本体,鼓励其他特殊领域知识本体以其为基础衍生出其他特殊领域的知识本体,并为一般多用途的术语提供定义。

建立SUMO是为了发展标准的上层知识本体SUO Standard Upper Ontology,促进数据共享性、信息检索、自动推理和自然语言处理的发展。

目前SUMO已经和英语词汇网络Wordnet1.6版本作初步的连结,一个SUMO概念会对应相关的wordnet同义词集。


本文来源:https://www.dywdw.cn/6cdacc5f58f5f61fb73666cd.html

相关推荐
推荐阅读