聚色
探花 偷拍 你的位置:聚色 > 探花 偷拍 >

杉原杏璃ed2k 知识图谱初步学习(一)——实质+Protege生手学习_知识图谱实质

发布日期:2024-09-14 16:59    点击次数:173

杉原杏璃ed2k 知识图谱初步学习(一)——实质+Protege生手学习_知识图谱实质

起首:CSDN网址:https://www.sibida.vip/article/103359标签:知识图谱,Protege,实质保藏:株野作家:微莱羽墨日历:2023/07/12著述目次

绪言(实质详解)杉原杏璃ed2k

1.实质成见

2.实质分类

3.实质组成

4.实质构建方法

5.实质构建的原则

6.实质应用

一、protege简介

二、软件使用要领

1.装配

2.使用

3.案例

三、问题措置有计算汇总

绪言(实质详解)

在运行学习知识图谱的历程中,起初即是要了解什么是实质(ontology)。

1.实质成见

实质的成见起初源自于玄学领域,在玄学中的界说为“对寰宇上客不雅事物的系统刻画,即存在论”。玄学中的实质暖和的是客不雅现实的详细推行。而在设想机领域,实质是不错在语义的档次上来对知识进行刻画,不错看作念是某一个领域知识的通用模子。 在东谈主工智能界,最早给出实质界说的是Neches等东谈主,他们将实质界说为“给出组成计划领域词汇的基本术语和关系,以及行使这些术语和关系组成的规矩这些词汇外延的司法的界说”。 实质是从客不雅寰宇中详细出来的一个成见模子,这个模子包含了某个学科领域内的基本术语和术语之间的关系(或者称为成见以及成见之间的关系)。

简而言之,实质是分享成见模子的格式化、模范、明确的发挥。这个界说包含了四个方面:分享(share)、成见化(Conceptualization)、格式化(Formal)、明确(Explicit),底下对这4个永诀先容:

分享:所体现的知识是被巨匠齐招供的,是这个领域公认的术语组成的汇聚。

成见化:指实质对事物的刻画所酿成了一组组的成见。

明确性:指实质中的术语、属性和定理齐是有明确的界说,不是拖泥带水的。

格式化:指实质八成被设想机可读,八成被设想机所处理。

瑶瑶系列2.实质分类

实质最常见的分类是凭证实质的应用主题来进行分类,通常分为以下5类:领域实质、通用/知识实质、言语学实质、任务实质和知识实质。依据实质的档次和领域依赖度,Guarino等东谈主将其分为4类:顶层实质、领域实质、任务实质和应用实质。

顶层实质:参谋通用的成见以及成见之间的关系,如空间、时间、事件、行动等,与具体的应用无关,澈底零丁于截止的领域,因此不错在较大范围内进行分享。

领域实质:参谋的是特定领域内成见及成见之间的关系。

任务实质:界说一些通用任务或者计划的推理举止,用来抒发具体任务内的成见及成见之间关系。

应用实质:用来刻画一些特定的应用,既不错援用领域实质中特定的成见,又不错援用任务实质中出现的成见。 四者关系如图:

图片

3.实质组成

一个实质大部分由类(成见)(class)、关系(relations)、函数(function)、公理(axioms)和实例(instances)五种元素组成。

类/成见(class):汇聚(sets)、成见、对象类型或者说事物的种类,如大学、电影、东谈主等。

关系(relations):类与个体之间的相互关联所可能具有的方式,即用于刻画类(成见)之间的关系,如part-of、kind-of等。四种基本关系如下:

图片

函数(function):在声明语句当中,可用来代替具体术语的特定关系所组成的复杂结构。函数是一类突出的关系,在这种关系中前n-1个元素不错唯独决定第n个元素,如father-of关系即是一个函数,father-of(x,y)示意y是x的父亲,x不错唯独敬佩它的父亲y;

公理(axioms):公理代表实质内存在的事实,不错对实质内类或者关系进行敛迹,如成见甲属于成见乙的范围。选择特定逻辑格式的断言(包括司法在内)所共同组成的即是其实质在相应应用领域当中所刻画的通盘表面。这种界说有别于产生式语法和格式逻辑当中所说的“公理”。在这些学科当中,公理之中只是包括那些被断言为先验知识的声明。就这里的用法而言,“公理”之中还包括依据公理型声明所推导得出的表面。

实例(个体):基础的或者说“底层的”对象。 除此除外还包括以下几个部分:

敛迹(适度):选择格式化方式所声明的,对于秉承某项断言算作输入而必须树立的情况的刻画。

司法:用于刻画不错依据特定格式的某项断言所八成得出的逻辑扩充的杉原杏璃ed2k,if-then(前因-后果)式语句格式的声明。

属性:对象(和类)所可能具有的属性、特征、秉性、特色和参数。

事件(玄学):属性或关系的变化。

4.实质构建方法

W3C推选的实质刻画言语主要有RDF(资源刻画框架 Resource Description Framework)、RDFS(RDF词汇刻画言语RDF Schem)和OWL(Web实质言语Web Ontology Language)三种言语。

RDF: 客不雅寰宇中任何一种关系齐不错用一个三元组(主体/主语、谓语、客体/宾语)来进行抒发。RDF用于刻画web上的资源,是使用XML言语编写、设想机可读的,不是为了向用户展示。RDF使用web记号符(主体/主语)来符号资源,使用属性(谓语)和属性值(客体/宾语)来刻画资源。这里的资源、属性和属性值就组成了一个酬报(或者被称为酬报中的主体、谓语和客体)。 RDF是1997年10月W3C 发布的草案。RDF 的设想场地是通过对一般兴味兴味上的语义、语法和结构的复旧,提供在各式不同的元数据体系之间的互操作性。RDF自己唯独很少的语义界说元素,而是只提供一种框架体系,使不同的用户或团体八成在这一框架下应用他们我方的元数据元素。 RDF基本的数据模子由三种对象类型组成: (1)资源(resource): RDF 表述的所有事物齐被称为资源。 (2)属性(properties): 刻画资源的具体方面。秉性或相互关系等。 (3)声明(statement): 一个有属性偏执值的特定资源称为RDF声明。

RDFS: RDFS是在RDF基础上对其进行膨胀而酿成的实质言语,措置了RDF模子原有的污点,界说了类、属性、属性值来刻画客不雅寰宇,而况通过界说域和值域来敛迹资源,愈加形象化抒发了知识。

OWL: 用来对实质进行语义刻画。 细粒度的汉文领域实质建议采纳OWL进行刻画了汇聚实质言语OWL (Web Ontology Language) 是收尾语义Web的中枢言语器用,它为汇聚实质的构建提供了丰富的建模原语。 其保持了原有RDF、RDFS的兼容性,有保证率较好的语义抒发智商,OWL实质中有3种基本元素:类、属性和实例。凭证抒发智商的递加规矩OWL分为三种子言语:

OWL-Lite:用于提供给那些只需要一个分类档次和浅陋敛迹的用户。抒发智商最弱。

OWL-DL:(Description Logic,刻画逻辑) 复旧那些需要最强抒发智商的推理系统的用户, OWL-DL旨在复旧已有的刻画逻辑交易处理和具有邃密设想性质的推理系统。

OWL-Full: 复旧那些需要尽管莫得可设想性保证,但有最强的抒发智商和澈底目田的RDF语法的用户。 三者关系如图:

图片

先容完实质之后,若何构建实质呢,就要用到protege这个软件。5.实质构建的原则

自问题域和具体工程的探讨,构造实质的历程亦然各不交流的。由于莫得一个尺度的实质构造方法,不少参谋东谈主员出于辅导诱惑实质的场地,从实践启航,淡薄了不少有利于构造实质的尺度。底下列举一些在实践中被解释比拟有用的实质构建准则。

明晰性和客不雅性(Clarity and Objectivity):实质应该通过客不雅界说和当然言语文档对所界说的术语给出明确的、客不雅的语义界说。

澈底性(Completeness):实质所给出的术语界说是完好的,澈底能抒发所刻画术语的含义。

一致性(Coherence):由术语得出的扩充与术语自己的含义是相容的,即复旧与其界说相一致的推理,不会产生矛盾;所界说的公理以及用当然言语进行发挥的文档也应该具有一致性。

最大单调可膨胀性(Maximum Monotonic Extendibility):向实质中添加通用或专用的术语时,不需要修改其已有的成见界说和内容,复旧在已有的成见基础上界说新术语。

最小实质欢喜(Minimal Ontological Commitments):实质商定应该最小,对待建模对象应给出尽可能少的敛迹。而所谓的欢喜,在实质中指的是对如缘何一致的、相容的方式使用分享词汇所达成的共鸣。一般地,实质商定只须八成得志特定的知识分享需求即可,这不错通过界说敛迹最弱的公理以及只界说交流所需的词汇来保证。

实质刻画原则(Ontological Distinction Principle):实质中的类应该是互不相交的。

成见档次各样化(Diversification of hierarchies)增强多秉承机制的智商。

模块化设想(Modularity)以最小化模块化之间的耦合度。

语义距离最小化(Minimization of the semantic distance):伯仲成见之间的语义距离最小化,尽可能把含义雷同的成见详细出来,用交流的元语来示意。

定名尺度化(Standardization of names):尽可能使用尺度的名字。 这十条构建准则给出了构造实质的基本想路和框架,可是,显然的不及之处即是它们所反应的内容绝顶笼统且难于把抓。

6.实质应用

目下,国表里对于实质论的参谋平庸应用于知识料理、信息抽取、当然言语的处 理、信息系统的集成以及语义 Web 等。参谋多蚁集于以下方面: ① 信息检索。刻下主流的信息检索多是基于关节词的搜索,带来的径直问题就 是会产生好多的不消信息,严重影响了检索的收场。实质因其具有邃密的成见档次关系和逻辑推理功能,不错在语义层面上排斥信息的冗余,提高搜索收场。 ② 信息抽取。传统的信息抽取技巧尽管能索要出信息实体,但不成判别信息实 体间的分类与非分类关系。 应用了实质的信息抽取技巧能有用地晋升实体间分类与层 次关系,提高信息抽取的可用性。 ③ 信息系统间的互操作。目下存在于分散式汇聚环境下的信息系统,所靠近的 主要问题即是各系统间的不兼容性,其中枢问题即是异构问题。实质算作成见间的规 范发挥,八成从语法、模式及语义层面上措置特定领域的异构问题,从而为信息系统 的大鸿沟和会提供可能的措置有计算。 ④ 语义 Web 功绩。传统的语义 Web 对语义的操作智商有限,对功绩的实践效 果产生根底的影响。实质表面算作语义网体系的中枢层,提供共同的成见体系尺度, 晋升设想机的可和会性,提高语义 Web 的功绩性能。

一、protege简介

起首:Protégé软件是斯坦福大学医学院生物信息参谋中心基于Java言语诱惑的实质裁剪和知识取得软件,或者说是实质诱惑器用,亦然基于知识的裁剪器,属于绽开源代码软件。

用途:这个软件主要用于语义网中实质的构建,是语义网中实质构建的中枢诱惑器用,当今的最新版块为5.5.0版块。 提供了实质成见类,关系,属性和实例的构建,而况屏蔽了具体的实质刻画言语,用户只需在成见档次上进行领域实质模子的构建。

二、软件使用要领1.装配

起初参加官方下载地址https://protege.stanford.edu/products.php,凭证电脑的系统下载相应的版块,一般齐是下载最新版块的。如下图:

图片

下载之后解压缩得到以下文献夹,再找到后缀名为.exe的可实践文献双击掀开,按照领导径直下一步即可装配完毕啦。

图片

装配完成掀开软件,有些tabs默许莫得裸露,在window里面不错找到,如图:

图片

2.使用

各tab的含义及作用如下:

Activeontology是裸露刻下的实体称号,以URI的格式裸露,前边是www.semanticweb.org背面随着主机名(我的主机称号为dell),再背面是默许的凭证时间定名实体。

Entities,不错看作是实体的总览,八成看到咱们创建实体的一些主要信息,是对实体信息的汇总。

Classes,是对实质模子中,类型部分的裁剪,八成界说类之间的档次关系,相互之间的关系。

Object properties,物体关系,不错和会为裁剪实体外部的关系,也即是实体和实体之间的关系。

Data properties,数据属性,不错和会为裁剪实体里面的属性,用来界说实体自己所具有的属性以及属性值。

Annotation Properties,标注属性,是w3c界说的一些常用的属性,凭证URI不错看到这些属性的具体发挥。

Individuals by class,凭证类型创建的实例,用来裁剪实例信息,访佛于java步履中的对象,要归于某个类别。

OntoGraf,实质关系图,用来展示咱们创建的实质里面各个实体之间的档次关系。

SPARQL Query,SPARQL查询,使用SPARQL言语,对创建的实质进行查询,取得查询收场。

图片

改正:ObjectProperty (对象属性),link an individual to an individual(实体和实体之间的关系) DatatypeProperty(数据属性) , link an individual to the data(实例的数据)

对象属性和数据属性的界说不错这样和会:假如有-对配偶小红和小绿,那么咱们不错先界说两个类一男东谈主、女东谈主;小红是类"女东谈主”的一个实例,小绿是类"男东谈主"的一个实例。之后咱们不错界说小红和小绿之间的配偶关系,这个关系即是对象属性"配偶"。同期咱们又知谈小红本年30岁,那么咱们不错界说小红的一个数据属性"年齿",属性值是"30"。

3.案例

以下图为例子,用protege创建文献实质。

图片

(1)创建模子层数据

实质分为模子层和数据层,模子层主要界说类和类之间的关系。Thing是所有类型的根节点,也即是基类,所有的类型齐是从Thing派生出来的。 在父类底下创建子类需要先选中父类,再按住快捷键ctrl+E创建新的子类,先创建内容、载体、言语、格式这是个大类,接着再创建各自的小类。如下图:

图片

批量加入子类要领如下:

图片

图片

(2)不错为实体之间添加关系 举例汉语与英语是互斥的关系,不错在class底下添加disjoint with(与…不相交)选拔英语。

图片

(3)创建实体关系

创建实体之间的关系,在Object Properties这个tab页面。裁剪方法和添加类型的tab页面访佛,最顶层的实体关系为owl:topObjectProperty,选拔后,点击器用栏的按钮或者右键选拔add sub-properties,添加使用这个关系。对于“使用”这个关系,Domains选拔内容,Ranges选拔言语,代表三元组中主语是内容,谓语是使用,宾语是言语,组成的三元组即是内容使用言语。

图片

(4)创建实体属性

创建实体的属性,在Data properties这个tab页面。添加属性后,在Built in datatypes中选拔xsd:string,示意属性值类型是个字符串。

图片

(5)创建实例 创建实质的实例,在Individuals by class这个tab页面。这里我的案例莫得用到这个,下次换一个案例试试。

(6)实质展示 终末不错点击OntoGraf来展示咱们的实质啦,点击上方按钮会用不同方式来裸露关系图。

图片

动图如下,太道理了吧~

图片

三、问题措置有计算汇总

暂时刚初学,后续遭受问题再进行汇总。

完资实质构建若何保存? 第一次使用我莫得找到保存的按钮,认为是自动保存的,收场第二次看莫得了,此次长记性了,以后一定要谨记保存!!!保存的要领如下: (1)点击new新建文献,裁剪完成之后点击save as,如下图:

图片

(2)点击阐发

图片

(3)选拔存储旅途,点击保存

图片

(4)下次掀开这里会有纪录哒。

图片

部老实容参考博客:1.https://blog.csdn.net/cooldream2009/article/details/97657836 2.https://blog.csdn.net/baijinswpu/article/details/81113314杉原杏璃ed2k

本站仅提供存储功绩,所有内容均由用户发布,如发现存害或侵权内容,请点击举报。

Powered by 聚色 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024