生物领域本体库构建研究

时间:2022-07-27 08:48:00

生物领域本体库构建研究

1本体技术概述

1.1领域本体概念。最早关于本体概念的阐述出现于哲学研究领域,后来才逐渐出现在计算机学科领域。目前研究者公认的关于本体的概念是“本体是共享概念模型的明确形式化规范说明”,此定义由Gruber给出[1]。领域本体是专业性的本体,描述的是特定领域中的概念和概念之间的关系,提供了某个专业学科领域中概念的词表以及概念间的关系。1.2本体构建原则。本体的构建原则为“完全性、一致性、层次变化性、最大单调可扩展性、最小本体化承诺、明确性和客观性、最小模块耦合、本体差别原则、同属性概念具有最小语义距离、命名尽可能标准化”。1.3本体构建方法。常用的本体构建方法大致有以下几种:Enterprise法、原型法、Tove法、骨架法、Methontology法和七步法等。1.4本体描述语言。本体描述语言有:Ontolingua、Flogic、OCML、LOOM、Cycl、XOL、SHOE、OWL、RDFS、OIL、DAML+OIL等。1.5本体构建工具本体构建工具中,用于可视化构建的工具有:Apollo、OntoEdit、WebOnto、Protégé、WebODE等。其中较为广泛使用的构建工具为Protégé,它是一款图形化的工具,优点是简单、操作方便、上手容易,并且对模块化的设计也能够提供支持。

2构建初中生物领域本体库

2.1本体术语提取。以《中图分类主题词表》及《初中生物.人民出版社》的体系结构为依据,抽取出描述生物知识的概念分支,并将这些分支概念进一步细化为更小的概念。根据上述方法,以人教版七年级生物上册为例,提取出初中生物领域的术语(部分)为:生物、生物圈、生态系统、食物链、食物网、生产者、消费者、植物器官、营养器官、生殖器官、分生组织、保护组织、机械组织、输导组织、营养组织等。2.2本体类层次结构的建立。以人教版七年级生物上册为例,通过多方面渠道考察研究获得人教版七年级生物上册的相关信息资料,通过领域细分建立知识的分类体系。根据建好的类层次结构构建出对应的知识点本体。后续为其添加具体知识点所应具有的属性,例如知识点名称、知识概念所属章节、知识难度、知识目标等,最后添加具体的生物知识点实例。2.3关系标注。本体类之间的关系通过数据属性和对象属性来描述。对象属性分为两大类:“学习资源属性”和“知识点属性”。学习资源属性包含“作者姓名”、“出处”、“文件大小”等数据属性;“知识点属性”包含“学习目标”、“课时”、“难易程度”等。2.4形式化编码。最终将上述的初中生物本体通过形式化编码的方式建立好,部分形式化编码如下所示:<Ontologyxmlns="www.w3.org/2002/07/owl#"xml:base="www.semanticweb.org/123/ontologies/2017/11/untitled-ontology-21"xmlns:rdf="www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:xml="www.w3.org/XML/1998/namespace"<ClassIRI="#生物圈"/></Declaration><Declaration><ClassIRI="#专著"/></Declaration><Declaration><ClassIRI="#植物体的层次结构"/></Declaration>利用Protégé最后构建好的初中生物领域本体如下图1所示:

参考文献:

[1]姜颖,黄国彬.国外近两年有关本体研究的进展综述[J].图书馆学研究,2011(14).

[2]宋佳,陈玉华.本体构建及发展趋势研究[J].科技广场,2011(05):10-13.

[3]王雪,王儒敬,魏圆圆等.猪生产学本体构建的研究[J].江苏农业科学,2011,39(03):547-550.

[4]段宇锋,黄思思.本体构建方法研究[J].情报杂志,2015(11):139-144.

[5]张文秀,朱庆华.领域本体的构建方法研究[J].图书与情报,2011(01):16-19.

作者:李文涛 单位:云南师范大学信息学院