语义信息论文:小议语义的信息空间关系

时间:2022-01-28 02:58:39

语义信息论文:小议语义的信息空间关系

本文作者:刘伟顾和和工作单位:江苏师范大学测绘学院

地理信息语义分析与关系构建

地理信息除了在数据结构上存在异构,在语义上也存在异构。地理信息语义上的异构可以分为空间数据的异构和非空间数据的异构,以下分别对这两种语义异构进行讨论。2.1空间数据语义分析与空间关系构建地理信息中空间数据的语义关系在本文主要可分为以下3种。1)拓扑关系:本文中拓扑关系主要指地理对象间相离(DT)、相接(TO)、重叠(OV)、覆盖(CO)、包含(CT)、相等(EQ)、被覆盖(CB)、在内部(IN)八种关系。其中覆盖(CO)与被覆盖(CB),包含(CT)与在内部(IN)为逆反关系。2)方位关系:方位关系主要指一个地理实体相对于另一个地理实体的方向关系。众所周知的8个方位关系为:北(N)、西北(NW)、西(W)、西南(SW)、南(S)、东南(SE)、东(E)、东北(NE)。本文中以图形(像)中央的地理实体作为第一个起始位置来确定其它地理实体相对于此起始位置地理实体的方位关系;然后以第一个起始位置为圆心,在周围找一个地理实体作为参照,依此类推,确定地理实体之间的相互位置关系。如图1所示,首先选A作为第一个起始参照实体,建立其他地理实体与A地理实体的空间方位关系;然后在地理实体(F、G、H)中在选择一个作为下一个参照实体,本文依顺时针方向选择F作为第二个参照实体,建立其他地理实体(除去已经建立方位关系的A实体)与F地理实体之间的空间方位关系,依此类推,用同样的方法建立地理实体之间的空间方位关系。ABCDEGFHB/东北B/东B/东南B/南B/西南B/西B/西北B/北A北东南西北北南南西西东东东北西南东南西北东北西南图1地理实体的参照关系图2空间方位之间的推理关系在方位关系中,A实体和B实体的空间方位存在以下关系,如图2所示。①若B位于A的北方向,则A位于B的南方向;②若B位于A的西北方向,则A位于B的东南方向;③若B位于A的西方向,则A位于B的东方向;④若B位于A的西南方向,则A位于B的东北方向;⑤若B位于A的南方向,则A位于B的北方向;⑥若B位于A的东南方向,则A位于B的西北方向;⑦若B位于A的东方向,则A位于B的西方向;⑧若B位于A的东北方向,则A位于B的西南方向。以上方位关系在空间推理时会用到。用OWL建立其相互关系后,就可以用Jena(/)推理出相互关系。3)距离关系:通常人们用远、近、较远和较近等来形容两个地理实体之间的距离,但这样的形容不准确且容易引起歧义。本文中对于距离关系,我们采用对象质心之间的标准欧氏距离。针对上述空间数据的语义异构问题,我们提出用属性关系图(ARG)来描述地理实体及其空间关系信息。参照图3的图形和它的ARG,ARG的结点标有对象的标号。两个结点之间的边标有两个结点间的关系信息。结点N1与N2之间的边标有(N1,D,203,8.9,N2),这表明N1与N2之间的拓扑关系为相离(Disjoint),它们之间的角度为203˚(按照逆时针、结点下标递增顺序测量(结点下标递增顺序测量:假设N1为起始参照实体(可以是点或面中心),首先量算N1与N2、N3等的方位,然后是N2与N3、N4等的方位,依次类推,直至建立完整的方位关系。)),它们之间的距离为8.9个单位。N1N2N3N1N2N3AGR(N2,CO,315,2.3,N3)(N1,D,203,8.9,N2)(N1,D,274,10.7,N3)(N1,D,D,SW,SW,8.9,10.7,N2,CO,SE,2.3,N3)特征点图3图形与其属性关系图ARG的映射过程为每幅图形创建ARG之后,ARG要映射到特征空间的一个多维点,特征空间中的点按照某种预先指定的顺序进行组织(本文中以中央地理实体为第一个起始参照实体)。首先是第一个地理实体,其后是该地理实体与所有其它地理实体之间的关系;然后是第二个地理实体以及第二个地理实体与随后所有地理实体间的关系,依此类推,直至建立完整的ARG。在这个阶段,对象之间的方位角也转换为方位谓词。如图3,N1与N2之间的角度203˚就映射为西南方位(SW)。2.2非空间数据语义分析与关系构建非空间数据中的语义异构主要由于人们对同一或相同类的地理实体在表述概念上存在差异,如对于南京,有人称之为金陵,又有人称之为石头城;而一些国家地理划分中的州在中国等同于省的概念。非空间数据中表示相等或相似的语义关系又称为同主体语义关系。非空间数据的语义异构一般分为以下两种:异形同义词,既不同的词汇表达同一个含义,如南京,又可称为金陵或石头城;同形异义词,即同一个词汇表达不同的含义。其中同形异义词间的关系可以用OWL中的以下语义标签描述:differentFrom(个体不同),两个个体可以显式声明为不同;allDifferent(全不同)和distinctMembers(不同成员),这两个词配合使用表示一定数量的个体两两不同。异形同义词的关系可以用以下标签描述:equivalentClass(等价类),两个类可以声明为等价,即使它们尽管名字不同,但拥有相同的实例,等价类可以用来创建同义类;sameAs(个体相同),两个个体可以声明为相同,用它可以创建一系列指向同一个个体的不同名字。对于一些属性关系可以用equivalentProperty(等价属性),inverseOf(逆反属性),TransitiveProperty(传递属性),SymmetricProperty(对称属性),FunctionalProperty(函数属性),inverseFunctionalProperty(反函数属性)等来描述。在建立非空间数据的语义关系时,本文按照ARG中地理实体出现的顺序构建非空间数据语义关系,这样便于利用第3部分的算法自动生成应用本体实例。

数据提取与本体实例生成

分别建立起空间数据的属性关系图ARG和非空间数据的语义关系后,可以参照图4所示的应用本体实例生成算法AOGA自动生成应用本体实例。创建一个空OWL文档按特征空间中特征点的先后顺序抽出一个空间对象如N1该空间对象是何种地理实体创建该空间对象对应地理实体的一个实例从该空间对象对应的特征点中抽取一个属性创建这个几何属性对应的实例从该空间对象对应的非几何属性中抽取一个属性创建这个非几何属性对应的实例有新空间对象输出创建的OWL文档有新属性有新属性是否是否否是图4应用本体实例生成算法AOGA首先创建一个新OWL空文档并在其中插入根结点;然后按ARG的特征空间中特征点的先后顺序抽出一个空间对象如N1,根据这个空间对象的类型创建新节点并插入到根节点下,在创建空间对象节点的同时,需要创建这个空间对象的属性:从该空间对象N1对应的特征点中抽取一个几何属性,并创建这个几何属性对应的实例插入到新节点N1下,进行判断直至所有的空间属性创建完毕,同理创建这个空间对象的非空间属性,直至所有的非空间属性创建完毕。一旦空间对象创建完毕后,还需要进行判断,看是否还有其他空间对象。如果还有其他空间对象未创建,则重复上述过程,直至所有的地理对象和相应的空间属性与非空间属性全部转换成应用本体实例。应用本体实例创建完毕后,将所创建的OWL文档输出,第四部分将要使用生成的OWL文档。

试验说明

下面以具体试验来说明,由算法生成的大连湾区域(DALIANRegion)土地利用应用本体实例描述了大连湾地区土地利用方面的信息,包含空间数据和非空间数据的语义信息,图5是对应土地利用本体的树状结构图。本体构建过程参照《国家资源环境遥感宏观调查土地资源分类系统》和中国科学院地理科学与资源研究所数据中心土地利用本体分类体系。当用户提出查找在大连湾东北方向,并位于大连湾50km内包含湖泊的所有林地地理实体时,此查询语句较为复杂包括方位关系(大连湾东北方向)、距离关系(大连湾50km内)、拓扑关系(林地包含湖泊)和语义关系(林地是有林地、灌木林、疏林地和宜林地的父类)。传统的方法很难实现这种复杂的查询请求,通过创建DALIANRegion应用本体就可以很好的解决这种复杂的查询请求。本试验是基于Jena和ArcServer开发的,首先在服务器端调用编写的本体查询函数(用Jena解析),利用应用本体实例中的空间语义关系进行推理。如图5,“有林地”、“灌木林”、“疏林地”和“宜林地”是林地的子类,宜林地和草山草坡是同义关系,灌木林和疏林地是林间草地的父类。利用Jena工具很容易就可以把对林地的查询自动的推理到“有林地”、“灌木林”、“疏林地”、“宜林地”、“草山草坡”和林间草地中去;对空间关系的查询,应用本体中已经描述了拓扑关系(Contain)、方位关系(EastNorth)和距离关系(11.7,36.5)只需要用Xpath、Xquery查询语言进行查询转换即可。然后将查询到的DALIANRegion土地利用应用本体的结果,组织成SQL语句传递给ArcServer的GetFeatureClass类,由ArcServer返回查询结果,在客户端显示。5结束语空间信息的查询与检索是空间信息共享的前提条件。但由于用户认知和概念世界中的概念与系统模型中的概念之间存在语义异质性,用户检索出来的数据往往并不是他们真正想要的。通过建立等价关系、继承关系、逆反关系以及拓扑、方位和距离等空间关系的地理本体并将之用于检索请求可以解决这种语义异质性,从而实现更高级别的检索。本文在检索处理过程中,以空间数据的属性关系图ARG作为描述地理实体空间关系的基础,基于应用本体实例生成算法AOGA和语义推理工具Jena实现异构消解和语义扩展,极大地提高了检索准确率。以下是本解决方案的优点和将来的工作。①提出了描述空间关系的ARG模型,利用ARG可以方便的查询任意两个地理实体的空间关系,改进以往空间关系查询时SQL扩展的不便性;②建立了非空间数据之间的语义关系,可以更全面的检索出所需数据;③提出了应用本体实例生成方法,可以较为方便的生成所需应用本体实例。作为将来的工作,我们将集中在以下两点:①建立ARG模型时,需花费大量的时间,且容易出错,下一步我们将研究更自动化的方法建立所需的ARG;②本体建立层次还较低,只是建立到大类,后续工作,需要在建立地理本体时,建立到具体地理实例一级,要具体到地理实体的名称。