量化容差关系研究论文

时间:2022-10-11 11:06:00

量化容差关系研究论文

摘要对量化容差关系中由于容差度阈值的变化而引起的论域覆盖的粒度、粗糙集的近似精度与粗糙熵、知识的粗糙熵的度量变化进行了讨论。建立了量化容差关系下知识依赖的概念,并探讨了容差度阈值和知识的变化对知识依赖度量的影响。对量化容差关系所产生的覆盖进行修正,以使得新覆盖的任一模块里的任意元素均两两满足量化容差关系,并进行了相关性质的证明。

关键字粗糙集;量化容差关系;不完备信息系统;熵;知识依赖

1引言

粗糙集理论[1](RoughSetsTheory,简称RST)是一种用于处理含糊和不精确性问题而又不同于模糊集理论的新型数学工具。Pawlak提出的RST仅仅适用于所有属性值都已知的完备信息系统,然而现实世界中由于各种原因存在着大量的不完备信息系统(IncompleteInformationSystems[2],简称IIS),因此如何使用RST处理IIS正逐渐成为RST研究领域的一个热点问题。使用RST处理IIS,大致可以分为两种方式:1、间接处理,即数据补齐或数据删除方法;2、直接处理,对基于不可分辨关系(等价关系)的RST模型进行扩充。由于间接处理方法会损害到数据的原有分布特征,挖掘出的规则往往带有不确定性,因此使用直接方法处理IIS就具有其独特的优势。

随着理论研究的不断深入,目前已经涌现出了很多扩展RST模型以处理IIS,如容差关系模型[2]、量化容差关系模型[3]、限制容差关系模型[4]、相似关系模型[3]等等。由于量化容差关系是一种推广的容差关系,量化容差类是一个用关于参考元素的容差度作为成员函数的模糊集合,因此文中主要围绕量化容差关系在RST中的若干问题进行讨论。

2量化容差关系

2.1容差关系

一个IIS是一个二元组:,其中U是一个被称为论域的非空有限的对象集合;AT是一个非空有限的属性集合。

对于任意a∈AT,有a:U→Va,其中Va是属性a的值域(可包含空值,文中用〝*〞表示);V为全体属性值域,即;定义f为信息函数,对于,有f(x,a)∈Va.

定义1.1令S为一IIS,属性集合,则由A决定的容差关系如下表示:

2.2量化容差关系

量化容差关系是容差关系的推广,在容差关系中加入了描述对象之间的相似程度这一参考因素。

令S为一IIS,其中.假设对于,x在属性a上取值的概率为(表示集合Va的基数).

定义1.2令S为一IIS,对于,x,y在属性集合上取等值的概率(容差度)为,

其中表示x,y在属性a上取等值的概率,其取值如下所示:

定义1.3令S为一IIS,,容差度阈值λ∈[0,1],则量化容差关系定义如下:

若假定容差度为1,量化容差关系就退化成定义1.1中的容差关系。

定义1.4令S为一IIS,,容差度阈值λ∈[0,1],对于,x关于的量化容差类定义为:

.

一般来说,在IIS中,量化容差关系对于论域构成了一个覆盖而非划分,若令表示覆盖,则.

3基本概念

a)近似精度及粗糙熵

定义2.1令S为一IIS,,容差度阈值λ∈[0,1],对于,X关于的上、下近似集合可表示为和,其中

定理2.1令S为一IIS,属性集合,若容差度阈值λ1,λ2∈[0,1],且,则

证明:对于,因为,所以.若,则必定有;反之则不一定成立。所以.同理可以证得.

定理2.1说明粗糙集合的下近似集随着容差度阈值的减小而不断减小,上近似集却随着容差度阈值的减小而不断增大。

定义2.2令S为一IIS,且,容差度阈值λ∈[0,1],则X关于的近似精度,粗糙性分别如下所示:

定理2.2令S为一IIS,属性集合,容差度阈值λ1,λ2∈[0,1]且,则对于,有.

证明:利用定理2.1的结果,易证。

定理2.2说明随着容差度阈值的减小,粗糙集合的近似精度在不断减小,粗糙性在不断增大。

定义2.3令S为一IIS,属性集合,容差度阈值λ∈[0,1],则知识A的粗糙熵定义为:

定理2.3令S为一IIS,,若容差度阈值λ1,λ2∈[0,1]且,则.

证明:对于,因为,所以.于是可以得到不等式

.

扩充这个不等式就可以得到.

为了对粗糙集的不确定性进行更为精确的测量,已有学者开始研究各种不同的粗糙集的粗糙熵[5]。根据量化容差关系,可以定义如下两种不同形式的粗糙集的粗糙熵。

定义2.4令S为一IIS,属性集合,容差度阈值λ∈[0,1],对于,X关于知识A的粗糙熵定义为:

定理2.4令S为一IIS,属性集合,若容差度阈值λ1,λ2∈[0,1]且,则对于有.

证明:利用定理2.2及2.3的结果,易证。

作为一种特殊的容差关系,量化容差关系当然也满足容差关系下的一些性质,如定理2.5所示。

定理2.5令为一IIS,属性集合,若容差度阈值λ∈[0,1],则,,,.

b)知识依赖

利用对象的分类,可以方便地研究两个不同属性子集,即知识之间的依赖关系[6]。

定义2.5令S为一IIS,容差度阈值λ1,λ2∈[0,1],属性集合B对于属性集合A的依赖关系表示为,当且仅当对于,若,则必定有.

定义2.6令S为一IIS,容差度阈值λ1,λ2∈[0,1],则知识A与B之间存在等价依赖当且仅当且.

知识的部分依赖表示知识之间的推理可以是部分的,换言之,只有部分关于B的知识可以从A推导出来。知识的部分依赖一般用知识的正区域来表示。

定义2.7令S为一IIS,,容差度阈值λ1,λ2∈[0,1],则知识A对于知识B的正区域表示为:

.

定义2.8令S为一IIS,,容差度阈值λ1,λ2∈[0,1],知识B以程度k依赖于知识A,表示为,其中.

当k=0时,知识依赖表示为;当k=1时,知识依赖表示为.

定理2.6令S为一IIS,,容差度阈值λ1,λ2,λ3∈[0,1]且,如果有知识依赖,,那么.

证明:对于,根据定理2.1,因为,所以,即.所以.

定理2.6说明随着知识依赖的被依赖部分的容差度阈值逐渐减少,依赖部分对于被依赖部分的依赖程度逐渐减小。

定理2.7令S为一IIS,,容差度阈值λ1,λ2,λ3∈[0,1]且,如

果有知识依赖,,那么.

证明:对于,因为,所以.

对于,若,则,反之则不一定成立,所以,即.

定理2.7说明随着知识依赖的依赖部分的容差度阈值逐渐减少,依赖部分对于被依赖部分的依赖程度逐渐增大。

定理2.8令S为一IIS,若且容差度阈值λ∈[0,1],则有知识依赖.

证明:对于,若,则.因为,所以,即.满足定义2.5,所以.

定理2.9令S为一IIS,,容差度阈值λ1,λ2∈[0,1],如果有知识依赖,那么.

证明:对于,若,则,即.对于,可以得到,于是有,即.

定理2.10令S为一IIS,,容差度阈值λ1,λ2∈[0,1],如果有知识依赖,,那么.

证明:类似于定理2.9的证明,对于,有.

对于,若,则,反之则不一定,所以,即.

4基于量化容差关系的覆盖

1)覆盖粒度

定义3.1在一IIS中,,分别为论域U的两种不同覆盖,若对于,必定使得,并且对于,必定使得,则称覆盖比覆盖更为精细,或者说比更为粗糙,表示为<.

定理3.1令S为一IIS,,若容差度阈值λ1,λ2∈[0,1]且,则<.

证明:对于,因为,所以.满足定义3.1,所以.

定理3.2令S为一IIS,容差度阈值λ∈[0,1],若,则.

证明:对于,因为,所以,即,满足定义3.1,所以<

定理3.1和3.2说明在量化容差关系下,随着容差度阈值的减小,覆盖的精细程度也在不断地减小;随着知识的不断增加,覆盖的精细程度不断地增大。

2)覆盖修正

令,由定义1.4可知,中的所有元素都只是与x之间存在量化容差关系,而对于,并不一定能保证m,n之间也存在着量化容差关系。因此有必要重新定义由量化容差关系所产生的论域覆盖,以保证覆盖中任一模块中的任意两个元素之间都具有量化容差关系。

定义3.2令S为一IIS,属性集合,容差度阈值λ∈[0,1],则论域的覆盖表示如下:

.

3)相关性质

定理3.3令S为一IIS,属性集合,容差度阈值λ∈[0,1],则

证明:(1)对于,有,于是,使得.所以.

又因为y为中任意取得,所以

(2)对于,必定使得且.而此时根据量化容差类的定义,有.又因为y为中任意取得,所以有综合(1)(2),定理得证。

由定理3.3可得看出,覆盖相比于覆盖更为精细,即.

定理3.4令S为一IIS,,容差度阈值λ1,λ2∈[0,1]且,则对于,必定,使得.

证明:对于,令,则,因为,所以,即必定有使得.因为x,y为M中任意取得,所以.

定理3.5令S为一IIS,,容差度阈值λ∈[0,1],对于,必定,使得.

证明:对于,令,则.因为,所以,即必定存在使得.因为x,y为M中任意取得,所以.

定义3.3令S为一IIS,,容差度阈值λ∈[0,1],对于,论域覆盖为,X的上、下近似集合可表示为,其中

定理3.6,.

证明:(1)令,则∩.根据定理3.3,必定,使得且M∩X≠Φ,即.所以.

令,则使得x∈M且M∩X≠Φ.由定理3.3可知,,即∩,.所以.

(2)令,则.由定理3.3,对于且x∈M,必定,即.所以.

5结束语

作为一种RST扩展模型以便于直接处理IIS,量化容差关系用容差度描述对象之间的相似程度,是容差关系的进一步拓展。

本文对基于量化容差关系的RST中的一些基本概念,如覆盖的精细程度、粗糙集的近似精度、粗糙熵、知识的粗糙熵以及函数依赖进行了讨论,研究了容差度阈值的变化对这些概念的度量的影响。分析了由量化容差关系产生的论域的覆盖,发现在这个覆盖里,任一模块中的元素都只是与模块的生成元素存在量化容差关系,于是重新定义了基于量化容差关系的覆盖,使得任一模块中的任意两个元素之间都具有量化容差关系,并联系原有覆盖进行了相关性质的讨论。

参考文献

[1]Pawlak.Z.Roughsetsandintelligentdataanalysis[J].JournalofInformationSciences.2002,(147):1-12

[2]Kryszkiewicz.M.Roughsetapproachtoincompleteinformationsystems[J].JournalofInformationSciences.1998,(112):39-49

[3]Jerzy.Stefanowski.Incompleteinformationtablesandroughclassification[J].JournalofComputationalIntelligence.2001,(17):545-566

[4]王国胤.Rough集理论不完备信息系统中的扩充.计算机研究与发展.2002,39(10):1238-1243

[5]QiangLi,JianhuaLi,XiangLi,andShenghongLi.Evaluationincompletenessofknowledgeindatamining[J].Springer-Verlag,LNCS(3309).2004,278-284

[6]D.A.Bell,putationalmethodsforroughclassificationanddiscovery[J].JournaloftheAmericanSocietyforInformationScience.1998,(49):403-414