孤立点检测移动通信论文

时间:2022-01-30 10:18:58

孤立点检测移动通信论文

一、孤立点检测概述

Hawkins给孤立点的定义是:基于数据集中及大部分正常数据当中,孤立点是非常特殊的一部分数据,因为它与正常数据存在很大的差异性,同时这些数据常表现为不属于随机偏差,而是在不相同的机制作用下而形成的,存在尤为深远的意义。基于聚类算法当中,也对孤立点下了定义,即为:孤立点是数据对象当中的噪声数据。通过孤立点检测算法,可以发现孤立点的行为和正常行为之间存在很大的差异。比如:人的身高数据呈现负数,这极有可能是在记录数据的情况下发生错误而形成的孤立点;对于职业篮球运动员来说,其身高数据通常比普通人高,因此被视为孤立点,这是因为数据自身存在的因素所呈现的结果。孤立点的研究工作极具挑战性,主要是因为:其一,在数据分析层面,由于孤立点的存在,导致分析结果会产生极大的影响。其二,在实际生产过程中,孤立点分析能够对其取得至关重要的作用。对于孤立点的检测方法,主要分为两大类:其一是,基于距离的孤立点检测方法,包括基于索引的算法、嵌套循环算法等;其二是,基于密度的孤立点检测方法。其中,对于基于密度的孤立点检测方法来说,均是以局部孤立因素的计算为依据,并且将一些拥有非常高LOF值的数据对象视为孤立点。换而言之,便是此方法是以LOF数据为依据,进一步对一个数据是否为孤立点进行判断。

二、孤立点检测在移动通信数据分析上的应用探究

2.1实验数据选取。以某无线通信网络公司的实际通信数据作为实验数据,通过孤立点检测方法对这些数据集进行分析,同时利用数据预处理功能对数据集进行选取,进一步从中选择一部分数据进行实验。在数据预处理之后,提取路测数据,并在路测数据当中选取和平均接受电平存在联系的属性,在数据的选取上使用的方面为随机取样方法。对于平均接受电平,主要包括了两个属性,其一为上行链路;其二为下行链路。它们可当作是功率控制及切换过程的参考依据,参数取值范围为(-110dBm,-48dBm),将通信信号电平数值向0至63之间的某一个RXLEV值进行映射。基于非连续性发射的情况下,RXLEV上行链路电平属性为full,下行链路电平属性为SUB。对于SUB指标来说,主要的目的是对特定通话时隙的均值进行测量;对于FULL指标来说,主要测量的是所用载频当中全部时隙的均值。因为移动用户提交的测试报告当中,FULL指标值存在不准确的缺陷,因此本次研究使用SUB指标中的数据集作为实验标本。

2.2实验结果分析。对于孤立点检测的性能指标,主要体现在两个方面:一方面,准确性。指的是能够实际检测得出的孤立点所占的比重,度量标准为准确率。另一方面,处理性能。指的是孤立点检测方法进行数据分析时的速度。本组试验将孤立点检测时间作为度量标准。对于实验结果,主要通过检测时间比较与检测准确性进行描述。在实验数据方面,分别从数据集当中以随机的方式抽取6组数据对象,且这些数据对象在规模上呈现逐渐递增的趋势,进一步采取实验。可知:第2列说明,每组数据对应的孤立点检测时间,第3列说明被剪枝数据所占的比重。利用本次研究孤立点检测方法与传统的以嵌套循环为基础的孤立点检测方法进行比较,两组检测时间的差异表明,本次研究所使用的检测方法,在检测性能方面明显由于传统检测方法;鉴于此,本次实验有效。

三、结语

现状下,大多数孤立点检测技术还存在一些问题较为明显,比如基于实时性方面便存在缺陷,就专业领域而言,决策者对该缺陷是无法接受的,他们希望能够得到更为新型且精准度高的决策理论依据。通过本课题的探究,认识到有关孤立点检测的一些方法以及孤立点检测在移动通信数据分析上的具体应用。笔者认为,在未来研究领域中,需要重点对孤立点检测方法的性能指标的提高进行研究,同时也要为决策者提供由检测挖掘出来的有效知识,这样才能使孤立点检测更具实用价值,以此为移动通信数据分析的完善提供帮助。

作者:张凯书李志刚吴慧芳吕夏兰单位:湖北邮电规划设计有限公司