固网漏话用户数据分析论文

时间:2022-03-27 04:07:45

固网漏话用户数据分析论文

1数据挖掘和知识获取

数据挖掘是在数据库中进行知识发现的重要方法,是从大量的表面数据中提取隐藏在其中的知识的过程。近年来,该技术发展迅速,已应用到各个领域。本文主要介绍固话漏话用户数据挖掘和分析。

2数据挖掘技术应用于电信用户数据研究

2.1固网用户数据的组成和结构

对于企业来说,大量的用户数据不仅有利于客户关系管理(CRM),同时也是获得用户知识的源泉。从用户知识发现的过程中可以看到,用户数据的质量会对知识发现的结果产生直接的影响,所以用户数据准备也是一项很重要的步骤。从商业系统中提取出高质量的用户数据就成为一项最主要的工作。固网企业的用户数据包括用户基本信息、用户账单信息以及客服信息。数据仓库就是根据这种方式来组织的。

2.2知识发现的方法和过程

用户知识发现概括如下:根据提出的商业目标,分析大量的用户数据,找出隐藏的和未知的规律或者丰富已知的规律,进而提出模型;最后要将数据挖掘和分析的结果转化成有商业意义的方法,然后采取进一步的行动。用户知识发现必须遵循以下几个步骤:商业理解,数据理解,数据准备,分类模型,评估应用。

2.3数据挖掘建立用户分类模型

近年来,“以客户为中心”的电信市场开始强调为不同用户提供个性化服务,其前提条件就是用户分类。这也说明了过去的消费行为也预示了未来的消费倾向。

(1)商业理解

对用户的理解不仅是理解电信市场的开始,也是理解客户关系管理的开始。在电信企业中对用户的理解包括:用户种类,不同类中用户的本质属性区别,用户偏好,不同类别之间的用户如何通信等。

(2)用户数据准备

对用户分类的研究主要是从用户属性中得到用户特征和行为习惯。主要数据来源于用户账单信息,同时也需要从商业系统中得到一些用户的基本属性信息。

(3)用户分类模型

本文使用聚类分析对用户进行细分以建立分类模型。聚类分析是把大量数据点的集合根据最大化类内相似性、最小化类间相似性的原则进行聚类或分组,使得每个类中的数据之间最大限度地相似、而不同类中的数据之间最大限度地不同。

3固网漏话用户数据分析

3.1关于固网漏话用户数据分析的商业理解

通过各种渠道调查,对固网漏话用户数据分析的目标可以概括为以下几点:

(1)对用户通话次数、时间段等分析,找出特征,以此来寻找目标用户;

(2)对用户开通漏话保护业务前后的ARPU值分析比较,分析收益的对比;

(3)对目标用户数据分析,从用户分类的角度来管理,设计针对性的服务,提升用户满意度。

3.2系统用户数据准备

数据准备的过程:明确目标;制定计划;分析变量的获取;数据收集和获取;数据集成。根据当前客户关系管理基本状况和数据挖掘的目的,涉及到的人口属性变量有:性别、年龄、住址、用户职业、婚否、学历、薪资等。用户分类结束之后,再使用描述变量来进行分析说明。本文选用某市电信公司运营支持系统和经营分析系统的数据,从中选取了基本客户基本信息表、客户详细话表、账单及缴费信息表、产品信息表、业务使用清单等原始数据。数据挖掘工具选择SPSSClementine。在使用该工具进行挖掘之前,需要对数据进行清洗:

(1)删掉不满足要求的数据:选择普通的用户;选择状态正常的用户;选择入网时间较长的用户,使数据有完整的用户周期;

(2)去掉异常数据:比如用于测试的号码;

(3)去掉极端值:不具备普遍性的极值容易产生噪声。

3.3固网漏话用户数据分析结果

考虑到不同分类建立的有效性和简便性,以及固话用户和数据源的特点,本文采用常见的K-means算法,其高可靠性、高精准性以及低复杂度使其成为主流的聚类算法。本文选用SPSSClementine作为数据挖掘工具进行K-means聚类分析。获取原始数据并进行预处理之后,选择参与聚类的细分变量,输入簇的个数k,选择k=7,然后点击“聚类”按钮,使用K-means算法对固网漏话用户数据进行聚类。经过正常值选择、极值处理等一系列的数据清洗工作,最后用于研究的记录有251284条。

3.4分析结果和解释

93%的遇忙话务都出现在8∶00~18∶00的工作时段,这说明该时段遇忙话务较多,话务量流失严重,特别需要遇忙话务的解决方法。而这一时间段遇忙话务量最多的就是政企用户,这些话务量流失对政企用户将造成巨大的损失:30000政企用户一个月遇忙话务损失达到260万次,本网超过120万次,每个月预计损失20万;以电信中等发达省份为例:符合条件的政企高端用户约为60万;每年度损失的潜在业务收入为50000万。经过分析,得到该市各地区已开通和未开通漏话保护业务的用户分布,如图4所示。C区属于政务新区,未开通漏话业务的用户较多,而F区属于工业园区,企业较多,很多用户已开通漏话保护业务,但是还有大量用户未开通该业务,所以C区和F区应该作为该业务的重点推广地区。综上分析,固网漏话业务是一个非常有潜力的业务,解决漏话问题是提高用户满意度和忠诚度的重要途径。根据上文的分析,在8∶00~18∶00时间段,用户遇忙话务量非常多,在这段时间内,企业需要更多的漏话接入服务器,而在其他时间段可以减少接入服务器以节约成本。而在不同的地区,用户数量和精准用户的数量也不同,应该选择精准用户较为集中的地区优先推广漏话保护业务。由于精准高端用户带来的收益远远超过普通用户,所以要对经过筛选的精准用户采取针对性措施,比如在C区和F区大力宣传,以各种形式让精准客户看到该业务带来的收益,还可以电话推广为精准用户提供信息。

4结论

本文将聚类挖掘方法应用到固网漏话用户数据分析中,采用SPSSClementine工具进行数据挖掘。漏话保护系统主要针对政企高端用户提出,主要目的是为了提高通话接通率,以提高政企用户的效益,达到用户和运营商的共赢。而对用户数据的分析,是为了运营商可以更好地服务于政企客户,为企业带来更多的利益,从根本上改善固网漏话问题。

作者:孙骏单位:南京邮电大学