移动网络服务质量监管体系探析

时间:2022-12-01 02:39:28

移动网络服务质量监管体系探析

本文作者:周瑛单位:福建师范大学

系统架构

分层架构。系统采用分层结构,从通信的各个环节(终端、接入网络、核心IP网络、应用系统、采集相关数据),通过关联、压缩等方法获取完整的用户层面的5W1H信息和网络层面的指标信息,将这些事件和信息匹配模型、触发规则,及时反馈控制网络的行为,来提升用户的QoE.其架构如图1所示.每层结构完成如下的功能:(1)物理层.从实际的网络设备通过对镜像或者分光等手段,获取物理信号.(2)采集层.对各种协议指令消息进行解码;针对不同的协议生成不同的会话记录;对采集信息进行初步过滤,打时间戳,汇总.(3)处理层.包括关联服务器、数据服务器、模型服务器、规则解析服务器.关联服务器进行数据分类、关联、压缩和统计;数据服务器完成数据的保存;模型服务器存储所有的模型,采用自适应算法,不断修正、适配各种模型,并通过规则干预网络;规则解析服务器以用户事件、网络指标为驱动,触发各种规则,通过网管系统干预网络,或生成告警.(4)应用层.包括应用服务器和用户端,完成结果呈现、人机交互和告警.

模块结构。采集器从实体网络上采集的数据进入处理层,再到应用层.下面结合数据流向描述系统的模块结构,结构如图2所示.初始的采集数据进入关联服务器,完成数据的压缩、统计处理.首先进入数据过滤模块,过滤掉重复、无效数据,然后进入数据关联模块,完成数据协议、用户、会话ID的识别,将相同会话的数据关联放入用户统计参数链,形成完整的用户呼叫记录,将网络属性有关联的数据放入网络指标统计模块,形成网络指标.关联服务器处理完的数据进入数据库服务器保存,然后触发规则和匹配模型.规则服务器完成系统中固定逻辑控制部分.主要的规则有:(1)用户规则.针对特定用户设置的规则,如VIP用户,对满足条件的用户触发特定的行为(保护、监控、优先服务等).(2)业务规则.对特定业务设置规则,保障该业务的QoE.(3)指标规则.对网络指标设置门限和条件,满足条件即触发告警或网络调整行为.模型服务器完成系统中自适应控制部分.内含自适应算法,不断学习完善模型,形成一套有效提升QoE的方法.

通过生成规则,反馈网络.主要的模型有:(1)SLA模型.根据SLA协议建立的模型.(2)行为模型.根据用户业务行为建立的模型.(3)网络模型.根据网络属性建立的模型.(4)体验模型.根据用户体验的各个CEI指标建立的模型.应用服务器主要有界面模块、用户监控、网络监控、告警模块等,完成告警和人工干涉网络行为.

数据处理

采集的数据。从网络设备中采集出来的数据协议众多、数量巨大,因此在采集器层面,就需要根据协议类型对数据进行第1次过滤.采集器获取的数据主要有以下几类:(1)CallDetailRecordCDR数据.CDR数据本来是给计费系统生成账单使用的,富含用户在使用网络过程中的信息,根据这些信息,可以分析出用户在使用过程中网络的行为和各种参数.(2)IPDetailRecordIPDR数据.它是IP网络中的详细记录信息,作用同CDR.对于移动互联网来说,目前3GPP,ITU-T,TMF等协议组织[4],提供了大量的CDR和IPDR方面标准和协议,为系统获取这方面的信息提供了支持.(3)IP包头.采集IP包的整体使得数据量过大,而处理分析过程中IP包内大部分业务细节又不需要用到,因此只获取IP的包头.(4)符合一定特性的业务数据片段.此数据特性由处理层服务器根据应用层实时或者预设的条件控制,比如跟踪某个用户(群)、某种特定业务,需要采集符合此特性的具体业务细节片段.

数据约束。网络中涉及到各种网络协议,因此系统必须采用标准数据格式,才可能进分析、关联和统计,标准的数据格式也给后续协议种类的扩展提供了支持.采集层上来的原始数据,经过采集器适配成用户通信会话过程中5W1H(When,Who,Where,Why,What,How)信息:When,时间属性,包括周期、时延、通信时长、抖动;Who,用户属性,包括IMSI,MSISDN,IMEI,IP;Where,未知属性,包括国家、运营商、省市、地区、BSC/RNC和LAC/CI;Why,原因,包括丢包、时延过大、掉线、错连;What,业务属性,包括业务种类、业务流量信息;How,网络属性,包括APN、协议版本、网络参数、2G/3G标示.每条信息都含有以下几个部分:(1)用户信息,用来识别此次通信过程中用户的身份;(2)协议标示,通信过程协议种类版本等信息;(3)会话ID,此次通信会话过程的唯一标示;(4)时间戳,时间信息;(5)采集维度,5W1H中的某一个维度;(6)采集内容,每种采集内容都采用统一的数据格式,以便于消息的统一处理.

处理流程。采集器采集到的数据包传入到处理层,经过协议类型识别、用户识别、呼叫过程关联后,通过内存聚合技术完成数据处理过程.系统在内存中为每次用户呼叫建立统计参数链,统计参数链中一个节点为一个统计参数,每个节点下挂对应的统计算法和数据,检测用户行为,视情况触发用户规则,匹配模型,控制网络根据用户行为作调整或发出告警,保存数据库.统计参数链具有灵活的可扩展性,若想增加1个参数,只需要增加节点即可.

常见的统计参数包括业务类型、端到端的时延、抖动、附着(attach)成功与否、带宽、建立链接时间开销、是否掉线等.通过统计参数链,先在内存中完成1次数据包的聚合处理,将结果提交到数据库进行处理.90%的处理工作均在内存中完成,使得系统处理对于数据库的压力大大减轻,从而提高系统整体的处理性能.数据处理流程如图3所示.系统还从多个维度统计网络的各项KPI.统计维度主要有用户群、业务分类、时间段、地理区域、逻辑域(接入网、核心网等).系统根据各项KPI,计算出SQI(ServiceQualityIndictor).通过SQI与各种模型M(行为模型、交互模型、SLA模型等)计算出用户体验指标CEI,并根据这些指标触发规则、匹配模型,实时反馈网络或发出告警,提升网络的QoE:SQI=FKPIk=1,…,m();CEI=F(SQIi=1,…,n,Mj=1,…,m).

应用

移动互联网服务质量管理系统具有广泛的应用场景.下面列举几个典型的场景:实时提升用户体验.用户经常通过手机收取E-mail,系统记录用户习惯行为,用户体验模型针对用户习惯行为建立提升体验规则,用户再次使用手机收取邮件,体验规则触发,为用户临时提供更高带宽.用户群识别,业务针对性营销.在所有用户中,收集某些用户的行为特性,如一群用户较多的使用互动游戏,则可以针对这群用户,推出实时性较好的流量套餐,并生成对应的规则和模型,下次用户再玩互动游戏,则触发既定规则,提升用户的感受.单用户跟踪和查询.实时跟踪VIP用户,保障VIP用户的通信质量;或根据用户的投诉,查询系统历史记录,获取用户当时通信时的5W1H情况,为网络优化提供参考.网络监控.通过事先设定KQI和SQI等统计门限或规则,当任何检测到的网络参数达到异常条件时,就发送告警消息,然后由维护监控人员查看实时的服务质量情况,并根据实际情况做处理.网络情况分析.某个问题片区或新开片区网络运行情况未知,除了传统的网络指标靠后外,还可以通过该系统模拟不同用户,从多种业务视角,来测试、分析、自动诊断网络情况,提升用户的QoE.自动诊断网络.网络出现QoE下降时,系统根据自适应模型,自动诊断、调整网络,提升网络的QoE.

结语

设计了一种基于移动互联网的服务质量管理系统,通过采集实时通信数据,适配、统计后,触发规则、匹配模型,及时反馈网络或者告警,达到监控、管理用户QoE和网络服务质量的目的.目前以TMF论坛、阿朗、爱立信为代表的机构和厂商,都有相关的产品研发的报道.随着竞争的激烈,QoE对吸引用户越来越重要,随着网络的业务增多、容量增大,管理、提升用户服务质量的挑战也会越来越大,也预示着该系统具有广泛的应用场景.后续发展的挑战在于:网络容量变大,数据采集的压缩提取会越难;网络越复杂,多协议的适配和关联会越难.