海战场态势可视化数据挖掘论文

时间:2022-05-21 09:19:40

海战场态势可视化数据挖掘论文

1数据获取

这里将海战场态势数据分为静态数据、动态数据、关联数据和数据的数据4种,获取的一般过程为明确数据源、数据采集、数据校核验证和数据更新4个步骤,对不同数据获取过程中每个步骤的具体任务和注意事项在这里不作赘述。

2数据处理

包括数据获取后的预处理,以及预处理后进一步的数据挖掘。

2.1数据预处理流程

数据预处理的目的是生成供数据挖掘核心算法使用的目标数据,为后续进行的数据挖掘提供高可靠性、数据集规模适当、具有一定抽象程度的数据,以提高数据挖掘效率。根据所要达到的目的,数据预处理的主要任务主要有以下几个方面:数据净化指识别纠正或消除数据间的相互冲突、不完整的数据集、以及组合数据库共有的不兼容性;一致性处理指在数据检查的基础上对数据进行一致性处理,以规范目标数据和数据集;抽象描述指针对所要解决的军事问题对数据集进行结构和语义上的抽象,并将数据从低层概念集合映射到它们所对应的更高一层;缩减数据集规模指通过数据抽样等技术得到较原始数据小得多的数据样本,将初始挖掘付诸于小的数据集上执行,然后扩展到更大的数据集,从而降低挖掘成本。

2.2数据挖掘层次结构海战场态势数据挖掘的层次结构由算法层、逻辑层和应用层组成:

(1)算法层是海战场态势数据挖掘的基础,包括了关联规则、序列模式分析、分类和聚类分析、决策树、神经网络和遗传算法等一些数据挖掘的基础算法。算法层是构建海战场态势数据挖掘模型的基石,是海战场态势数据可视化的核心技术支点之一。具体选用哪一种算法或组合选用几种算法,要根据所要解决的具体军事问题而定。

(2)逻辑层封装了有关军事应用的特定规则和算法,是连接军事应用和挖掘算法的纽带,它们和相关的数据挖掘算法相结合可以求解特定的军事问题,如战役力量基础能力分析、作战编组和兵力配置优化、态势估计、威胁判断等。针对具体问题需要综合运用多种军事运筹方法,构建各种军事数学模型加以分析和计算。

(3)应用层几乎涵盖了海战场态势所关心问题的各个方面。它由战场环境分析、战役力量基础能力分析、作战编组和兵力配置优化、约束关系分析、态势评估、态势预测等子域组成。应用层也是海战场态势数据可视化的主体,它充分利用数据挖掘算法层和逻辑层的计算结果和知识发现成果,实现数据可视化在较高层次的综合展现,达到辅助指挥员感知海战场态势的目的。

2.3数据挖掘过程模型

海战场态势数据挖掘的过程模型对于海战场态势数据的提取层次由“数据”到“信息”,再到“知识”,态势数据的流程也是随着数据提取层次的深入而流动。其中,“数据”是指对数据的获取和必要的整理,“信息”是对数据的处理和挖掘过程,从中发现隐藏在数据中的有用信息;“知识”是对信息的理解和解释,这种理解和解释要针对所要解决的军事问题,进而提炼出对于解决该问题有用的知识。在获取数据源并经过数据预处理后,数据挖掘过程是重要的一步,在对战场态势数据进行挖掘过程中,需要运用与军事应用息息相关的逻辑层算法和算法层的挖掘算法,即需要采用逻辑层的“军事运用模型库”和算法层的“数据挖掘算法库”。经逻辑层与算法层的组合应用,挖掘出的结果经模型发现后形成更新的模型库;而对挖掘结果进行知识抽取后形成知识库,模型库和知识库又反过来影响逻辑层模型库的优化和算法层挖掘算法的选择,这是一个循环优化的过程。同时,对挖掘结果进行军事层面的提炼可以得到结果知识库,结果知识库可供指挥和参谋人员参考使用和辅助战场决策。

3可视化显示模块

依据海战场态势数据的流动过程和处理过程,可视化同数据挖掘的结合主要有3种方式,即初始数据可视化、数据挖掘过程可视化和数据挖掘结果可视化。对以上3种结合方式的显示模块进行设计,数据通过中间层与可视化界面映射,通过调用可视化图形库中的可视化方法在界面上进行最终的可视化显示。

(1)初始数据可视化设计。经过预处理和过滤后的待挖掘数据可以直接进行可视化,通过数据的显示可以获得有关数据的统计信息或知识,并对是否有进一步挖掘的意义和价值进行判断。同时使用者通过界面中交互控制功能进行可视化数据的交互操作,根据需要来观察、探索数据。

(2)数据挖掘过程可视化设计。主要是对其使用的算法进行可视化。使用人员可以通过界面设置数据挖掘算法的初始条件,算法运行过程中的中间结果通过数据接口提供给界面做可视化处理,整个过程是动态往复的,使用人员通过对中间结果的评判进行多次调整,以选择满意的数据项和参数值进行数据挖掘。(3)数据挖掘结果可视化设计。其目的是为更好地理解挖掘结果模式,做出有效的评估与反馈。由于挖掘结果的多样性,需要用不同的可视化方法来展现,这要求界面在设计之初具有可扩展性。以上3种结合方式在可视化时,由于特点各不相同,其映射层和可视化图形库接口要分别进行开发。

4平台的设计

4.1平台的框架结构

综合以上对海战场态势数据可视化整个实现过程的论述,进行海战场态势数据可视化挖掘平台的设计构建,其框架结构主要由数据源模块、数据预处理模块、数据挖掘算法和逻辑层模型模块、可视化显示模块和用户接口模块5部分组成。

4.2平台的主要功能

数据可视化挖掘平台中各模块所要实现的具体功能如下:

(1)数据源模块。主要是通过数据接口实现数据的读取和存储问题,包括从不同的数据库中读取数据作为分析用的数据源,在预处理和过滤后存储待挖掘的数据集,存储挖掘的模式集合等。

(2)数据预处理模块。主要实现数据预处理和数据过滤功能。数据过滤使预处理后的数据变成干净的、规范的、可供数据挖掘模型使用的待挖掘数据集。

(3)数据挖掘算法和逻辑层模型模块。在前面已经讨论过算法层、逻辑层和应用层三者的作用和相互关系,该模块是对数据挖掘算法和逻辑层军事运用模型的集成。由于挖掘算法和军事运用模型种类众多,因此,要使用插件的思想来组织该模块中的算法和模型,针对具体态势问题为使用人员提供不同的数据挖掘模型,以实现使用人员对数据源的挖掘处理需求。如关联规则模型、序列模式分析模型、分类模型、聚类模型等,每个模型又对应若干具体算法,使用人员可以自主地实现这些算法的插入、卸载、执行等操作,这样保证了平台的可扩展性。

(4)可视化显示模块。该模块是对数据、挖掘过程和挖掘模式的表述,除了通过可视化图形的形式表述外,还可以通过文字规则形式或其他形式表述(其设计如第4节中所述)。由于显示方法的多样性,该模块也可以用插件的形式整合到该平台上,便于可视化方法的扩展。初始数据可视化是通过一些数据可视化方法分析探索数据中蕴含的各种信息,例如平行坐标法、基于图标技术、散点图、散列图等;数据挖掘过程可视化主要是对挖掘算法和步骤进行可视化,让使用人员能够实现对挖掘过程的监测和调整;数据挖掘结果可视化主要是对所得挖掘结果进行各种可视化的表述和展现,例如单维/多维关联规则的可视化、时序规则可视化、分类的可视化和聚类的可视化等;随后,还可通过模式筛选、知识抽取和结果解释等方法进行进一步提取,形成知识的表达供军事人员直接使用。

(5)用户接口模块。该模块是使用人员和平台交互的接口,包括数据的分析定义、初始数据可视化、挖掘过程可视化监控和挖掘结果可视化及模式筛选等子模块,还可以根据需要进行子模块的扩展。

5结束语

随着可视化理念和可视化技术的发展,又出现了将问题和可视化数据通过时间堆叠、信息映射等投射在具体场景的方式,这也为数据的可视化实现提供了更多的解决方案和模式。海战场态势可视化挖掘平台设计是顶层设计,除此之外,还有诸如数据库设计和构建、数据管理和数据安全、可视化显示方式设计、以及可视化挖掘平台的最终实现等问题需要进一步研究。

作者:陈晓峰刘兴高元博郑亚波单位:海军大连舰艇学院海军蚌埠士官学校