数据挖掘在网络病毒预防的应用

时间:2022-02-22 08:33:14

数据挖掘在网络病毒预防的应用

摘要:在网络不断普及的过程中,其逐渐被应用于金融、财产、人际关系等多种领域,在网络的应用过程中所产生的大量数据会造成网络病毒,因此,对海量网络数据进行挖掘不仅能够帮助用户更好使用数据,同时能够预防使用过程中的网络病毒。数据挖掘技术在网络病毒预防中的应用,首先提出挖掘原理,建立数据开采模型和挖掘过程,同时在挖掘过程中建立数据仓库,利用贝叶斯算法预防病毒,帮助提高网络安全性。

关键词:数据挖掘;网络病毒预防;贝叶斯

1引言

随着数据库、数据仓库等数据仓储技术的发展,信息系统逐渐被金融、财产、人际关系等多种领域运用。数据化时代的来临,给人们带来便利的同时,如此海量的数据也让人难以消化。从表面来看,海量数据中蕴含着许多有用信息,但是这些数据不能运用到实际工作中。同时随着数据的增加,负面作用也越来越明显[1]。巨大的信息量难以处理,同时真伪难辨,为信息安全带来威胁。在这种情况下,人们开始意识到数据挖掘的重要性。信息挖掘技术能够被应用于网络防护、危险评估等,有效检测网络病毒和入侵行为。挖掘是一门混合型的学科,其中涉及数据库技术、统计学知识、可视化、信息学科等。数据挖掘技术能够将已有的数据进行整理,同时对其中隐藏数据进行提取。数据挖掘技术能够有效监测出网络病毒的活动并进行预防[2]。数据挖掘技术能够实现病毒的预防与检测,对入侵病毒的数量和形式进行反馈。数据挖掘技术对数据起到重要的保护作用,在实际生活中得到广泛应用。

2数据挖掘技术在网络病毒预防中的应用原理

数据库在数据挖掘过程中被作为数据管理系统广泛使用,随着数据库中数据的不断储存,数据分析处理技术需要不断发展。数据库中,人们能够利用的数据仅仅是其中的一小部分,其中大部分有用数据,由于使用工具的局限性不能被人们很好利用。数据库中的数据被人们所利用的仅仅是很小一部分,但是这些信息在决策生成的过程中具有重要的参考价值。为此,研究数据挖掘技术在网络病毒预防中的应用[3]。数据挖掘就是“对数据库中蕴涵的、未知的、有潜在应用价值的、非平凡的模式的提取”。数据挖掘基本原理可分为六个过程,具体如下。(1)明确任务:了解应用领域与知识背景,并且明确所要完成的数据挖掘任务;(2)数据选择:从大数据中提取需要的数据,对其进行数据挖掘;(3)数据预处理与转换:对数据进行挖掘,提取所需要的数据,处理后转变成为有效数据,方便后期进一步进行数据挖掘;(4)数据挖掘:根据数据挖掘的任务要求,选择合适的数据挖掘方式,将挖掘结果转变成为易理解的形式;(5)模式解释:对发现的模式进行解释与评估,需要精确数据时,重复以上步骤处理数据;(6)知识评价:将挖掘处理过后的数据,转变成为用户能够理解的方式,方便使用。

3网络数据挖掘目标和方法

在网络信息数据挖掘过程中,根据挖掘任务和目标的不同,在挖掘数据过程中,将主要能够将发现的典型知识分为以下几类。(1)关联规则(AssociationRule):根据数据之间的关联,从数据库中发现那些确信度(Confidence)和支持度(Support)都大于给定值的强壮规则。目前,从数据库中发现关联规则的概念已从单一概念层次发展到多个概念层次[4]。在实际的网络数据中,需要用到的相关规则数量都较大,并且其中一些规则会影响用户的判断。(2)分类(Classification):分类作为网络数据挖掘中最基本的认知形式,就是对网络数据库中的每一项数据进行分类。通过数据库的建立,作为数据挖掘的重要基础。(3)聚类(Clustering):聚类方法区别于机器学习中将数据分类的监督学习,被称为非监督学习[5]。数据聚类通常会采用将对象分成几个群体的方法,每一个群体中都存在较高相似度,不同群体中相似度较低。

4数据挖掘技术在网络病毒预防中的应用

数据挖掘在网络病毒预防中的应用有着多变、需要管理、信息丰富、需要进行决策等领域特点[6]。所以首先需要对网络数据建立数据仓库,利用数据挖掘和分析工具,将网络数据中需要的信息进行挖掘。通过对系统中相关数据的抽取、加工、整理以及加载到数据仓库中,形成数据库中基础的数据。在建立数据仓库后,利用贝叶斯算法,它可以很好地从任务的分类中进行区划,能够很好地对网络数据进行挖掘和检测保护。在计算过程中,以A1,A2,A3,A4,A5,…,Am作为m的属性,属性分类为V,让每个属性A,有一个领域(a1,a2,a3,a4,a5,…,ad)和分类V领域(v1,v2,v3,v4,v5,…,vd),其中的分类数据点更加倾向于(a1,a2,a3,a4,a5,…,Am+v1),得到公式:()1111arg()miv=manPv∏Pav=丨(1)()()()11111#,arg##miavvmanvv=∏=(2)这个方法能够有效应用于数据挖掘的网络病毒预防中。

5结语

随着互联网的发展,网络逐渐被应用到生活的各个领域中。网络信息安全变得尤为重要,这不仅关系到网络安全,更关系到各个领域的隐私问题。利用信息挖掘技术能够有效提高互联网信息安全系数,做到更加具有针对性的网络信息安全保护和病毒预防。在数据挖掘技术在网络病毒预防中的应用过程中,首先建立开采模型,并且提出数据挖掘过程,建立网络数据仓库,通过关联工具和解构对计算机数据进行挖掘,对数据挖掘算法进行描述,利用贝叶斯算法预防网络病毒的入侵,解决网络病毒防御中的问题,有效提高网络安全性。

参考文献

[1]钱维扬,王俊义,仇洪冰.基于Hadoop的数据挖掘技术在测光红移上的研究[J].电子技术应用,2016,42(9):111-114.

[2]张子昂,黄震方,靳诚,等.基于微博签到数据的景区旅游活动时空行为特征研究——以南京钟山风景名胜区为例[J].地理与地理信息科学,2015,31(4):121-126.

[3]张加余,蔡伟,李云,等.HPLC/LTQ-OrbitrapMSn结合MDF数据挖掘技术快速鉴定藏白蒿绿原酸类似物[J].质谱学报,2015,36(4):321-327.

[4]和敬涵,刘琳.基于冗余信息的智能变电站协同后备保护及故障预判算法研究[J].电力科学与技术学报,2015(2):3-8.

[5]万祥,胡念苏,韩鹏飞,等.大数据挖掘技术应用于汽轮机组运行性能优化的研究[J].中国电机工程学报,2016,36(2):459-467.

[6]潘鸿,王洪峰,王宇峰,等.基于数据挖掘技术探究治疗糖尿病周围神经病变的针灸取穴规律[J].中国针灸,2016,36(10):1111-1114.

作者:张凯斐 王翠娥 单位:吕梁学院