数据挖掘技术在审计信息系统的作用

时间:2022-08-10 04:10:37

数据挖掘技术在审计信息系统的作用

摘要:随着信息技术的快速发展,审计项目内容越发复杂化,在进行审计工作时,也越来越难以发现审计中存在的漏洞。因此,如何使得审计人员在进行审计时发现审计数据中存在的问题是目前需要解决的问题。本文通过使用数据挖掘的方法对审计信息系统中的数据进行分类、预测及关联等,找出异常的审计数据,再对这些异常的审计数据进行重点审计。

关键词:数据挖掘;审计信息系统;分类与预测;审计数据

一、引言

随着审计数据越来越庞大,审计对象及内容越来越复杂,传统的审计方式已经不能适应新的工作要求。为了提高审计质量,降低审计风险,必须要采用先进的审计方式和手段。信息技术的发展推动了审计工作的信息化,审计信息系统快速发展,其数据来源于客户的信息、人员的信息、知识库的信息及客户的数据等,重点是输出审计工作底稿、审计报告、审计财务报表等工作。

二、数据挖掘技术

数据挖掘,又称数据采掘、数据开采,它是一个从大量数据中提取一些有用的、未知的及最终可理解的知识的过程。传统的数据库查询和统计技术只能提供用户想要的信息,而数据挖掘技术则可以发现用户没有意识到的未知信息(吕新民,2007)。数据挖掘的基本技术有:关联分析、分类与预测、聚类分析、时序分析、变化和偏差分析及回归分析。数据挖掘技术是一种用于处理海量数据的技术,综合了数学、计算机、统计学等学科的知识。它的关键在于数据挖掘的算法,数据的类型不同,其挖掘算法也就不相同,主要的数据挖掘算法有分类、聚类、估值及关联规则等,运用这些算法,就可以发现和提供有用的知识和信息,来完成日常工作及决策。数据挖掘的方法有很多,如传统统计方法、可视化技术、神经网络、遗传算法及粗糙集方法。

三、数据挖掘技术在审计信息系统中的应用

(一)统计分析技术。统计分析技术是一种精确的分析方法,审计人员可以利用这个方法对审计信息系统中的数据进行分类和预测。首先通过对审计数据库中信息进行分类,并对其数据进行挖掘,得出一些有效的数据;其次,审计人员可以通过建立模型对上述有效数据进行预测分析,得到一个预测值;最后,将分析的预测值和审计值进行比较,审计人员会从比较的结构中找到不同点,因此可以将其列为审计重点内容。(二)可视化技术。在对审计信息系统中的数据进行分析时,审计人员需要对不同种类的被审计单位的数据信息进行查询,以此来对被审计单位的经营状况及财务状况进行了解,由于可视化技术可以将繁琐的审计数据以图表等方式直观的表达出来。因此,可视化技术可应用于审计信息系统数据挖掘中,审计人员可直观的了解审计数据中存在的问题或异常,再将这些审计数据列为重点数据。(三)决策树。审计人员在应对繁琐的审计数据时,可运用决策树对审计信息系统中的数据进行分类,找出其相对重要的数据,并直观的表述出来。最后,审计人员就可以根据决策树中已分类的数据进行预测。(四)聚类分析技术。审计人员可以用聚类分析技术对审计信息系统中的数据进行识别,从中发现其数据的分布情况,以及各数据之间存在的关系,进而确定其重点数据。如运用数据挖掘中的聚类分析对被审计单位的财务报表数据进行分析,若这些数据的变化发生异常,则可能出现作假情况,这就会隐藏了审计数据的真实性,即要对这些异常数据进行重点审计。(五)关联分析技术。通过运用关联分析技术,审计人员可对被审计单位数据库中的审计数据进行挖掘分析,找出不同数据项之间的联系,从而发现其存在的异常数据,再进一步分析找出重点审计数据。因为被审计数据库中的各数据之间都是有关联的,利用数据挖掘中的关联技术对其分析,找出一些非关联的审计数据,进一步对这些数据进行挖掘,最后可确定可疑的审计数据。图1数据挖掘在审计信息系统中的分析数据挖掘技术在审计信息系统中的操作步骤:1、通过分析人员对审计人员的帮助,审计人员可根据审计目标及相关内容,合理地利用数据挖掘技术,将审计的具体问题转化成数据挖掘问题,并建立一个可实现目标的合理方案;2、审计人员利用数据挖掘技术对审计信息系统中的原始数据进行识别、加工及处理,对有关数据进行转换和清理,再从中找出符合条件的数据;3、建立一个完善的数据挖掘审计信息系统模型,审计人员可利用数据挖掘技术,对审计数据库中的数据进行挖掘;4、审计信息系统下数据挖掘的输出结果,审计人员可以将其结构以审计工作底稿、审计报告及审计财务报表等方式呈现;5、由于可能采用的数据挖掘的方法不同,最后输出结果的具体内容可能不一样,因此,可以采用不同的方法进行数据挖掘,最后通过比较分析,找出一个最合适的数据挖掘结果。

四、举例数据挖掘技术在审计风险识别中的应用

审计风险是审计人员将存在重大错报、漏报的财务报告判断为合法的,以及将存在弊端和漏洞的经营管理判定为健全有效的,并提出不恰当审计意见的可能性。在数据挖掘技术中,审计风险识别是以现有的审计指标及相关财务指标为基础,利用粗糙集理论的数据挖掘技术建立数学模型来识别审计过程中可能存在的风险,并从中找出可能存在的规律。即用if…then…的形式来表示。样本的选取:为了能直观的说明数据挖掘技术在审计风险识别中的应用,本文模拟了一些健康的样本数据对审计风险进行识别。以模拟样本的审计指标及相关的财务指标作为条件属性,建立一个简单的粗糙集分析的模型。数据预处理:在财务审计中,可以从财务指标中看出财务报告中出现的虚假情况,即一些财务指标不用于同类企业的财务指标。本文选取8个财务审计指标分别分析审计风险程度,并根据模型的要求对指标进行离散化处理,如下表:建立信息系统Q用四元有序组Q=(S,I⋃R,D,p)表示,即:S={S}1,S2,S3,...,Sn——样本集,作为论域;I={X}1,X2,X3,...,X8——财务审计指标集,作为条件属性集合;R={该企业是否存在审计风险}——作为决策属性,0代表审计风险程度低,1代表审计风险程度高;D={D}1,D2,D3,...,Dn——D1代表S1对应财务审计指标的离散值;P是信息函数。粗糙集技术对审计信息系统进行数据挖掘:根据粗糙集地属性约减算法,对上述表格中各指标所代表的信息量进行计算,并确定其重要程度。经过约减计算之后,保留了X1、X2、X3、X4及X6,并得到预测规则集,如下:(1)IF(X3≥1)THEN(R=1);(2)IF(X1<3)∧(X4<2)THEN(R=1);(3)IF(X2<3)∧(X4<2)THEN(R=1);(4)IF(X6=1)THEN(R=1)。注:规则中的指标值为上述表格中的离散值。上述实例中采用的是粗糙集方法在审计信息系统中进行数据挖掘,是通过对财务审计指标进行分类,按照影响因素的不同对财务审计指标进行离散化分析,再通过离散化的数据进行预测规则集,得到审计风险程度的大小。该方法的不足之处就是得到的预测规则集过大,可能得出一个不正确的预测规则,进而影响审计人员的判断。

五、结论

数据挖掘作为一门数据分析技术,它可以帮助审计人员对数据量较多的审计项目进行挖掘分析,从中获取有效的审计线索,进而完成审计相关要求。利用数据挖掘的方法对审计数据进行分类、预测及关联等,从中发现一些异常数据,并进行重点审计。这样,也会提高审计人员的工作效率和工作质量及对被审计数据的分析能力。因此,数据挖掘在审计工作中必将得到更多的应用。

作者:杨智敏 单位:重庆理工大学会计学院

参考文献:

[1]吕新民,王学荣.数据挖掘在审计数据分析中的应用研究[J].审计与经济研究,2007(11):35-38.

[2]张志恒,陈旭.数据挖掘技术在会计信息系统中的应用研究[J].中国管理信息化,2006(02):36-39.

[3]林国勇,张莉.基于数据挖掘技术的审计数据质量控制探析[J].审计月刊,2014(03):8-10.

[4]柯芳,辛佳颖.基于数据挖掘技术的金融审计风险防范研究[J].经济论坛,2013(07):100-102.