孤立点分析方法在现代审计中的运用研究

孤立点分析方法在现代审计中的运用研究

ID:14085706

大小:30.00 KB

页数:8页

时间:2018-07-25

孤立点分析方法在现代审计中的运用研究_第1页
孤立点分析方法在现代审计中的运用研究_第2页
孤立点分析方法在现代审计中的运用研究_第3页
孤立点分析方法在现代审计中的运用研究_第4页
孤立点分析方法在现代审计中的运用研究_第5页
资源描述:

《孤立点分析方法在现代审计中的运用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、孤立点分析方法在现代审计中的运用研究  一、引言  随着计算机信息技术的迅猛发展,大型企业和信息型产业大多都正在使用供应链管理(SupplyChainManagement,SCM)系统或企业资源计划(EnterpriseResource  Planiling,ERP)系统或客户关系管理(CustomerRelationshipManagement,CRM)系统或财务管理(FinancialManagement)系统等,使企业的管理制度更加完善,同时企业所有运营环节都充斥着信息资源(包含各个部门大量财务数据和经营管

2、理数据的数据仓库)。审计人员从被审计单位的信息系统数据仓库中获取大量审计数据,面对被审计单位海量数据中蕴含着极其丰富信息的挑战,仅仅依靠只是将传统手工的审计流程计算机化的信息技术,如结构化查询语言(SQL)等,很难满足信息时代审计的需求。  计算机辅助审计技术的不断发展,数据挖掘技术为被审计单位在面对海量数据时提供了新的思路,在审计工作中引入对海量数据进行“轻松处理”的数据挖掘技术(如决策树算法、聚类算法、关联规则发现算法等),是对计算机审计方法的补充,“减弱”传统审计方法的限制条件,为现代审计开拓了便捷的路径。

3、可以说是现代计算机审计方法一个里程碑式的突破,也是计算机审计方法探索的悄然趋势。审计人员在面对存在着复杂的审计环境和海量的财务数据时,若利用数据挖掘技术,可以在短时间内发现异常数据(因它在发现审计线索特征方面可以发挥其特有的功能),有助于对被审计单位进行系统全面的审计,把风险尽可能降低,进而拓宽审计领域。  本文基于数据挖掘技术中的孤立点分析方法来发现一些异常的审计现象,孤立点分析方法先对这些大量的审计数据进行预处理(除噪),然后建立数据挖掘模型,运用此模型分析出具有一定特征且小比例的异常数据,供审计人员决策分析

4、时参考。  二、孤立点分析方法  孤立点分析是数据挖掘技术中用来检测审计数据中异常数据的一项重要技术。由于审计分析中的疑点数据往往表现为孤立点,通常情况下,在对被审计数据进行分析时,常常选择孤立点分析技术。  (一)孤立点  孤立点是数据集中与众不同的数据,使人怀疑这些数据并非随机偏差,而是产生于完全不同的机制。在聚类分析中,有的数据对象不属于任何的类或簇,这样的数据对象在聚类中称为噪声,而在孤立点分析中,则称为孤立点。孤立点是个相对的定义,特别地,在审计领域,审计数据初始分布模型假设的不同,或研究者在不同的检测

5、背景下,都会得出不同的结论。  鉴于很多人为或非人为的原因都会导致孤立点的产生,如人为执行错误或人为故意操纵数据为达到某种目的而致使孤立点的产生,再如仪器测量错误、系统故障、数据总体中的自然偏差或固有的数据变异都会导致孤立点的产生,我们要对孤立点产生的原因进行全面分析。但最重要的是,审计人员要对这些孤立点保持敏感性,并分析出孤立点背后产生的深层次原因,来获取有价值的审计信息。  (二)孤立点分析方法  1.孤立点分析方法的概念  孤立点分析方法可简述为:给定一个有n个数据点或对象的集合及预期的孤立点数目k,发现与

6、剩余的数据相比是显著异常的、孤立的、或不一致的前k个对象的过程。因此,孤立点分析实际上可以被看作两个子问题:  (1)在给定的数据集合中定义什么样的数据是不一致的;  (2)找到一个有效的方法来检测这样的不一致数据。  2.孤立点分析方法介绍  (1)基于统计的方法  当数据集的概率分布及参数(如正态分布、泊松分布等,均值、方差)已知或需经多次验证并试图得出数据真实的概率分布或参数特征时,一般使用基于统计的方法。此方法尤其用于数值型数据。孤立点的确定主要是通过检验偏离统计模型的不一致数据,并统计出其个数,分析其性

7、态。  (2)基于距离的方法  Knorr和Ng提出了一种体现孤立点本质的定义,即若一个数据对象与数据域中大多数对象之间的距离(相异度)都大于某个阈值,将此数据对象确认为一个孤立点。阈值的设定是在对被审计数据清洗,并检验其有效性之后,据审计数据所属行业的特点,将行业常规值预先设定为阈值,或经公式计算得出阈值。此方法有效的避免了基于统计方法中数据分布特征确定的问题。  (3)基于偏离的方法  基于偏离的孤立点挖掘是通过检查一组对象的主要特征来确定孤立点。与给出的描述“偏离”的对象被认为是孤立点。此孤立点挖掘有两种常

8、用的技术:第一种序列异常技术,是一种基于相异度函数(往往是审计数据集的总方差)的有效方法,预先定义样本集的一般特征,其余“偏离”这些特征的样本属于异常样本。第二种OLAP数据立方体技术,在审计时,对那些标为异常的单元下钻,可能会发现更细节或较低层次的异常。  (4)基于密度的方法  Breuning等人基于密度聚类思想的启发,于2000年提出了一种基于局部密度来检测孤立点

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。