数据挖掘技术在舞弊审计中的应用
1 引言
Anron(美国)、Ahold(荷兰)、Parmalat(意大利)和 Addeco(瑞士)财务丑闻的发
生,揭示了财务报告舞弊是一个世界性的问题,王 泽霞(2004)也认为:美国法律案件中管
理层舞弊占绝大多数、中国会计信息失真主要是单位负责人造成的、我国财务报表审计中
存在的重大错报主要为管理舞 弊。舞弊已成为财务报告团体的流行病。舞弊是一个很重要
的问题,据估计舞弊使美国企业每一美元的收入损失近 6%。[1]欺诈性的财务报告不仅损
害了商业团 体和会计职业的信誉,也损害了利益相关者。尽管各国监管机构等相关部门多
次出台各种政策、不断完善会计及审计准则,财务报告舞弊仍屡禁不止。财务报告使用 者
期望审计人员提高舞弊审计的能力,以发现和报告更多的舞弊。识别管理舞弊迹象因此成
为风险导向审计中审计人员从总体上考察会计报表的公允表达,寻找潜在 错报高风险领域
的主要任务。
与此同时各行各业信息系统的流行与普及使得各种组织实体使用的信息系统,生产着大
量的电子数据,造成被审计的电子数据也是海量的,增加了舞弊审计的难度。 如:某省某银
行某年仅 2 月份会计传票流水多达 562783 条;某海关半年内的进口报关单的数目多达
61458 条。不仅如此,计算机技术应用,计算机舞弊手段也不断发展。电子化和网络化环
境使得作弊手法越发隐蔽,数据难以追踪,审计无从下手。
因此,舞弊审计不仅需要从大量的公司年报、中报等财务数据中提取财务信息,还要从
企业本身的组织结构特征、行业特征、经营决策特征等相关非财务信息中寻找 线索,面对
浩如烟海的财务与非财务数据,仅仅根据审计人员的经验和手工劳动,其识别效果和效率
都不理想。数据挖掘技术作为一种决策支持技术,能够从海量 的、不完全的、模糊的、随
机的实际数据中,帮助人们发现那些重要且较为隐蔽的线索,从而来辅助审计人员进行审
计数据分析,提高识别舞弊的质量和效率。 2007 年开始实施的《中国注册会计师审计准则
第 1141 号财务报表审计中对舞弊的考虑》要求加强财务报表审计中的舞弊审计,但相对于
舞弊方式的隐蔽性、 专业性和创新性,目前的状况很难适应反舞弊形势的需要,迫切需要
设计我国的舞弊审计数据挖掘系统,提高我国舞弊发现效率,有效打击舞弊违法活动。
2 数据挖掘概述
数据挖掘又称数据开采、数据发掘等,指从大量的、不完全的、有噪声的、模糊的、随机
的数据中,提取隐含在其中的、事先不知道的、但又是潜在有用的信息和知 识的过程。该
技术特别适合处理海量数据,能够建立预测模型,分析历史及当前数据,自动地、智能地
对各种数据资料进行反复的、全面充分的调用分析,转化为有 用的信息和知识,从中发现
隐藏的关系和模式,并帮助预测未来可能发生的事件。该技术高度程序化的特征决定其分
析、判断的客观性,能够排除人为干扰,提高审 计数据分析结论的准确性。数据挖掘技术
可以通过对舞弊案例进行机器学习(machine learning),总结有关舞弊渠道、环节等的特征
与规律,与待处理数据进行对照和比较,提高数据处理、分析的广度及深度,不断获得新
知识对模型进行动 态更新,为审计人员提供更多线索。数据挖掘技术也可以从大量的复杂
关联数据,将会计人员眼中不显著的虚假财务报告与自然形成财务报告之间的内在差异放
评论0