1、 大数据环境下审计技术方法的探索 姓 名:胡丽丽 单 位:赣榆县审计局 电 话: 0518 86224915 邮 编: 222100 大数据环境下审计技术方法的探索 【摘要】 审计数据分析是通过对数据的观察和分析发现疑点,寻求突破点,为业务审计提供线索;而随着审计 大 数据 时代的到来 ,大数据给现代审计提供了新的技术和方法,要求人们把握大数据的特点,变革现代审计的思维与技术和方法,推动大数据时代审计的发展。本文首先分析了大数据时代的概念,在 此基础上分析了大数据时代审计工作的变化,简要举例说明审计数据方法的运用,以及审计面临的新风险,最后提出了相关建议。 【关键字】大数据时代,审计工作,风险
2、防范,审计建议 。 一、大数据时代的概念 大数据顾名思义, 就是数据越来越大 。 大数据概念是一个宽泛的结合体,不仅包括大数据本身,还包括对大数据进行分析的一系列的大数据技术。为了能够对巨量的大数据进行分析,必须采用大数据采集、处理、分析和形象化技术和方法才能完成。这些方法不仅涉及到计算机科学,而且涉及到统计学、应用数学等领域,而新的大数据技术方法还在不断产 生。常见的大数据技术有 A/B 测试、关联规则学习、分组、簇类分析、众包、数据整合、数据挖掘、集成学习、遗传算法、机器学习、自然语言处理、神经网络、网络分析、优化、模式识别、预测模型、回归分析、情感分析、信号处理、空间分析、形象化等。这些
3、技术都有自己的应用领域,并相互交叉。 进入 2012 年 网络的高速发展 。大数据( big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数大数据时代来临,并命名与之相关的技术发展与创新。它曾经上过纽约时报华尔街日报的专栏封面,进入美国白宫官网的新闻 ,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然现在企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。大数据随着云时代的来临,大数据( Big d
4、ata)也吸引了越来越多的关注。著云台的分析师团队认为,大数据( Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。 大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像 MapReduce 一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用 G或 T 来衡量。 二、大数据时代对审计技术方法的要求 审计依数据而生,用数据说话。大数据具有数据量大、数据类型多、价值密度低、处理速度
5、快的四“ V”特征。在大数据时代,被审计单位的财务数据不再是主要的,而大量的是业务数据、关联数据,数据采集难、管理难、有效运 用更难,审计人员不懂得数据分析技术将彻底失去审计资格。 大数据是来源分散的需要专门技术才能利用的有价值的数据集合。大数据来源是多方面的,既可以来源于企业的信息系统,也可以是个人在社交媒体中提交的数据,还可以是物联网传感器和智能设备自动搜集的数据。大数据来源的广泛性既体现了其与一般数据不同的特点,也揭示了其数据价值的来源。不同来源的数据可相互印证和关联,为在大数据技术下进行深入数据挖掘、智能分析打下了基础。同时,我国各个行业领域也正积极探索对大数据的分析和利用。如公安部门
6、通过对海量行车数据进行挖掘分析,几秒内 即可完成行车轨迹分析与预测,从而发现套牌车等违规问题;医疗卫生机构通过分析医院数据,判断流行病发展趋势等。平安保险借助大数据加强消费者洞察,从过去的客户分群进化到从人定制。更进一步,大数据将在产品设计的精算、定价、弹性曲线等环节发挥作用,既有利于改良现有产品形态,也有利于实现险种创新。 大数据时代给审计工作转型升级、职能发挥带来了挑战和机遇,如大数据时代,可以“集中分析,发现疑点、分散核查、系统研究” 轻松实现审计全覆盖,可以“大兵团”作战发挥审计整体优势,可以在苗头初现时就能揭示问题的起因和趋势以发挥审计 “免疫系统”功能等。随着国家治理理论的发展,审
7、计数据分析将在宏观决策支持、政策风险与实施效益评价方向上继续发展,通过对相关大数据的获取和分析,洞察行业整体走向和制度实施效果,认识演变规律,进而对国家、行业、部门的制度出台及发展策略做出前瞻性的思考和战略性的分析。大数据时代,给审计带来难度的同时也带来了机遇,审计机关和审计人员必须正确认识、系统研究、加大投入、充分利用大数据发挥审计在国家治理体系中的作用。国务院印发关于加强审计工作的意见,第 19 条明确提出:探索在审计实践中运用大数据技术的途径,加大数据综合 利用力度,提高运用信息化技术查核问题、评价判断、宏观分析的能力。这是国家首次在文件中将大数据审计列入审计信息化工作重点,为我们今后工
8、作指明方向。 审计部门作为综合性的经济管理和监督部门,保持对社会经济信息的灵敏感触、及时剖析、适时反应,是公共财政和经济运行管理工作在大数据时代实现信息化、高科技化的内在要求,而大数据思维在审计领域的有效运用也成为时势所需。积极探索创新,加快推进大数据环境下的审计信息化建设是顺应时代的必然选择。 三、大数据时代提升审计方法的具体实例 某地区通过检查该地区 2013 年度 残疾人联合会 在发放重残补贴时是否严格执行相关规定 ;是否严格执行符合补贴对象条件的规定 ;否存在有关业务人员审核不严,造成无残疾证领取重残补贴、有残疾证但残疾等级不符合条件领取重残补贴、死亡的残疾人员仍领取重残补贴的问题。
9、编写违规领取残疾人重残补贴的计算机审计方法 所需数据 序号 数据资料名称 1 该地区残疾人员信息 2 重残补贴明细表 3 某地区低保明细表 4 某地区同一年度死亡人员明细表 分析步骤 步骤 内容 1 无证领取补贴的情况 利用 AO2011 现场审计实施系统,查询 2013 年度领取重残补贴的合规性, 查找是否存在无证领取补贴的情况。 1.1 业务数据检查。 无证领取补贴的情况 查询 2013 年度领取重残补贴情况记录,首先将该表与全 地区 残疾人信息进行关联,编写是无证领取补贴的情况,并生成疑点管理。 1.2 根据审计查询结果可以导到资料树或发送到电子表,然后利用Excel 的求和功能,求出无
10、残疾证领取重残补贴总额。 2 有证取补贴的情况 利用 AO2011 现场审计实施系统,查询 2013 年度领取重残补贴的合规性,查找是否存在有证不符合条件领取补贴的情况。 2.1 业务数据检查。 生成有证人员领取补贴的新表 将 重残补贴明细表 与 全 地区 残疾人员信息 两张表进行关联生成有残疾证领取补贴的明细表。 2.2 查询有证领取补贴的等级不符合规定 根据上面查询生成有证的残疾人员领取护理补贴明细表,然后编写有证领取补贴的人员等级不为一级二级残疾的方法,并生成疑点管理。 2.3 根据审计查询结果可以导到资料树或发送到电子表,然后利用Excel 的求和功能,求出有证但残疾等级不合规定领取补
11、贴总额。 2.4 生成符合残疾等级条件的重残补贴明细新表 根据上面的查询结果将重新成的“符合残疾等级条件的重残补贴明细”,即级为一、二 级新表。 2.5 查询不属于低保的残疾人领取补贴 根据上面查询生成符合条件残疾人员领取补贴明细表,与SJ_DB_JTXX_全地区 _2013低保家庭信息表,设置此明细表中的人员是不属于低保人员,并生成疑点管理。 2.6 根据审计查询结果可以导到资料树或发送到电子表,然后利用Excel 的求和功能,求出有证但不属低保范围领取重残补贴总额。 3 利用 AO2011 现场审计实施系统,查询 2013 年度领取重残补贴的合规性,查找是否存在死亡人员领取补贴的情况。 3
12、.1 死亡人员领取重残补贴的审查 将 护理补贴 2013 与 2013 年度 死亡人员明细表 两张表进行关联,编写死亡人员领取重残疾补贴的情况,并生成疑点管理。 3.2 根据审计查询结果可以导到资料树或发送到电子表,然后利用Excel 的求和功能,求出死亡人员领取重残补贴总额。 通过编写方法语言 步骤 内容 1.1 var CXYJ,cxjg,IsEmpty; /定义变量 CXYJ:查询语句 ,cxjg:查询结果 begin CXYJ:=select * from 重残补贴明细表 $ where 残疾人证号码 not in (select 残疾 人证号码 from 某地区残疾人员信息 ); /
13、利用 SQL创建数据集 cxjg:=CreateQ(cxyj,-1); IsEmpty:=qeof(cxjg if IsEmpty1 then begin repeat AddTransRslt(cxjg,不符合残疾等级的领取重残补贴 ); IsEmpty:=qmov(cxjg,1); IsEmpty:=qeof(cxjg); until IsEmpty=1; TransBatch(cxjg,不符合残疾等级的领取重残补贴 ); end else begin ShowMsg(没有符合条件的记录 ); end; end. 2.3 /定义变量 var SqlStr; Begin /Sql语句赋值给变
14、量 SqlStr:=Select * From 重残补贴明细 WHERE (残疾人证号码 like %1) or (残疾人证号码 like %2) ; /生成临时表 CreateTempTable(符合残疾等级的重残补贴明细 ,SqlStr); addtable (符合残疾等级的重残补贴明细 ); end. 2.4 var CXYJ,cxjg,IsEmpty; /定义变量 CXYJ:查询语句 ,cxjg:查询结果 begin CXYJ:=Select a.* From 重残补贴明细 a left Join SJ_DB_JTXX_某地区 _2013 b On a.低保证号 =b.DBZH WHE
15、RE b.DBZH is null; /利用 SQL创建数据集 cxjg:=CreateQ(cxyj,-1); IsEmpty:=qeof(cxjg); if IsEmpty 0 and (b.死亡日期 Between 200801 And 201312) and a.现住址 =b.村 名 ; /利用 SQL创建数据集 cxjg:=CreateQ(cxyj,-1); IsEmpty:=qeof(cxjg); if IsEmpty1 then begin repeat AddTransRslt(cxjg,死亡人员领取重残补贴 ); IsEmpty:=qmov(cxjg,1); IsEmpty:=
16、qeof(cxjg); until IsEmpty=1; TransBatch(cxjg,死亡人员领取重残补贴 ); end else begin ShowMsg(没有符合条件的记录 ); end; end. 通过上述审计方法,从大量的数据中快速准确地筛选出审计疑点,进行审计核实,检查该地区残疾人联合会在发放重残补贴时是否严格执行相关规定,从而发挥审计监督作用。 再如,某地区审计局在地 区本级预算执行情况审计中创新方法,集中全局计算机审计精干力量,将该地区财政和各预算执行单位数据采集后,利用“大数据”的方法进行分析比对,并将疑点分类移交相关审计组进行查证。有效解决了各审计组计算机审计技术力量不
17、均衡,数据分析比对挖掘得不深,疑点问题排查不准确的问题。节省了审计时间和审计成本,提高了审计效率。同时,各审计小组之间通过相互分享审计经验,交流审计思路和方法,进一步提高了审计水平,促进了审计质量的提升。 四、大数据时代审计 面临 的风险及防控 信息是把双刃剑,大数据更是如此。我们在享受大数据带来的成果时 ,也不断受到大数据风险的侵扰。当前,审计机关在探索大数据审计过程中主要存在三大问题:在大数据的风险管理方面应该投入更多的精力,需要做好以下几个方面的工作。 (一)数据缺失不连贯 。 大数据审计,离开数据资源就是空谈。虽然各地数据中心中大多已获取财政预算执行、地税征管、社保资金等业务数据以及车
18、辆、人口、房产登记等第三方基础数据。但是,这些数据都只能通过实施审计项目获取,如果第二年不审计这些资金,相关单位在数据提供时会不配合,认为不在审计期间或者不是审计范围,即使提供了也会是处理后的数据而非原始数据。数据不能及时更 新、内容不完整等问题的出现,归结起来主要是未形成数据采集的长效机制。国务院近日印发的关于加强审计工作的意见为审计机关采集获取电子数据资料提供了制度保障。各地应加强与经常性被审计单位的联系和协调,加快研究未下达审计通知书时审计数据的报送制度,逐步建立起电子数据报送的长效机制,让静止、碎片化的数据动态、连续化,为大数据审计创建基础数据环境。 (二)数据孤立无关联 。 大数据的
19、魅力和价值只有在数据关联、汇聚、融合后方能体现出来。当前一方面由于被审计单位业务不规范,审计机关从多个口径获取的数据存在表述不一致、信 息不完整、内容不规范的问题,人为地给数据关联匹配制造了障碍。例如单位国库支付业务数据和财务核算数据就无法关联,由于财政对这方面没有硬性规定,单位会计做账时可能就不会将每一笔项目支出与国库预算项目名称对应上,审计人员在做项目剖析时需要大量翻阅纸质凭证。另一方面,由于审计人员自身存在技术瓶颈,习惯依靠传统数据库查询技术,未掌握大数据信息抽取、中文分词、模糊匹配等技术,较难突破数据关联匹配的难题。这方面,审计署广州特派办做了很好的尝试,通过运用中文分词、同义近义词、
20、知识学习、数据挖掘等大数据技术,借助 IBM 数据集 成处理软件,实现了用电数据、房屋销售数据、银行信贷数据的关联交叉比对,直指空置房问题。 因此,我们可以从两方面着手解决大数据管理问题,一是通过审计逐步推动被审计单位会计核算规范化,加快促进数据标准化;二是引进各类大数据处理技术和大数据集成处理工具,同时按照分布式、虚拟化架构改造硬件环境,建立大数据管理平台,能将各种门类的数据通过标准化和关联之后汇聚和融合在一起,形成一个统一的大数据仓库,提供可扩展的数据处理能力,从而实现从整体视角对审计对象进行较为全面立体式多角度、多维度数据查询分析。 (三)分析大数据思路 和工具缺乏。数据分析是大数据审计
21、的核心。当前主要存在两方面问题:一是在大数据环境下,如何利用跨多部门、多业务、多层次、多领域的审计数据,从广度和深度上探索新的数据分析方法,没有较多可供借鉴的成功经验,审计人员在大数据分析上缺少思路;二是目前可供审计人员开展数据分析的工具只有 AO 和数据库查询软件,只能实现一般性关系型查询分析,要想真正从多源异构、纷繁复杂的大数据中挖掘出其蕴含的价值,并对未来提出合理预测和建议,亟需引入大数据综合分析软件。大数据综合分析软件依托大数据处理分析技术,运用聚类、关联分析等新方法,能 够实现对审计对象的各个侧面进行更多的数据描述,可以实现从整体视角对审计对象进行较为全面立体式多角度、多维度数据分析
22、,这样信息的记录更加全面,提供审计分析的数据更具综合性,通过跨领域、整体视角的数据比对分析,更有利于提高发现问题的概率、提高审计效率、降低审计风险。 五、应对大数据时代对审计的挑战 当前,我国与大数据相关的技术和工具的运用相当不成熟,无论是在大数据存储分析能力上,还是处理技术上都还很薄弱,数据仓库、数据挖掘等领域的技术普遍落后于国外先进水平。所以,要达到信息智能化审计,无论从人力、财力还是技术上 都需要长时间大力投入。因为审计工作只有驾驭了大数据,通过建立高级大数据的分析模型,实现快速抽取大数据的核心数据,高效分析这些核心数据并从中发现价值,才能进行全面而深入的分析挖掘,才能在海量数据中迅速、准确地发现疑点,使审计工作真正成为信息化智能审计,解决审计中存在的各种