1、1我国上市公司财务欺诈识别的实证研究基金项目: 湖北省教育厅基金项目(2011jyty010) 摘 要:以我国上市公司为研究对象,从偿债能力、盈利能力、营运能力、资产质量指标以及公司治理结构五个方面选取 14 个指标,建立了上市公司财务欺诈的 Logistic 回归识别模型,并用检验样本对模型进行检验。研究结果表明该模型具有良好的预测精度,可以作为证券投资者和分析人员使用的一种有效的财务欺诈识别工具。 关键词:财务欺诈 识别模型 Logistic 多元回归模型 一、引言 财务欺诈会导致公司财务数据及其他相关数据出现异常,通过对这些数据进行分析,可以识别出公司是否存在财务欺诈现象。目前从参考文献
2、来看,统计模型和人工智能模型两大类被广泛研究并应用的财务欺诈识别模型中。但所有模型在使用时需要大量的历史样本数据,其中神经网络模型需要很强的数学理论作支撑,人工智能模型需要以实际经验为依据,而统计模型的数据必须服从正态分布。不要求数据服从正态分布的方法可以选择 Logistic 回归模型,实际应用时,把具体样本数据代入模型得到的是一个概率值,比较形象,而且通过该方法建立的上市公司欺诈预测模型更加稳健。 论文研究的是上市公司财务欺诈识别模型的选择及应用问题,因变量的取值只有“欺诈”和“非欺诈”两种情况,而 Logistic 回归模型能2很好的实现此目的。因此,本文通过治理结构以及公司的财务特征选
3、择Logistic 多元回归模型建立了上市公司财务欺诈的识别模型。 二、研究样本及指标建设 1.研究样本的选取 论文将欺诈公司和非欺诈公司的样本数据随机分为两组,一组用于样本训练,另一组用于样本测试。用训练样本的数据建立财务欺诈识别模型,用测试样本检验识别模型的有效性。 选择规模相当的公司逐个进行匹配来控制规模对分析结果的影响。两类样本所对应的总资产均值比较见表 1。由于 Sig.0.05,所以欺诈公司和非欺诈公司总资产的均值不具有显著性。 2.样本指标的确定 参照了文献研究结果,并结合我国的实际情况、财务报告欺诈的普遍手法、欺诈公司的公司治理结构的特点,并且考虑了审计报告意见类型对公司财务报
4、告欺诈的影响来选择指标。本文最终选择了以下 14 个指标作为研究变量,具体为:期间费用占收入比重(记为 X1)=(营业费用+管理费用+财务费用)/主营业务收入,主营业务利润/利润总额(记为X2)及所得税/利润总额(记为 X3)代表盈利能力;应收款项占流动资产比重(记为 X4) 、以现金偿还流动负债的能力(记为 X5) 、销售收现率(记为 X6)及资产负债率(记为 X7)=负债总额/资产总额代表偿债能力;存货/主营业务成本(记为 X8) 、应收款项/主营业务收入(记为 X9) 、应付款项/主营业务成本(记为 X10) ;资产质量指数(记为 X11)=1-(流动资产+固定资产)/资产总额、经营活动
5、现金净流量/资产总额(记为3X12) ;而上市公司治理结构指标则选择第一大股东控股的比例(记为X13)及公司前五大股东持股比例的平方和(记为 X14) 。 三、识别模型的建立与分析 1.基本原理和方法 Logistic 回归模型不是自变量和应变量关系的简单线性模型,而是概率 的 Logit 变换形式: , 其中为截距项, 为回归系数。通过计算出回归系数和截距项就得到了 Logistic 回归模型,进而计算出其事件的概率 。然后将测试样本的自变量代入模型就可以计算出所属每个类别的概率,取最大概率所在的类别即为测试样本所属的类别。 2.实证研究 本文从中国证监会网站公开披露的对财务欺诈上市公司的处
6、罚公告中选择样本数据。剔除了其中数据不全的上市公司后选取了 27 家存在财务欺诈上市公司作为样本。根据财务欺诈上市公司的样本特性选择 27 家与之相匹配的非财务欺诈公司作为参照。其中从中各随机选取 17 家存在财务欺诈和不存在财务欺诈的上市公司作为学习样本,将剩下的数据作为检验样本。 应用 Logistic 多元回归模型,采用 SPSS 统计软件提供的 Binary Logstic 分析过程,采用向后逐步筛选法,选择 Backward:Wald 方式,根据 Wald 统计量的概率值将变量剔除出模型。经过迭代 10 次得到的部分输出结果见表 2: 由表 3 可以看出:回归过程分为 10 个步骤进
7、行,Wald 统计检验表明4所有方程中的变量均在小于等于 0.05 的显著水平上通过。由变量的系数可以得到上市公司发生财务欺诈的概率为: 因此,可以在 X1(期间费用占收入比重) ,X4(应收款项占流动资产比重) 、X6(销售收现率) 、X11(资产质量指数) 、X13(第一大股东控股的比例)这五个指标变量已知的情况下,计算出该公司发生欺诈的概率的大小。 从模型的形式可以看出:识别效果最优的判定点是 0. 5,如果样本数据进入模型后得到的结果大于 0. 5,可以判定为存在财务欺诈; 如果样本数据进入模型得到的结果小于等于 0. 5,可以判定为非财务欺诈。对 17 个财务报告欺诈样本和 17 个
8、非财务报告欺诈样本的数据判定结果如表 3。 对于投资者来说,将欺诈公司误判为非欺诈公司这一类错误所可能产生的损失远远大于将非欺诈公司误判为欺诈公司的风险,由于此类错误可能导致投资者发生投资损失,而另一类错误最多是让投资者丧失可能的获利机会。从上表中可以看出步骤四的 17 个欺诈样本中,有 15 家被判定为存在财务欺诈可能性较大,被误判的有 2 个正常样本,准确率为 88.2%;在 17 个正常样本中,判别正确样本有 16 个,判别错误的有 1个,准确率为 94.1%,综合起来,Logistic 多元回归模型对总体的判别正确率达到了 91.2%。 3.模型的检验 根据上市公司发生财务欺诈的概率公
9、式,同样以 0.5 为判别点,对选取的检验样本,即对 10 家财务欺诈公司及 10 家非财务欺诈公司进行5判别,结果如表 4。 从检验的效果来看,模型对于财务欺诈公司的判别准确率要略高于非欺诈公司,对待检测样本做出的评判结果正确率到达 95%,整体效果比较好。 四、结论 论文通过对两类上市公司样本的盈利能力、偿债能力、营运能力和资产质量指标和公司治理结构五个方面的 14 个财务指标数据进行Logistic 回归分析后发现,最终进入模型的只有期间费用占收入比重、应收款项占流动资产比重、销售收现率、资产质量指数及第一大股东控股的比例这五个指标。没有最后进入回归方程的指标并不是因为它们对因变量没有解
10、释力,只是由于与其他自变量之间存在很强的相关性而被剔除掉了。 结果表明,对训练样本的判别准确率为 91.2%,对 20 个检验样本的判别准确率高达 95%,尤其是对欺诈的样本的判别结果与实际情况完全吻合。这表明该模型的识别能力较强,有一定的实际意义。 参考文献: 1陈收,杨芳.上市公司财务欺诈识别模型及其应用J.统计与决策,2007,3:100101 2张丽红,徐惠珍.上市公司财务舞弊识别实证分析J.财会通讯,2011,11:2324 3潘彬,凌飞.引入违约距离的上市公司财务危机预警应用J.系统工程,2012,3(30):4551 64杨海军,王太雷. 基于模糊支持向量机的上市公司财务困境预测
11、J.管理科学学报,2009, 3(12):102110 5杨淑娥,黄礼.基于 BP 神经网络的上市公司财务预警模型J.系统工程理论与实践, 2005(1):1218,26 6吴启富,耿霄.上市公司财务状况预警研究基于判别函数的财务报表分析J.财会月刊,2010,15:89 7文拥军,朱文杰.上市公司财务报告舞弊识别实证研究J.财会通讯,2009,1:36-37 8许存兴,魏建中.基于逻辑回归分析的虚假财务识别模型构建J.财会通讯,2010,6:86-88 作者简介: 蒋慧峰(1980- ) , 男, 博士, 讲师, 研究方向:系统工程, 复杂系统建模等;朱文杰(1979- ) ,女,硕士,研究方向:财务管理等