1、 基于混合粗糙集与 ANN 的上市公司财务危机预警研究Research on Listed ComPany Financial Crisis Early-waring Based on Rouch sets and Neural Netwrok周 喜 吴可夫(湖南商学院,会计学院,湖南 长沙 410205)摘要:利用混合粗糙集 ANN 数据挖掘技术和相关敏感财务及非财务指标构建财务危机预警模型,对 30 家 ST 和 90 家非 ST 的 A 股制造业上市公司的财务数据进行实证检验,结果表明结合粗糙集的知识约简理论和神经网络的推理能力具有较高的财务危机预测准确率和较好的实际应用价值。关键词:粗
2、糙集;人工神经网络;上市公司;财务危机;预警一、研究现状及意义:随着我国证券市场的迅速扩大,以成为国民经济的重要组成部分。到目前为止,仅 A 股上市公司就超过 1000 家,虽然上市公司数量的不断增长,规模不断扩大,但大多数上市公司都存在经营业绩不佳和抗御风险的能力较弱等问题。如何建立有效的财务危机预警系统来预防财务危机的到来,对企业、投资者和政府都有重大意义。1、研究现状国内,上市公司财务危机预警方向的理论研究起步时间不长,而实证研究以传统的统计学方式为主。随着国内研究与国外研究相比存在较大的差距,但国内还是有学者结合中国企业的实际情况进行了可贵的探索,也得到了一些有重要一样的研究成果。陈静
3、(1999)是我国第一个对上市公司财务危机进行预警研究的学者,她对西方预警模型在我国是否适用进行了实证研究。高培业,张道坤(2000)建立了贝叶斯和 Fisher 模型、逻辑回归 Logitic 判别模型和Probit 判别模型,并进行了实证比较分析。杨保安( 2001)构建一个基于单隐层的 BP 神经网络的财务危机预警模型,经过实证检验显示其判别准确率搞达90%以上。乔卓(2002)构建了基于 Levenberg-Marquardt 算法的神经网络预测模型。刘洪,何光军(2004)分别采用判别分析法,逻辑回归 Logitic 和人工神经网络方法进行建模分析。杨淑娥,黄礼(2005)采用了 B
4、P 神经网络技术构建财务危机预警模型。宁静鞭(2007)分别采用 K 近邻和逻辑回归 Logitic 方法进行了建模与实证检验。唐锋,孙凯(2008)构建了基于 BP 神经网络和主成分分析法的财务危机预警模型。在国外,西方经济学者早在上世纪 30 年代就开始进行财务危机预警研究,以企业的敏感性财务指标为基础,提出和构建许多财务危机预警的方式和模型,结合各国上市公司的实际数据和特点,通过实证检验来预预测企业是否将会发生财务危机。Odom,Sharda(1990)采用类神经网络构建了企业破产预警模型。Coats,Fant(1993)运用神经网络技术学习审计专家的结论来预测财务失败。Marco,Va
5、retto(1995)将神经网络技术应用到企业财务危机预测中。Luther(1998)构建了遗传算法神经网络模型和多元逻辑回归 Logitic 模型,实证发现神经网络的预测准确率远高于多元逻辑回归Logitic。G Zhang etal(1999)利用神经网络技术对 220 家配对样本的企业进行财务危机预测,研究结果表明神经网络的准确性远远高于逻辑回归 Logitic 分析法。Kyong(2006)建立了混合神经网络和遗传算法理论的动态财务预测模型等。2、研究意义财务危机预警是企业财务管理的重要内容,也是上市公司及时发现隐患危机并加以防范,保护投资者和债权人的利益,协助政府管理部门的监控的主要
6、手段与机制。因此,通过完善的预测方法和信息技术构建有效的财务预警体系,以及上市公司财务危机预警的实证研究是具有重要的应用价值和现实意义。从宏观角度来看,财务危机预警系统能及时地输出上市公司陷入财务危机的信息,有助于政府实施和制定宏观的经济政策和提供科学化的服务,以保证社会主义市场经济的平稳发展,有助于改善资源的宏观配置,严格控制濒临破产企业的财政拨款,减少国有资产流失;从微观角度上来看,财务危机预警系统的构建有利于管理层加强内部控制,改善经营管理,防患未然;有利于证券会等监管部门对上市公司的监督和管理;有利于利益相关者做出正确及时的决策,维护自身利益;有利于提高审计人员警惕性,降低审计风险。此
7、外,数据挖掘技术在财务危机预警中的应用研究也有利于丰富我国财务预警理论。二、相关名词概述1、财务危机狭义的财务危机是指企业破产。广义的财务危机指的是企业出现的经济现象,如债券不偿付,不能支付优先股和银行透支等现象。关于财务危机的定义,国内外学术界有不同的观点。国外大多数学者认为企业提出破产申请行为是企业进入财务的标志。国内大多数学者认为上市公司中被 ST 的公司就是财务危机的企业。本文也认同国内学者提出的观点,将被 ST 的企业作为财务危机型企业研究。2、财务危机预警财务危机预警是以企业信息为基础,利用上市公司提供的财务报表,经营计划等相关会计资料,借助比率分析、比较分析、因素分析等数理统计和
8、数据挖掘方法,对企业财务即将呈现的问题进行实时预测报警,督促利益相关者采取有效措施,避免潜在的危机演变成损失。3、粗糙集粗糙集理论是一种研究不精确、不完整和不确定性知识的。可用于分类,发现不准确数据或噪声数据内在的结构联系。粗糙集理论由波兰科学家Z.Pawlak 在 1982 年首先提出,该理论具有许多优点:非常严密的分类问题处理的数学方法;将知识定义为不可分辨关系的类,方便用数学方法处理;可混合神经网络、遗传算法等理论,提供鲁棒性强和成本低的解决方案;该理论研究是应用驱动的,其实用性强;无需提供先验知识。4、人工神经网络 ANN人工神经网络是模仿大脑神经及网格的结构和功能,仿效生物处理模式来
9、获得智能处理信息的理论。神经网络由大量神经元按一定规律复杂连接起来,采用由底到顶的学习方法,具有自我学习、自我组织和并行式的“集体”工作方式。其优点有:对噪声数据的承受能力较强;对未经训练的数据分类;可进行分布计算等。三、混合粗糙 ANN 预警模型的构建1、混合粗糙集与 ANN 预警系统的基本原理采用基于粗糙集与 ANN 的财务危机预警模型时,样本、财务指标以及人员素质对模型的准确率有很大的影响,特别是财务指标的选择 ,而影响企业财务危机指标的有销售利润率、资本收益率、资产报酬率和营运资金占有率等,其中有一些指标及数据间存在较明显的相关性,如果把预定指标都作为 ANN的输入变量,将增加网络的复
10、杂度和数据运算时间,也降低计算的精度。为解决上述问题,可运用粗糙集理论中的知识约简方法来减少信息表达的属性指标,去掉冗余指标和信息,利用知识约简方法简化了 ANN 的训练集,即将少了ANN 系统的复杂性和训练时间,但是粗糙集理论在知识推理、预测和自我学习上没有优势。人工神经网络 ANN 有良好的推理能力、分类能力和学习能力,能从海量的数据中发现规则、提取信息及强大的动态预测功能。两种方法的相互结合和补充将取长补短,从而增强了人工神经网络处理财务危机预警这类非结构化、非线形等复杂问题的能力,也提高了模型实证检验的准确率。2、混合粗糙集 ANN 模型的结构设计根据传统 ANN 结构,可将混合粗糙集
11、与人工神经网络模型结构分为三层,即输入层、隐含层和输出层。2.1、网络层数的设计。对于多层神经网络来说最主要的任务就是确定可加强网络映射精度的隐含层的数目。虽然隐含层能增加网络处理能力,也可实现任意复杂系统的映射,如设计过多的隐含层将可能力导致网络训练难度加大,网络的效率和时效性降低。对于小型网络的边界判别问题和二进制分类问题,单隐含层能进行良好的分类,也能满足财务危机预警模型的构建和研究,本文采用单输入层、单隐含层和单输出层。2.2、输入层的设计。在财务危机预警模型中输入层就是企业各财务指标数据的样本 Xq=(X q1,X q2, Xq3,X qi, Xqn) T,其中 Xqi 为样本 q
12、的第 i 个条件属性。选择 n 个财务指标就构成 n 维数的输入空间。虽然输入维数对网络的预测准确率有较大的影响,但过多的扩大输入维数将加大网络负担,影响训练效果和时间。为了改善输入层节点设置的盲目性和主观性,本文引入粗糙集的知识约简理论,消除冗余信息和指标,有效降低了输入维数。即全面的选取 N 个财务指标,通过粗糙集属性约简后得到最简属性集,并将这些最具有分类功能的 n 个财务指标设置为神经网络输入层的节点。2.3、隐含层的设计。隐含层的节点数的选择对网络的性能有很大影响,如何多少单元和多少层都是复杂的问题。隐含层每个节点可确定一个判决面,节点也把 N 维输入空间分为两个部分,同时,又将第一
13、隐含节点形成的多个判决面组成判决域或判决空间,这些节点数有些用来提取图形特征,有些则用来完成特殊的功能。常用的改进 BP 神经网络动态调整学习算法是将隐含层节点设置多些,让网络自行调整学习来获得大小适合的隐含层节点数。公式为 L=,其中,L 为隐含层单元数,m 为51.03.7.054.21.043. nmn输入层单元数,n 为输出层单元数。2.4、输出层:通过神经网络模型将定性转化为定量的输出,用输出向量(0)和(1)来表示企业的财务危机状态:危机和安全。采用单节点输出层将大大简化网络结构和提高鉴别危机企业的预测准确率。3、混合粗糙集 ANN 财务危机预警模型的构建步骤基于混合粗糙集 ANN
14、 的预警模型具有并行计算能力强,无需处理数据外的其他先验知识和有较好的鲁棒性和低成本等优点,特别适合处理财务危机这类非线性的复杂数据。模型构建步骤如下:首先,选取上市公司作为研究样本并建立决策表,将上市公司财务指标作为财务指标体系,公司是否出现“ST”作为企业财务特征的判别,样本公司 T-3 年的财务数据作为决策表,各财务指标作为决策表的条件属性,当年是否“ST”对应决策属性。由于预警模型的属性较多,本文应用粗糙集的属性约简理论,通过粗糙集应用软件 ROSETTA 进行区分矩阵和区分函数对属性进行约简。再通过粗糙集的知识约简理论对决策表进行约简,除去信息表达的属性数量,减少冗余信息,简化训练集
15、,降低系统的复杂性和训练时间。最后,在 ANN 模型中设计好参数自适应学习算法对网络进行训练,确定网络权值矩阵和其他相关参数,利用样本数据和 ANN 强大的并行计算能力来处理财务危机预警这类非线性的复杂系统,并通过实证来检验模型的实际应用价值。4、样本的选择4.1 样本公司范围确定本文选择在沪深交易所上市的制作业 A 股上市公司作为研究样本范围,有以下原因:一、根据相关规定,B 股,H 股上市公司是由外资会计师事务所审计,采用的也是国际会计准则,而 A 股上市公司是由我国会计师事务所审计,执行的是我国的会计制度和会计准则,本文研究的我国上市公司的财务危机预警模型,所以选择了 A 股上市公司。二
16、、由于我国上市公司中制造类公司较多,占比例最大,其公司业务流程完整,财务状况,经营成果和盈利状况比较典型。4.2 样本公司数量及分组的确定本文研究总样本分估计样本组和检验样本组,其中估计样本组的数据是用于构建预警模型,检验样本是用来检测模型实际运用的预测准确率。参考肖远文、石晓军等学者的研究成果,本文采用 ST 与非 ST 为 1:3 配对比例,其 ST上市公司为 30 家,非 ST 上市公司为 90 家。选择配对的非 ST 上市公司也要满足以下几个基本原则:行业相同,消除公司样本的行业差异;年份相同,减少时间因素造成的干扰;规模相近,增强资产以外的其他指标间的可比性。4.3 选取 ST 公司
17、的基本原则本文选取并认定为 ST 公司对必须满足以下至少一个基本条件:因注册会计师意见而特别处理的公司;“近两个会计年度的审计结果的净利润均为负值” ,包括因“财务报告调整导致连续两年亏损的公司;一年亏损,但“股东权益低于注册资本”的巨额亏损公司。同时,在选取并认定为 ST 公司时将有以下情况的 ST 公司排除在外:两次以上被 ST 的公司;非财务状况异常而 ST 的公司;数据不完整的公司;上市三年就被 ST 的公司;无法进行配对的公司。4.4 样本数据会计年度的选取企业出现财务危机并非“一日之寒” ,而是一个连续的渐进的经营管理状况的动态恶化过程。本文选择企业近三年的财务数据作为研究样本,即
18、 2008-2010年三年的财务指标作为样本数据构建预警模型。4.5 样本数据的来源120 家上市公司近三年的所有财务及非财务数据均来自国泰安公司 CSMAR数据库。5、财务指标选取本文在借鉴前人研究成果的基础上,最终确定了具有代表性、可操作性的43 个预警指标,其中财务指标 29 个,非财务指标 14 个,如表 1 所示:表 1 企业财务危机预警指标体系指标属性 指标名称 指标名称X1 每股收益 X2 留存收益率X3 资产报酬率 X4 总资产净利润率X5 销售净利率 X6 销售毛利率X7 股东权益净利润率 X8 流动比率X9 速动比率 X10 资产负债率X11 利息保障倍数 X12 存货周转
19、率X13 应收账款周转率 X14 总资产周转率X15 流动资产周转率 X16 主营业务收入增长率X17 总资产增长率 X18 净利润增长率X19 资产积累率 X20 固定资产增长率X21 现金流量对流动债务比率 X22 现金流量对债务总额比率X23 现金流量对资产总额比率 X24 主营业务收入现金流量X25 每股经营现金流量 X26 现金获利指数X27 财务杠杆系数 X28 经营杠杆系数财务指标X29 综合杠杆K1 实际控制人类型 K2 第一大股东持股比例K3CR_5 指数 K4 第一大股东持股比率/第二 大股东持股比率K5 前五大股东持股比率平方之和K6 董事长与总经理的两职设置状况、K7
20、年度股东大会出席率 K8 董事会规模K9 前三名高管报酬总额 K10 独立董事比例K11 持股董事比例 K12 高管持股比例企业财务危机预警指标体系非财务指标K13 审计意见类型 K14 公告日是否延迟四、预警模型的实证检验1、选取估计和检验数据集。估计样本由 15 家 ST 公司和 45 家非 ST 公司组成,这组数据是用语构建财务危机预警模型,而用于检验财务预警模型的准确率的检验样本是由剩下的 15 家 ST 公司和 45 家非 ST 公司组成。2、利用使用 SPSS 统计分析软件提供的独立样本 T 检验进行指标的初次筛选,剔除 T 检验总体方差值大于等于 0.08 那些显著性差异不大的指
21、标,筛选后从 43 个指标中得到 11 个指标:X1、X3、X5、X10、X14、X17、X18、X21、X22 、X25 、K13。3、由于粗糙集只能对处理离散化的数据,所有本文使用 Matlab 的竞争性学习网络工具箱中的函数进行聚类,将决策表的每个属性的各个连续值组成的向量作为网络的输入,设定参数 Kohonen learning rare=0.02、Conscience learning rate=1.001 和 Number of neurons=3,训练后神经网络输出的数据就是完成样本集指标数据离散化的处理。4、再利用 Rosetta 粗糙集工程软件的 RSESGeneticRed
22、ucer 遗传运算规则对作为输入的离散化数据进行属性约简,最终粗糙集对本文初选的 11 个财务指标约简后得到 6 个财务指标。5、确定神经网络各层的节点数,并对模型进行初始化设置和估计样本的仿真训练。利用知识约简将科学的降低神经网络输入端的维数,最终确定输入层单元节点确定为 6 个,输出层元个数为 1 个,隐含层元个数为 12 个。利用Matlab 进行混合神经网络财务危机预警模型的初始化设置和网络仿真训练,基于快速 BP 算法的前向反馈型神经网络模型采用采用 Sigmoid 函数,学习规则上选取动量因子算法规则,学习速率采用自适应学习速率。训练参数设置如下:目标误差为 0.0001;学习速率
23、增加的比率 1.2;学习速率减少的比率为 0.8;动量因子为 0.96。在 Matlab 软件对估计样本的 6 个财务指标做为神经网络的输入端,采用基于快速 BP 的前向型神经网络进行网络训练,在经过 2186 次迭代生成权值矩阵后,神经网络训练结束并获得用于对估计样本组进行仿真的权值矩阵和相关阀值。经过 Matlab 软件对估计样本组上市公司财务数据的处理,得到的基于混合粗糙集 ANN 的财务危机预警模型的回判仿真准确率为 100%。6、再将训练好的神经网络对检测样本进行仿真,以判断模型的预测能力。经过 Matlab 软件对检测样本组的上市公司财务数据进行实证检验,其准确率为86.3%,说明
24、该模型具有良好的预测效果。五、总结基于粗糙集 ANN 的财务预警模型是利用粗糙集的知识约简优化神经网络模型的输入端,可降低了网络的复杂性,也提高网络训练速度,提高了神经网络学习能力、推理能力和分类能力,能较好地帮助企业管理者、投资者和债权人等利益相关者对企业财务危机状态进行动态测定和预警,与传统的单、多元统计分析方法及单一的神经网络相比,具有较高的预测准确率和实际应用价值。参考文献:1李季,严东超,赵虎城.基于动量因子技术的 BP 神经网络改进算法及应用J.电气应用,2005,24(6):42-442Altman.Finaneial Ratios:Diseriminant Analysis a
25、nd the Predietion of Corporate BankrupteyJ.Journal of Finanee,1968(3):589-6093姚宏善,沈轶.用遗传神经网络模型预测公司财务困境J.华中师范大学学报(自然科学版),2005,69(2):195-1974E.1Altman.Corporte Finaneial Distress and BankrupteyJ.John Wiley artificial neural network; Listed ComPany; Financial Crisis; pre-warning作 者 简 介 :周 喜 ( 1980.10-) , 男 , 湖 南 永 州 人 , 工程硕 士 , 湖 南 商 学 院 会 计 学 院 讲 师 ,研 究 方 向 : 财 务 数 据 挖 掘 和 会 计 信 息 化 。 吴 可 夫 ( 1973-) 男 , 湖 南 益 阳 人 ,博 士 , 湖 南 商 学 院 会 计 学 院 副 教 授 , 研 究 方 向 : 财 务 会 计 理 论 与 实 践 。-联 系 人 : 周 喜通 信 地 址 : 湖 南 省 长 沙 市 岳 麓 区 湖 南 商 学 院 会 计 学 院 办 公 室邮 编 : 410205邮 箱 : 联系电话:13327218600