1、主成分分析和二项 logistic 回归模型的投资价值对比分析【摘要】随着我国市场经济的不断发展和完善,企业间的竞争也越发激烈,企业出现财务问题甚至破产的数量增多。由于企业发生财务问题将给企业的股东、债权人、员工与政府等利益相关者带来巨大的经济损失,所以对财务问题进行准确的预测能够起到预先警告利益相关者的作用。本文选取我国制造业上市公司作为研究样本, 综合运用主成分分析方法和 Logistic 回归法构建制造业上市公司财务评价指标体系,并对其判别效果进行比较分析,从而发现各上市公司投资价值的影响因素,以期为投资者提供参考。 【关键词】投资价值 主成分分析 回归模型 一、引言 随着中国证券市场逐
2、步向规范运作的方向发展,如何从不同角度衡量上市公司的投资价值,从而控制风险,是所有投资者共同面临的问题。目前中国股市持续低迷,这一方面可能是受 08 年金融危机的影响,使股民意识到股市的风险,不敢轻易投资;另一方面可能是受市场整体经济形势的不景气,使投资活动减少的影响。本文通过对财务报表中主要经济指标间的相互关系、变动趋势和量值进行比较、判断,运用多元统计分析中的主成分分析法,并构造二项 logistic 回归模型进行对比分析,从财务的视角来分析上市公司投资价值。 二、文献综述 吴世农和卢贤义(2001)应用 Fisher 线性判定分析、多元线性回归分析和 Logistic 回归分析三种方法,
3、分别建立三种财务困境预测模型,研究结果表明三种模型都能在财务困境发生前进行相对准确的预测,但相对同一信息集,Logistic 预测模型的误判率最低。张爱民等(2001)采用主成分分析方法建立财务失败预测模型,并进行了实证检验。徐光华和吴鸣明(2006)采用 Logistic 回归方法建立财务预警模型,检验传统财务指标和 EVA 指标的预测能力。 投资价值的判断会受到财务指标和样本选取的限制。各种模型都有财务指标选择的侧重点,从而可能因忽视其他方面财务指标存在一定的片面性;此外,不同行业和样本数量的选取也会对投资价值的适用性产生影响。因此,本文选取我国制造业上市公司作为研究样本,借鉴巨潮资讯网站
4、公布的财务报表数据,经整理得到有关财务指标,分别采用主成分分析法和 Logistic 回归法构建制造业上市公司投资价值财务评价指标体系, 并对其判别效果进行比较分析。 三、上市公司投资价值模型设计 (一)研究方法介绍。 1.主成分分析法 在多指标的研究中,往往由于变量个数太多,并且彼此之间存在着一定的相关性,因而使得所观测的数据在一定程度上有信息的重叠,而且当变量较多时,在高维空间中研究样本的分布规律比较复杂,由此便产生了主成分分析法。它又称为主分量分析或主轴分析,它是利用降维思想把多个指标化为少数几个综合指标的一种统计分析方法。而这几个综合变量可以反映原来多个变量的大部分信息。在综合评价中,
5、应用主成分分析方法既可以消除各指标不同量纲的影响,也可以消除由各指标间相关性所带来的信息重叠。特别是它克服了综合评价中认为确定各指标权重系数的问题。 2.二项 logistic 回归 如果因变量为分类变量,则不符合一般回归分析模型要求,这时可用 logistic 回归来分析。又如模型中因变量只能取两个值时,则用二项logistic 回归,如果取多个值则可以用多项 logistic 回归来分析。本文之所以用二项 logistic 回归来进行预警研究,是因为该模型有如下优点:第一,logistic 回归的因变量和自变量之间关系是非线性的;第二,logistic 回归不需要假设方差不变,而且它也没有
6、关于自变量分布的假设条件,各个自变量可以是连续变量,也可以是离散变量,还可以是虚拟变量,也不需要假设它们之间存在多元正态分布;第三,logistic 回归的因变量是分类变量,研究的目的在于事件发生的概率,而且预测精度较高,我们可以分析公司是否具有投资价值。 (二)样本的选取。 由于上市公司的投资价值受行业因素的影响较大,不同行业的上市公司投资价值在同一时间内可比性不强,因此本文选择一个行业进行集中分析。本文选取我国沪深两市股制造业上市公司 2012 年 16 家 ST 公司(连续 2 年亏损而被特殊处理的公司) ,并按照 1:1 的比例选取相同会计年度的 16 家非 ST 公司作为样本,样本数
7、据取自巨潮资讯网站公布的财务报表。根据统计学原理,当样本容量大于等于 30 时,对总体具有很大程度的代表性。 (三)指标变量的选取。 现代财务管理理论认为:企的财务状况主要取决于企业的盈利能力、偿债能力、营运能力和成长能力。本文从上述四个方面出发并考虑到现金流在财务管理中的重要作用,选择了 13 个财务指标做为自变量,它们分别为:反映盈利能力的净资产收益率 X1、净利润率 X2 与总资产收益率X3;反映偿债能力的流动比率 X4、速动比率 X5 与资产负债率 X6;反映营运能力的存货周转率 X7、应收账款周转率 X8 与资产周转率 X9;反映成长能力的净利润增长率 X10、总资产增长率 X11
8、与净资产增长率 X12;反映现金流量的经营活动产生的现金净流量增长率 X13。 四、上市公司投资价值实证分析 (一)单样本的 t 检验。 已选取的基础指标体系是进行指标变量筛选的基础,但不能说明各个上市公司在这些指标上存在着显著差异,因此需要对其进行单样本 t检验,以判别是否存在显著差异。单样本 t 检验的零假设为:总体均值与指定检验值之间不存在显著差异。在 0.05 的显著性水平下,若 t 检验的 p 值小于 0.05,则拒绝零假设,认为总体均值与检验值之间存在显著差异,反之则认为不存在显著差异。我们选取的 13 个指标 t 检验对应的p 值分别是:x1 为 0.628,x2 为 0.076
9、,x3 为 0.107,x4 为 0.000,x5为 0.000,x6 为 0.000,x7 为 0.034,x8 为 0.062,x9 为 0.000,x10 为0.004,x11 为 0.048,x12 为 0.316,x13 为 0.042。不难发现X1、X2、X3、X8、X12 的 t 检验的 p 值大于 0.05,认为不显著,因此在进行 logistic 回归分析前,可先剔除这五个指标。 (二)主成分分析。 我们利用 spss19.0 对训练样本进行主成分分析,得到特征根和方差贡献率如下所示:主成分 1 的特征跟为 2.726,方差贡献率为 34.075?;主成分 2 的特征跟为 2
10、.26,方差贡献率为 28.256?;主成分 3 的特征跟为 1.064,方差贡献率为 13.3?;主成分 4 的特征跟为 0.956,方差贡献率为 11.947?;主成分 5 的特征跟为 0.592,方差贡献率为 7.395?;主成分 6 的特征跟为 0.223,方差贡献率为 2.786?;主成分 7 的特征跟为0.168,方差贡献率为 2.105?;主成分 8 的特征跟为 0.11,方差贡献率为 0.137?。 从以上数据可以看出,前四个主成分方程的累计贡献率达到87.578%,说明前四个主成分反映原指标体系信息的 87.578%。但第四个主成分的特征根小于 1,说明它对总体影响不明显,最
11、终我们取前三个主成分,它的累计方差贡献率是 75.63%。下面在表 1 中给出了主成分系数矩阵,可以说明各主成分在各变量上的载荷,从而得出具体影响各主成分的指标。 表 1 成分矩阵 成分 1 2 3 x4 0.888 0.340 -0.112 x5 0.868 0.391 -0.140 x6 -0.735 -0.181 -0.147 x7 0.050 0.567 -0.073 x9 0.165 -0.183 0.957 x10 0.694 -0.517 0.088 x11 -0.239 0.770 0.181 x13 0.271 -0.863 -0.219 表 1 显示,主成分 1 中,X4、
12、X5、和 X6 的负荷量较为明显且集中,主要代表了企业的偿债能力;主成分 2 中,X11 和 X13 的负荷量明显大于其他比率,代表了企业的成长能力;主成分 3 中,X9 的负荷量为 0.975远高于其他指标,代表了企业的营运能力。最终,通过主成分分析,我们选取了 X4、X5、X6、X9、X11、X13 这六个指标。我们对这六个指标进一步做主成分分析发现:依旧根据特征根大于 1 取前三个主成分,但此时前三个主成分的累计方差贡献率为 85.982%,明显大于上次的75.63%,说明模型得到了很好的改善。 (三)logistic 回归分析。 运用 SPSS 软件对 32 家制造业上市公司的原始数据
13、进行 Logistic 回归分析,在分析时赋予非 ST 公司的值为 0,ST 公司的值为 1,并把它作为因变量 Y。把 X4、X5、X6、X7、X9、X10、X11 和 X13 作为自变量,并采用基于最大似然估计的向前逐步回归法,选入自变量基于 Score 检验统计量,剔除变量基于最大偏似然估计的似然比检验结果。最终我们得到 X6、X7、X9 和 X13 这四个变量对总体的预测影响较大,其余变量被系统剔除。经过 4 步计算,模型对样本分类的准确率达到了 90.6%,其中ST 公司的判准率为 87.5%,非 ST 公司的判准率为 93.8%。并可建立logistic 回归方程:logit(P)=
14、-1.276-4.868X6+0.027X7+3.709X9+0.7X13。而如果用主成分分析得出的结果,将 X4、X5、X6、X9、X11、X13 直接做二项 logistic 回归,得出的总体准确率只有 84.4%,远不如上述 90.6%准确。因为用主成分分析忽略了 X7指标对总体的影响。 五、研究结论 本文首先采用主成分分析的方法,对初始的 13 个财务指标进行筛选,最后得出 X4、X5、X6、X9、X11、X13 这六个指标,它们的累计方差贡献率为 85.982%,已近能很好的解释整体,通过这六个指标的系数就可以比较好的判断公司是否具有投资价值。但在实际应用中,主成分分析更多的只是达到
15、目的的中间手段,它往往会被作为许多大型研究的中间步骤,在对数据进行浓缩后继续采用其它统计方法以解决实际问题。所以,我们由主成分分析筛选出的指标再进行 logistic 回归,最通过这六个指标可以正确判断总体 84.4%的数据,但没有通过用向前逐步回归法进行logistic 回归后得出的准确率 90.6%高。原因是因为在进行主成分分析时,我们把指标 X7 剔除了,但实际上 X7 对整体数据具有一定的解释能力。因此,本文主成分方法没有二项 logistic 回归准确,二项 logistic回归不仅能筛选出较为精确的指标,而且能给出了模型对样本分类的准确率,使模型具有更大的可信度。 所以,我们在分析
16、制造业上市公司是否具有投资价值时,主要通过分析资产负债率、存货周转率、资产周转率以及现金净流量增长率这四个指标,就可以达到 90.6%的准确率。但本文分析中也存在一些缺陷:首先,文章选取的样本数量还不是很多,不足以说明全部问题;其次,所选的都是财务指标,没有考虑非财务指标的影响,使模型准确度没能达到更好。但文章的分析还是可以对投资者的投资行为有一定的启发。 参考文献: 1徐光华,吴明鸣.基于 EVA 的行业财务预警模型研究以沪市IT 上市公司为例J.经济管理,2006, (12). 2吴世农,卢贤义.我国上市公司财务困境的预测模型研究J.经济研究,2001, (6). 3张爱民,祝春山,许丹健.上市公司财务失败的主成分预测模型及其实证研究J.金融研究,2001, (3). 4施静娴.我国制造业上市公司财务预警指标体系及实证研究D.辽宁:东北财经大学,2010.