1、 本科毕业论文(设计)( 届) 多元统计分析方法在股票市场板块的应用研究院 系 专 业 姓 名 指导教师 职 称 学号:合肥师范学院 2014 届本科生毕业论文(设计)多元统计分析方法在股票市场板块的应用摘 要本文将聚类分析应用于股票市场的研究当中。股票市场价格备受广大投资者普遍关注,本文将用聚类分析方法来判定股票的价格波动,探索股票定价的相关规律。多元统计分析是研究股票价格的新型方法,我们利用统计分析方法,考察并且确定上市公司股票价格之间的基本关键因素,利用聚类分析来进行实证研究,判断出股票定价的基本趋势,为投资者的科学投资提供建议。聚类分析能综合多项财务指标来反映上市公司的盈利能力和发展水
2、平,为分类和评估公司的优劣提供了很好的依据。研究实例表明,聚类分析方法是股市板块分析中的一种有效、实用的方法。关键词:聚类分析投资;板块;系统聚类ABSTRACTIn this paper, cluster analysis was applied to the study of the stock market. Stock market prices are of common concern to the broad masses of investors, this article will use the clustering analysis method to determine
3、 the volatility of stock prices, exploring the related law of stock pricing. Multivariate statistical analysis is a new way to study the stock price, we use statistical analysis method, examine and determine basic key factors between the listed companys share price, using cluster analysis to make em
4、pirical research, determine the basic trend of stock pricing, scientific investment to provide the reference for the investors. Clustering analysis can be integrated a number of financial indicators to reflect the profitability of listed companies and the development level, for classification and ev
5、aluation of the pros and cons of company provides a good basis.Case study shows that the clustering analysis method is an effective and practical in stock market sector analysis method.Key words: Cluster Analysis; Investment; Board; System合肥师范学院 2014 届本科生毕业论文(设计)目 录摘 要 .ABSTRACT .引言 .1.研究目的及方法 .1.研究
6、目的及意义 .1.研究方法 .1聚类分析 .1.聚类分析的概念 .1.基本思想 .1.聚类方式 .1.聚类分析的主要步骤 .2聚类分析的应用 .2.问题的提出 .2.聚类分析在股市板块分析中的应用 .2.指标标准化处理 .3.聚类谱系图 .3.结果分析 .4结束语 .5参考文献 .6合肥师范学院 2014 届本科生毕业论文(设计)11 引言1.1 研究目的及方法1.1.1 研究目的及意义伴随着我国股票市场的不断发展,股票投资已成为投资者的最主要投资途径,而且也将成为投资者的最重要投资渠道。因此,他们必须高度重视上市公司的经营业绩,高度重视股票自身的品质,即高度重视投资对象的选择。1.1.2 研
7、究方法多元统计分析方法中的聚类分析在股票的综合评价中有着广泛的应用。本文采用的分析方法是聚类分析。在对上市公司进行综合评价时,先进行标准化处理,再用软件进行系统聚类分析。2 聚类分析2.1 聚类分析的概念依据研究对象的特征,对研究对象进行分类的方法,减少研究对象的数目。另一种说法是各类事物缺乏可靠的历史资料,无法确定一共有多少个类别,目的是将性质相近事物归入一类。2.2 基本思想由于我们所研究的样品之间存在不同程度的相似性,于是根据一批样品的多个观测指标,找出一些能够准确度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似度较大的样品聚合为一类,把另外一些彼此之间相似度
8、较大的样品又聚合为另一类,一直到把所有的样品都聚合完毕为止,这就是分类的基本思想。其中类指的是相似元素的集合。聚类分析的概念认为所研究的样品之间存在着程度不同的相似性,根据一批样品的多个观测指标,找出能够准确度量样品之间相似度的统计量,并以此为依据,采用某一种聚类法,将所有的样品分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类别中的个体差异较大。2.3 聚类方式聚类分析根据所用方法的不同可以分为系统聚类法、有序样品聚类法、动态聚类法、合肥师范学院 2014 届本科生毕业论文(设计)2模糊聚类法等;根据分类对象的不同又可以分为对样品聚类(又称 Q 型聚类分析)以及对变量进行聚类(又称
9、 R 型聚类分析) 。对前者聚类多用距离,而后者聚类时多用相似系数。而本文用到的是系统聚类法。2.4 聚类分析的主要步骤(1)数据预的处理选择数量,类型与特征的标度和将孤立点移出数据;(2)为衡量数据点之间的相似度定义一个距离函数既然相类似性是定义一个类的基础,那么不同的数据之间在同一个特征空间相似度的衡量对于聚类步骤是非常重要的,由于特征类型和特征标度的多样性,距离度量必须要谨慎,它常常依赖于应用;(3)聚类或分组将数据对象分到不同的类别中;(4)评估输出评估聚类结果的质量。3 聚类分析的应用3.1 问题的提出中国股市从无到有,发展至今天已颇具些规模,前些年,是中国股市发展的初级阶段,由于市
10、场规模还较小,上市公司数量并不是很多,加上股民的投资观念和操作方法也相对来说不太成熟,因此,投机性特别强,这个时候还用不上多少技术来分析。但是,随着我国市场经济建设的飞跃发展,人们的金融意识和投资意识日益增强,而作为市场经济组成部分之一的股票市场,正在逐步的走向成熟与规范,越来越多的投资者开始重视股票投资,历史已经证明了,股票是一种不仅在过去可以给投资者提供可观的长期利益,并且在将来也将提供良好机遇的投资媒体。然而,股价涨跌无常,股市变幻莫测,投资者要是想在股市的投资中获得优越的投资回报,就得认真的研究上市公司的发展历史、业绩和发展前景,详细的分析上市公司的财务状况,树立以基本分析为主,技术分
11、析为辅的投资理念,找出真正具备投资价值的股票,从而进行长期的投资。伴随着股市的发展、投资手法和证券监管方法的不断成熟,以及上市公司数量的不断增多,如果再和往常一样,面对成千上万种股票胡乱抓一气,碰运气,甚至是受各种股评和谣言所左右,则很难最终取得投资的成功。因此,在成熟股市当中,一个股民若是想成功,必须要学会板块分析,习惯理性的操作,树立板块的投资理念。板块是指具有共同特征的股票群。股市中的板块可以从行业与产业、地域、时间、特殊题材等多个角度来划分,而在每一板块当中又有几十种甚至上百种的股票。面对众多股票及各个公司的众多的财务数据,怎样才能客观、全面、准确地分析并且选出各板块以及板块内的绩优龙
12、头股和潜力股呢?本文采用多元统计分析中的聚类分析方法,对此问题作一些探讨。3.2 聚类分析在股市板块分析中的应用本文选取年房地产上式公司财务指标进行分析合肥师范学院 2014 届本科生毕业论文(设计)3年度房地产上市公司 4 项财务指标股票名称 每股收益 净资产收益率 净利润增长率 主营业务收入增长率金融街 0.04 0.6 41.9578 136.6212保利地产 0.16 2.16 60.5367 89.4363兴业 -0.04 -4.31 -212.5823 -100海鸟 0.0004 0.25 -4535.987 -46.7879卧龙地产 0.038 2.22 0.8973 8.375
13、8外高桥 0.035 0.82 277.9994 -10.1645金地集团 0.26 7.31 1400.7834 402.8751万科 0.1 2.89 32.3465 -8.076中房 -0.0118 -2.28 -400.321 -64.8176中粮地产 0.02 0.62 172.0338 191.4908珠江 0 -0.03 34.43 671.8254滨江集团 0.14 5.26 700.5179 322.4229东源 0.056 3.09 581.0458 -29.6347阳光股份 0.57 13.57 477.9919 433.8442海德股份 0.0571 4.75 238.
14、2541 167.242嘉凯城 0.11 4.97 28.396 334.81393.2.1 指标标准化处理标准化处理后的样本数据是为了更好了解不同公司的特征财务状况,如下图案例处理汇总案例有效 缺失 总计N 百分比 N 百分比 N 百分比16 100 0 100 16 100由上表可知,所选取的上市公司财务数据在标准化后都有效。3.2.2 聚类谱系图聚类谱系图可以直观地显示聚类的过程,从下图我们可以清楚的看出各种股票的归属。根据选择距离的不同我们可以根据图形对股票进行新的分类,另外根据聚类谱系图我们也可以清晰地看出每一种股票的原始分类及其聚类过程,从中我们可以了解各种股票的亲疏关系的程度。合
15、肥师范学院 2014 届本科生毕业论文(设计)4聚类谱系图0 5 10 15 20 25金融街 1中粮地产 10卧龙地产 5外高桥 6万科 A8保利地产 2滨江集团 12嘉凯城 16海德股份 15ST 兴业 3ST 中房 9ST 珠江 11ST 海鸟 4金地集团 7阳光股份 14ST 东源 13由上图我们可以将这些股票大致分为七类:第一类有金融街 1、中粮地产 10、卧龙地产5、外高桥 6、万科 A8、保利地产 2 六只股票;第二类有滨江集团 12、嘉凯城 16、海德股份 15 三只股票;第三类有兴业 3、中房 9 两只股票;第四类有卵珠江 11 一只股票;第五类有海鸟 4 一只股票;第六类有
16、金地集团 7 和阳光股份 14 两只股票;第七类有东源 13 一只股票。根据以上分类结果,我们认为其具一定的合理性,从中可以得出一定的结论。3.2.3 结果分析第一类中的六只股票所在的公司都是比较著名的房地产企业,这些企业在房地产的行业经营多年,大多数都是房地产中的蓝筹股,有比较高的每股收益率和净资产收益率,有比较强的赢利能力。主营业务收入增长率与净利润增长率处在房地产板块中游,说明了这些企业股本扩张能力并不是很强,企业正处于成熟期。第一类企业的股票有一定的投资价值,然而其成长性比较差,投资者可以根据自己的投资理念和实际的市场条件选择对此类成熟期的绩优企业进行投资。第二类中的三只股票所在的公司
17、基本上在房地产行业中处于中游地位的企业。这些企业一样具有比较高的每股收益率与净资产收益率,具较强的赢利能力。主营业务收入增长率与净利润增长率稍微大于 第一类企业,处于房地产板块中上游,说明此类公司股本扩张能力比较强,企业以较高的速度发展,处于企业发展期的尾期。投资者可以根合肥师范学院 2014 届本科生毕业论文(设计)5据自己的投资理念和实际的市场条件选择对具有此类特点的企业进行投资。第三类中只有两只股票,分别为 ST 兴业和 ST 中房,这两类企业的简称前标有“”的字样,这两个企业的财务报表和财务指标很容易看出他们被特别处理的理由。两只股票的每股收益率、净资产收益率、净利润增长率与主营业务收
18、入增长率都是负值,而且可以从这两个企业的财务报表可以发现在 2010 年企业的净利润也是负值。这证明两个企业在近两年的经营方面发生了重大问题,而且没有好转的迹象。投资者在对这类股票进行投资的时候,一定要谨慎。第四类中只有一只股票珠江。这只股票和第三类中的两只股票比较起来,有着自己的特点。这个企业的每股收益率、净资产收益率分别是零和负值,表明企业的赢利能力还是很弱。但是其主营业务增长率很大,甚至远大于前两类房地产企业,处在房地产板块的上游。企业的净利润增长率比主营业务收入增长率则显得很小。投资者可以根据自己的投资理念和实际的市场条件选择对具有此类特点的企业进行投资。第五类中只有一只股票海鸟,这个
19、企业每股收益率、净资产收益率都非常小,说明此企业的赢利能力非常弱,此企业最大的特点是净利润增长率同比下降了.倍,这样类型的企业没有任何的投资价值。第六类中有金地集团与阳光股份两只股票,两个企业的每股收益率、净资产收益率都比较大,具非常强的赢利能力。主营业务收入增长率与净利润增长率处在房地产板块上游,说明这两个企业股本扩张能力非常强,企业以很高的速度保持持续增长。投资者可以根据自己的投资理念和实际的市场条件对具此类特点的企业进行投资。第七类中只有东源一只股票。东源是这些股票中聚合系数最大的一只股票,根据其财务数据容易发现其具突出的特点。这只股票的每股收益率与净资产收益率都处在正常的范围,净利润增
20、长率非常大,处在房地产行业上游,但主营业务收入增长率却是负值。投资者可以根据自己的投资理念和实际的市场条件选择对具有此类特点的企业进行投资。4 结束语聚类分析能够综合多项财务指标来反映上市公司盈利能力与发展水平,可以为分类和评估上市公司的优劣提供非常好的依据。所得聚类结果与公司的实际财务状况与经营状况基本吻合。实证表明,本文采用的聚类分析方法可以为股票的分析和选择提供一条很好的途径,可以全面反映上市公司的赢利能力与成长性,缩小研究的范围,确定投资的价值,降低投资的风险,为科学的决策提供强有力的支持。总之,在证券投资中有着非常广泛的应用价值。合肥师范学院 2014 届本科生毕业论文(设计)6参考文献 1 何晓群 多元统计分析M北京:中国人民大学出版社,2007:541262 柯冰,钱省三 聚类分析和因子分析在股票研究中的应用【J】上海理工大学学报,2004 ,(4):371 3743 余锦华,杨维权多元统计分析与应用 (M) 广州:中山大学出版社 2005. P197-2204 梅长林,范金城数据分析方法 (M) 北京:高等教育出版社 2007 P38-795 余锦华,杨维权多元统计分析与应用 (M) 广州:中山大学出版社 2005. P197-2206 李双杰,顾六宝 用聚类分折法评估区域经济【J】.中国农村观察,2001,(3):52-56