毕业论文(设计):聚类分析在证券市场分析中的应用.doc

上传人:文****钱 文档编号:40525 上传时间:2018-05-07 格式:DOC 页数:41 大小:1.10MB
下载 相关 举报
毕业论文(设计):聚类分析在证券市场分析中的应用.doc_第1页
第1页 / 共41页
毕业论文(设计):聚类分析在证券市场分析中的应用.doc_第2页
第2页 / 共41页
毕业论文(设计):聚类分析在证券市场分析中的应用.doc_第3页
第3页 / 共41页
毕业论文(设计):聚类分析在证券市场分析中的应用.doc_第4页
第4页 / 共41页
毕业论文(设计):聚类分析在证券市场分析中的应用.doc_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、山东交通学院毕业生毕业论文(设计)题目聚类分析在证券市场分析中的应用聚类分析在证券市场分析中的应用2摘要本文随机选取了40家在沪深上市的山东省的公司企业,选择每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率5项指标评价体系。通过系统聚类分析方法对这40家公司企业的股票进行聚类分析,以此对股票的收益性、成长性等方面进行分析,帮助投资者准确地把握股票的总体特性以及预测股票的成长能力,使投资者及时做出最佳的投资决策,进而获得可观的投资回报。最后在聚类分析的基础上,对聚类分析结果采用MEANS方法进行检验,以此来进一步验证分析结果的可靠性和可信性。此研究表明聚类分析方法在证券市场投资

2、分析中具有有效性和实用性。关键词聚类分析,证券市场投资,MEANS方法,投资回报山东交通学院毕业论文3ABSTRACTINTHISPAPER,WERANDOMLYSELECTED40COMPANIESINSHANDONGPROVINCEWHICHWERELISTEDINSHANGHAIANDSHENZHENSTOCKMARKET,ANDWECHOICETHEFIVEINDICATORSEVALUATIONSYSTEMTHATARETHEEARNINGSOFPERSHARE,THENETASSETSOFPERSHARE,THEGROWTHRATEOFTHEMAINBUSINESSREVENUE,

3、THEGROWTHRATEOFTHEMAINBUSINESSPROFITANDTHEYIELDOFTHENETASSETSINORDERTOHELPINVESTORSTOACCURATELYGRASPTHEOVERALLFEATURESOFTHESTOCKANDTHEGROWTHABILITYOFTHESTOCK,WEEFFECTIVELYUSETHEMETHODOFTHESYSTEMCLUSTERINGANALYSISTOANALYZETHESTOCKSPROFITABILITY,GROWTH,ETC,WHICHWEREMENTIONEDABOVETHESTOCKSOFTHE40COMPAN

4、IESABOVEALL,THISCANHELPINVESTORSTOMAKETHEBESTINVESTMENTDECISIONS,ANDGETCONSIDERABLERETURNSINATIMELYMANNERFINALLY,INORDERTOFURTHERVERIFYTHERELIABILITYANDCREDIBILITYOFANALYSISRESULTS,WEUSEMEANSMETHODSTOTESTTHERESULTSOFCLUSTERANALYSISTHESTUDYSHOWSTHATTHEMETHODOFCLUSTERINGANALYSISHASVALIDITYANDPRACTICAB

5、ILITYINTHESECURITIESMARKETINVESTMENTANALYSISKEYWORDSCLUSTERINGANALYSIS,STOCKMARKETINVESTMENT,MEANSMETHOD,RETURNONINVESTMENT聚类分析在证券市场分析中的应用4目录1绪论111论文研究的背景及意义112聚类分析在证券市场分析中的应用价值213聚类分析在证券市场分析中应用的优点214聚类分析在证券市场分析中应用的当前状况215本文的研究内容及内容结构3151研究内容3152内容结构32聚类分析421聚类分析的基本思想422聚类分析的方法423系统聚类法的基本思想和基本步骤5231

6、样本间距离的度量6232类间距离的度量824系统聚类分析方法的比较925系统聚类法中类个数的确定问题103聚类分析在证券市场分析中的应用1231聚类分析在证券市场分析中应用时的指标评价体系的选择12311盈利能力指标12312成长能力指标12313扩张能力指标1332实证研究14321原始样本数据标准化15322用190SPSS软件对样本公司股票进行聚类分析17323分类个数的确定22324聚类结果24325对聚类结果进行检验25326结果分析264总结和展望29总结30山东交通学院毕业论文11绪论11论文研究的背景及意义改革开放以来,随着我国市场经济的迅速、健康发展,国民的金融意识和投资意愿

7、日益增强,而作为市场经济的重要组成部分证券市场,正渐渐地走向成熟,越来越多的投资者把目光投向了股票,历史已经证明,股票不仅在过去是一种已经给投资者提供了可观的长期收益,并且在将来也会是提供良好机遇的投资媒介。一直在宾夕法尼亚大学沃顿商学院担任金融学教授的杰里米J西格尔,他在其名著长期股票投资中就曾经说到“尽管未来回报率可能比过去低,但是仍然存在强有力的证据让我们相信,对于所有追求经济平稳和长期收益的投资者而言,股票还是最好的投资方式。”然而,正如日常生活中那样,股市变幻莫测、股价涨跌无常,投资者要想在股市投资中赢取可观的投资回报,就需要认真研究上市公司的业绩和发展前景,找出真正具有投资价值的股

8、票,从而作出投资决策,进而进行投资。俗话说“物以类聚,人以群分”,在自然科学和社会科学中,存在着形形色色的分类问题。所谓的类,通俗地讲,就是指由相似元素组成的集合。聚类分析,它是研究样品或指标分类问题的一种统计分析方法。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求也越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学中形成了聚类分析。聚类分析的比较典型应用是在商务上,聚类能帮助市场分析人员从客

9、户基本库中发现不同的客户群体,并且用相应适当的模式来刻画不同客户群的特征。比如,在经济学中,为了了解不同地区城镇居民的收入及消费情况,往往需要划分为不同的类型;在生物学中,聚类分析能用于推导植物和动物的分类,对基因进行分类,从而获得对种群中固有结构的认识;在产品质量管理中,聚类分析可以根据各产品的某些重要指标而将其分为一等品、二等品等。又如,在WEB上的文档中,聚类分析也能用于对WEB上的文档进行分类,从而发现信息。聚类分析即是研究分类问题的数据分析方法。聚类分析在证券市场分析中的应用212聚类分析在证券市场分析中的应用价值聚类分析建立在基础分析之上,立足于对股票的基本层面进行量化分析。鉴于基

10、础分析对影响股票价格的诸多因素这一定性分析的不足,聚类分析则很好地弥补了这一缺陷。作为进行长期投资的理性投资者的参考依据,其目的在于从股票基本层面决定的内在价值中发现股票的真正投资价值。另外,在聚类分析模型的建立过程中,我们进一步考虑了公司的成长能力,它对股票的投资价值有着重要影响。成长能力是一个不断变化的趋势,因此我们选取了较能反映公司成长能力的客观指标,如主营收入增长率、主营利润增长率,以便更好地探究股票的成长能力,进而使投资者能够更好地、正确地预测股票的发展前景和发展潜力。13聚类分析在证券市场分析中应用的优点与现代投资组合理论相比,聚类分析方法显得更加直观、实用,并且在应用时所受的局限

11、性小、操作性强,具有一定的优越性,适合于广大投资者采用。聚类分析建立的是一种长期投资理念,因此,在全球金融一体化、自由化浪潮下,并且在我国的证券市场逐步走向成熟的过程中,提倡运用这种理性的投资分析方法,理性的作出投资决策,这样不但可以降低投资风险、规范投资行为,而且有利于促进上市公司更好地参与市场竞争,促进我国证券市场的稳定、健康发展,从而建立一个良好的国内金融市场秩序。另外,单纯从聚类分析这一方法来讲,聚类分析通过对样品或指标(变量)之间存在的相似程度进行度量,将“相似”的归并成类。体现出以下三大显著的优点(1)能综合利用多个变量对样本进行分类;(2)分类结果更加直观,具体体现是聚类谱系图,

12、从聚类谱系图中,我们可以很清楚地观察其分类结果;(3)聚类分析所得到的结果比传统分类方法更细致、全面、合理。这些优点足以更加有利于我们将聚类分析方法应用在证券市场分析中。14聚类分析在证券市场分析中应用的当前状况聚类分析是一种行之有效的指导证券投资的方法。聚类分析首先对各类股票的公司因素、收益性、成长性、扩张性等基本层面进行考察,然后再利用综合指标评价体系来衡量样本股票的“相似程度”。利用聚类分析模型能够帮助投资者山东交通学院毕业论文3准确地了解和把握股票的总体特性,以便及时地作出投资决策,进行投资。在证券投资方面,聚类分析还有很大的发掘空间和研究价值。目前,国内颇具有代表性的研究大多仅仅局限

13、于板块分析,选用的指标也仅仅反映了上市公司的盈利水平,尚不能全面反映股票的总体特性。在现有的研究基础上,本文深入探讨了聚类分析在证券投资中的应用价值,丰富和完善了在证券市场分析中应用聚类分析时的指标体系。15本文的研究内容及内容结构151研究内容本文阐述了聚类分析的理论背景,主要研究了用系统聚类分析方法对样本数据进行分组,但是,我们并不知道样本数据的分组是否合理,因此再利用MEANS方法对其进行检验,从而使得聚类精度有所提高,进而增加分析结果的可靠性和可信性。152内容结构本论文共分四章,具体的内容结构如下第一章是绪论,介绍了论文研究的背景及意义。第二章详细介绍了聚类分析的基础理论,系统聚类法

14、的基本思想、基本步骤、距离度量和类个数的确定问题。第三章给出了聚类分析方法在证券投资市场中的具体应用,并采用MEANS方法对分析结果进行检验,证明其有效性。第四章是对聚类分析方法在证券投资市场中的应用进行总结和展望。聚类分析在证券市场分析中的应用42聚类分析聚类分析是把数据集分解或划分成多个类或组,使同一组中的数据比较相似,不同组的数据差别较大。通过聚类,可以识别数据之间的相似程度,从而发现数据集的分布模式和数据的属性之间的相互关系。21聚类分析的基本思想聚类分析的基本思想是认为研究的数据集中的数据之间存在不同程度的相似性,根据数据的几个属性,找到能够度量它们之间相似程度的量,把一些相似程度较

15、大量的归为一类,另一些相似程度较大的量归为另一类,即同一组内的数据对象之间具有较高的相似程度,而不同组中的数据对象之间是不相似的。而对这种数据对象之间的相似或不相似程度的描述又是由数据属性的取值来确定的,通常就是利用各数据对象之间的距离来表示的。22聚类分析的方法聚类分析的内容非常丰富,从其聚类的方法来看,可分为以下几类(1)谱系聚类法谱系聚类法又称系统聚类法,它是在给出样品间的距离和类与类间的距离定义的基础上,先将每个样品各自当作一类,计算出各类即各样品之间的距离,再将最近的两类合并聚为小类,将已聚合的小类按其相似程度(用类间距度量)再聚合,依此类推,每次减少一类,随着相似程度的减弱,直到最

16、后将全部样品合成一类,并类的全部过程可以用聚类谱系图来描述。(2)快速聚类法快速聚类法又称动态聚类法,它的基本思想是,先确定若干个中心,然后将样本逐个输入,看看样品能否归属哪类,如果可以归属已有的某个类,则归之,且对该中心稍作调整;否则可以建立新类,并调整原有的归属及重新计算新的各类的中心;如此继续下去,直到每个样品皆有归属为止。这种方法可以大大地提高计算速度,但由于初始中心的个数及位置的选取、样品输入的顺序都可能对最后结果产生某些影响,所以在实际运用时要慎重。(3)最优分割法最优分割法又称有序样品聚类法,它是先将全部样品当成一类,然后根据某种最优准则适当地将其分割为两类,再分为三类,山东交通

17、学院毕业论文5直到最后将样品分割为所需的类为止。(4)模糊聚类法模糊聚类法是利用模糊集理论来处理分类问题,它对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果。(5)图论聚类法图论聚类法是利用图论中最小支撑树的概念来处理分类问题,由此也创造了颇具风格的一种方法。(6)聚类预报法聚类预报法是利用聚类方法来处理预报问题。我们知道,在多元统计分析中,如回归分析和判别分析都可以用来作为预报的方法,但是对于那些存在异常数据,例如在灾害性气候的气象预报中,此时若还利用回归分析或判别分析的方法来处理,其效果都不好,而聚类预报弥补了这一不足缺陷。另外,聚类分析根据分类对象的不同,分为R型和Q型两大

18、类R型聚类分析是对变量(或指标)进行分类处理,其作用在于1可以了解变量间及变量组合间的亲疏关系;2可以根据变量的聚类结果及它们之间的关系,选择主要变量进行回归分析或Q型聚类分析等。Q型聚类分析是对样本进行分类处理,其作用在于1能利用多个变量对样本进行分类;2分类结果直观,聚类谱系图能明确、清楚地表达其分类结果;3所得的结果比传统的分类方法更细致、全面、合理。当使用不同的分类方法时,往往会得到不同的分类结果,更何况对于任何观测数据都不会存在唯一“正确”的分类方法。在实际工作中,仍以系统聚类法使用的最多,系统聚类法是目前在实际应用中使用最多的一类方法。因此,在本论文中就使用系统聚类法,即谱系聚类法

19、,并且是进行Q型的聚类分析。23系统聚类法的基本思想和基本步骤设有N个样本,并且每个样本都有P个变量(或指标)。系统聚类法的基本思想是首先定义样品间的距离和类与类之间的距离,开始时先将每个样品各自当作一类,此时样本间距离与类间距离是等价的,再将最近的两类合并聚为小类,聚类分析在证券市场分析中的应用6将已聚合的小类按其相似程度(用类间距度量)再聚合,依此类推,每次减少一类,随着相似程度的减弱,直到最后将全部样品合成一类,并类的全部过程可以用聚类谱系图形象地表达出来。由上述系统聚类法的基本思想,可以得出利用系统聚类法进行聚类分析的基本步骤数据标准化我们所考察的样本数据有不同变量(或指标)时,这些变

20、量(或指标)一般都有不同的量纲、不同的数量级单位、不同的取值范围。为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对数据进行归一化或标准化处理。并且,还要选择样本之间和类之间距离度量的方法;计算N个样本两两之间的距离,得到样本间的距离矩阵0D;刚开始第一步时)(第一步1I,将N个样本各自看成一类,此时类的个数NK,样本间的距离就是类间的距离,然后对步骤2,3,IN执行聚类的步骤和;每次合并类间距离最小的两类为一新类,即此时类的总数减少了1,此时类的总数为1KNI;继续计算新类与其它类之间的距离,得到新的距离矩阵ID。如果合并后类的个数K仍然大于1,则重复步骤和,直到类的总个数是

21、1时为止;画出聚类谱系图;决定分类的个数以及各类的成员。231样本间距离的度量聚类问题中有N个数据1,2,3,IXIN,每个数据有P个变量即属性,IJX表示数据IX的第J个属性,则数据集的所有变量可用如下矩阵表示1111PNNPXXXXX(21)由于变量的多样性,其取值可能是连续值的区间变量、二元变量、序数变量、山东交通学院毕业论文7名义变量等,它们的处理方法是不同的,如工资水平、股票价格、利率、汇率等可以用连续值表示的称为连续变量,由于使用的变量单位不同等诸多因素,它们的值可能相差比较悬殊,为使各变量在聚类分析中地位相同,就需要对数据进行归一化即标准化处理。两个数据的接近程度用距离表示,样品

22、JIXX,之间的距离,JIDXX,一般要求它满足下列条件(1),0,JIDXX且,0,JIDXX当且仅当JIXX;(2),IJJIDDXXXX;(3),JKKIJIDDDXXXXXX。在聚类分析中,有些“距离”不满足(3),我们在广义的角度上仍称它为“距离”。常用的距离有欧式距离、明科夫斯基距离、马氏距离等。下面就简要介绍几种聚类分析中的常用距离设TPXXX,21X是我们所关心的P个指标,对此指标进行N次观测,从而得到N组观测值12,1,2,TIIIIPXXXINX,称这N组观测数据为N个样品。这时,每个样品可看成P维空间的一个点,N个样品组成P维空间的N个点,我们自然就可以用各个样本点之间的

23、距离来衡量各样品之间的相似程度。1欧氏距离1221,PIJIKJKKDXXXX(22)2MINKOWSKI距离(明科夫斯基距离)11,|PMMIJIKJKKDXXXX(23)其中1M。MINKOWSKI距离又称ML距离,2L距离即欧氏距离。3马氏距离112,TIJIJIJDXXXXSXX(24)聚类分析在证券市场分析中的应用8其中S是由样品NXXX,21算得的样本协方差矩阵111NTIIINSXXXX,其中11NIINXX马氏距离适用于作为随机变量的样本点,并且马氏距离用于已知类别的模式情况,而我们所选定的40家公司股票的类别是未知的,因此该距离不能用;明科夫斯基距离是一种范式,也就是说欧氏距

24、离是明科夫斯基距离的一种特殊形式,即在23式中2M时,此时的明科夫斯基距离即欧氏距离。因此,在此处我们选择欧氏距离来度量样本间的距离,欧氏距离是聚类分析中用得最广泛的距离。但是,鉴于本论文中选取的5项指标每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率,正如在本节“231样本间距离的度量”中提到的,它们皆为连续变量,而欧氏距离平方最适合对连续变量进行数据处理,因此,在本论文中,对于样本间距离的选择问题,我们选择欧氏距离平方,190SPSS软件中对应选择距离】【平方EUCLIDEAN,由22式很容易得到欧氏距离平方221,PIJIKJKKDXXXX(25)232类间距离的度量距

25、离作为对样品之间的相似程度的度量是聚类分析的基础。为了研究问题的方便,分别以JI,表示样品JIXX,,简记,JIIJDDXX是样品JIXX,之间的距离,设,21PNPPPPGXXX和,21QNQQQPGXXX为两个类,含样品数PN和QN。PNIPIPPN11XX类PG的重心。类PG与类QG之间的距离记为PQD类间距离的常用定义方法如下1最短距离QPIJPQGJGIDD,MIN,即两类中样品之间距离最短者作为类间距离;最短距离法的特点是样品有链接聚合的趋势,这是其缺点,不适合一般数据山东交通学院毕业论文9的分类处理,除去特殊数据外,不提倡用这种方法。2最长距离QPIJPQGJGIDD,MAX,即

26、两类中样品之间距离最长者作为类间距离;3重心距离,QPPQXXDD,即两类的重心之间的距离作为类间距离;该距离随聚类地进行不断缩小。该重心距离法的谱系聚类图很难跟踪,且符号改变频繁,计算较烦。4类平均距离221PQGIGJIJQPPQDNND,即两类中所有两两样品之间的平方距离的平均作为类间距离;类平均距离法是一种使用比较广泛、聚类结果较好的方法,而类平均距离法又有两种形式组间联结法LINKAGEGROUPSBETWEEN和组内联结法LINKAGEGROUPSWITHIN。这两种方法相对而言,组间联结法LINKAGEGROUPSBETWEEN更能充分的使用样本数据材料,因此,本论文中采用类平均

27、距离法中的组间联结法来度量类间距离。5离差平方和方法)(SWARD在实际应用中,离差平方和方法应用比较广泛,分类效果较好,但它要求样本间距离的度量必须采用欧氏距离。24系统聚类分析方法的比较系统聚类法的聚类原则决定于样本间的距离和类间距离的定义,类间距离定义的不同就会产生不同的聚类分析方法,系统聚类法具有以下简单的性质1单调性在利用系统聚类法进行并类过程中,并类距离具有单调性符合系统聚类法的基本思想,可知,最短距离法、最长距离法、类平均距离法和离差聚类分析在证券市场分析中的应用10平方和法都具有单调性,但重心距离法不具有单调性;2空间的浓缩与扩张以最短距离法和最长距离法的并类过程为例,对于其相

28、应的距离,每一步都有以下性质(长)短IJIJDD,对于一切的,IJ,这种性质称为最长距离法比最短距离法扩张,或称最短距离法比最长距离法浓缩;由以上可对系统聚类法有以下结论类平均距离法比最短距离法扩张,且比最长距离法浓缩;类平均距离法比重心距离法扩张,且比离差平方和方法浓缩。而我们知道,太扩张的方法当样本数量较大时容易失真,太浓缩的方法又不够灵敏。类平均距离法相对比较适中,相对其它方法既不太扩张也不太浓缩,而且具有单调性,因而类平均距离法是一种应用广泛、聚类结果较好地方法。根据这一节和上一小节“232类间距离的度量”的分析和比较,可以更加让我们相信,选择类平均距离法中的组间联结法来度量类间距离是

29、比较合理的。25系统聚类法中类个数的确定问题在聚类分析方法中,样本到底该分为几类,究竟哪些样品将归于一类,分析前是不知道的。在进行聚类分析时,如何确定类的个数是个较难的问题,虽然有一些统计方法试图给出判断准则,但是人们至今仍未找到令人满意的方法,但在聚类分析中这又是一个无法回避的问题。那么,我们如何确定较为合理的分类个数呢以下就简要得介绍几种确定类个数的常用方法1根据数据点的散布图直观地确定分类个数如果考察的指标只有2个即2P,则可通过数据点的散点分布图来直观地确定类的个数。如果有3个变量,可以绘制三维空间的散点分布图,并且通过旋转三维坐标轴由数据点的分布来确定应该分为几类。当然,如果考察的指

30、标多于3个时,可以先通过降维的方法把这些指标进行综合,综合出2个或3个指标,从而转化为2个变量或3个变量情况,再绘制二维或三维的数据点的散布图来确定合适的分类个数。但是,该方法从其降维过程来看,比较繁琐。2根据聚类谱系图确定分类个数山东交通学院毕业论文11经过系统聚类法处理后,会得到相应的聚类谱系图,那么,如何根据聚类谱系图确定分类个数呢972DEMIRMEN1提出了应根据研究的目的来确定适当的分类个数,并提出了一些根据谱系图来分类的准则,准则如下A任何类都必须在临近各类中是突出的,即各类重心间距离必须要大;B确定的类中,各类所包含的元素都不要过分的多;C分类的数目必须符合实用目的;D若采用几

31、种不同的聚类方法处理,则在各自的聚类图中应发现相同的类。3根据聚类分析的“碎石图”确定分类个数在系统聚类过程中,首先把离得近的类进行合并,所以在并类过程中的聚合系数会呈现出增加趋势,聚合系数小表示合并的两类的相似程度较大,而两个差异很大的类并在一起时,会使聚合系数很大。因此,如果以Y轴表示聚合系数,X轴表示分类数,画出聚合系数随着分类数变化的曲线图(或散点图),这样就会得到类似于因子分析中的碎石图,从而,我们可以在曲线开始变得平缓时的点处,选择较为合适的分类数。可见,该方法较前两种方法而言,显得更加简洁、直观,因此,本论文中采用“碎石图”来确定比较合适的分类个数。聚类分析在证券市场分析中的应用

32、123聚类分析在证券市场分析中的应用本文中,选取了每种股票的每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率5项指标评价体系,首先利用聚类分析方法对各类股票的基本层面进行考察,然后再利用综合指标评价体系,如收益性、成长性、扩张性等来衡量样本股票的“相似程度”。以此能够更好地帮助投资者准确地了解和把握股票的总体特性,以便及时地作出投资决策、进行投资。鉴于聚类分析在证券投资方面还有很大的发掘空间和研究价值。本文在现有的研究基础上,深入探讨了聚类分析在证券投资中的应用价值,丰富和完善了在证券市场分析中应用聚类分析时的指标体系。31聚类分析在证券市场分析中应用时的指标评价体系的选择3

33、11盈利能力指标100期末总股本净利润每股收益每股收益越高,反映出公司或行业的投资收益就越高,每股的获利能力就越强;100平均股东权益净利润净资产收益率净资产收益率反映了股东权益的收益水平,用以衡量公司运用自有资本的效率。净资产收益率越高,说明投资带来的收益就越高。312成长能力指标100上期主营业务收入上期主营业务收入本期主营业务收入主营收入增长率主营收入增长率用来衡量和判断公司发展所处的阶段,以使投资者较为准确地判断该公司或行业正处于成长期、稳定期或衰退期,进而作出较为合理的投资决策;100上期主营业务利润上期主营业务利润本期主营业务利润主营利润增长率山东交通学院毕业论文13经营业绩良好的

34、上市公司会表现出较高的成长性,成长性好的上市公司的盈利也会相应增强。主营收入增长率和主营利润增长率都反映了公司扩大市场规模的能力,表明公司重点的发展方向。一般来说,主营利润稳定增长且占利润总额的比例呈增长趋势的公司正处在成长期。一些公司尽管年度内的利润总额有较大幅度的增加,但主营业务利润却未相应增加,甚至会出现大幅下降,这样的公司质量其实并不高,可能存在着资产管理的费用即成本居高不下的问题,也可能存在着着巨大的风险。因此投资者对于投资这样的公司,要提高警惕。313扩张能力指标100期末总股本期末净资产每股净资产每股净资产是每股所代表的股东权益额,它反映了每股最低限度的内在价值。以上建立的指标评

35、价体系可用以下框图表示指标评价体系框图聚类分析在证券市场分析中的应用1432实证研究利用本文随机选取的在沪深上市的40家山东省的公司企业,选择每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率5项指标评价体系,随机选取的样本指标数据来自证券之星数据中心的财务指标。本文利用的是190SPSS软件,通过系统聚类分析方法对这40家公司企业的股票进行聚类分析,分别将它们归类,为之后投资者提供决策依据。详细样本数据见表31表31选取的40家上市公司企业的样本数据代码简称每股收益每股净资产主营收入增长率()主营利润增长率()净资产收益率()000423东阿阿胶067733672397371

36、11632000880潍柴重机0652529789158012568300121阳谷华泰0622185149342832200726鲁泰B0573942921661455300208恒顺电气054185380553933719600547山东黄金053405175520562597002355兴民钢圈052385849422162300175朗源股份0471959664959236002073软控股份042415236442471437300110华仁药业04196390137751936002526山东矿机037212322436681607002470金正大0351671444285212

37、4300285国瓷材料0324435743162652600350山东高速03132822009161123000756新华制药022357107327346626600017日照港0192713562822918600986科达股份01718750286593924600756浪潮软件0163822326801424600336澳柯玛015145253082907731047600027华电国际0189232147114812733000739普洛药业01328301939296442000416民生投资0122813200983021927600467好当家0122031123393758

38、6000957中通客车00922515072205377600789鲁抗医药0062621094448247600022山东钢铁002152271641168849095000682东方电子002136921855147山东交通学院毕业论文15300105龙源技术133433171316523067300237美辰科技119267922811244387002588史丹利108537111318942019600690青岛海尔10345806469793551778000951中国重汽10268160881498002458益生股份128599716533515600600青岛啤酒095036

39、211256066149300233金城药业093132585825289600188兖州煤业07889577184137461368002581万昌科技07222420626724535600060海信电器06733493729128661015601678滨化股份0631265568183953215600219南山铝业05270306611463由表31可知,该实际问题中有40家公司,即总共有40个样本数据,每个样本数据又有5个指标变量即属性,则由第二章的样本数据矩阵21可知,表31数据集中的所有数据可用如下矩阵X表示)(5P40,N其中1111PNNPXXXXX321原始样本数据标准化

40、由于选取不同的指标,并且不同的指标具有不同的量纲,为了使所有的样本指标数据能够放到一起加以比较,以便更好地进行聚类分析,就需要我们对原始样本数据进行标准化处理,以消除由于各指标变量的量纲不同或数量级相差很大对分析带来的影响。常用的数据标准化方法主要有极差正规化变换、极差标准化变换和标准化变换。为了便于后面的说明,在此作出如下设定聚类分析在证券市场分析中的应用16所有样本表示为1111PNNPXXXXX,均值表示为11NJIJIXXN,标准差表示为2111NJIJJISXXN,极差表示为IJNIIJNIJXXR11MINMAX(1)极差正规化变换0TO1RANGEMIN1,2,101,2,050

41、XXIJIJININRXJIJRJJPRJ(31)此方法变换后的数据最小为0,最大为1,其余在区间0,1内,极差为1,无量纲。(2)极差标准化变换1TO1RANGE1,2,01,2,0XXIJJINRJXRIJJJPXRIJJ(32)此方法变换后的数据均值为0,极差为1,且1IJX,消去了量纲的影响。由以上两种方法可知,这两种方法都采用极值化法对数据进行无量纲化,都是通过利用变量取值的最大值和最小值将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级的影响。但是,由于极值化法在对变量进行无量纲化过程中,仅仅与该变量的最大值和最小值这两个极端值有关,而与其它取值无关,这使得该方法在改变各

42、变量权重时过分依赖两个极端的取值。如果两个变量取值相近,其分析权重近似相同,但在原始变量数据中存在明显的极大值时,会造成两个变量的分析权重不同。结合本论文中所选取的样本数据(样本数据详见表31)的特点,可知这两种方法都不适合对样本数据进行标准化处理。(3)标准化变换SCORESZ山东交通学院毕业论文1701,2,1,2,00IJJJJIJJXXSINSXJPS(33)此方法变换后的数据均值为0,标准差为1,消去了量纲的影响,并且当抽样样本改变时,它仍能保持相对稳定性。另外,此方法进行标准化的同时还消除了各变量在变异程度上的差异,从而使变换后的各变量在聚类分析中的重要性程度是同等看待的。综合以上

43、比较和分析,本论文中采用标准化变换)(SCORESZ的方法对样本数据进行标准化。在190SPSS软件中,对应选择】【SCORESZ即可。322用190SPSS软件对样本公司股票进行聚类分析利用190SPSS软件对样本公司股票进行系统聚类分析,具体操作步骤如下(1)打开190SPSS软件,导入样本数据(此处的样本数据是事先经过EXCEL编辑好的数据文件,此处即表31中的所有数据);(2)在190SPSS软件中,依次选择分析、分类、系统聚类,弹出系统聚类分析对话框;(3)在弹出的系统聚类分析对话框中,把每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率这5项指标评价体系依次导入到变

44、量这一栏中,此处为了更清晰地了解分类结果,我们还需要把样本股票的简称导入到标注个案这一栏中。这里要特别需要注意的是,在190SPSS软件中,数据文件中的一列数据称为一个变量,每个变量都应该有一个变量名,一行数据称为一条个案或观测量。此处,因为我们要对样本股票进行分类,属于个案,因此,我们需要在弹出的系统聚类分析对话框中的分群这一栏中选择个案;(4)点击统计量,选择合并进程表、相似性矩阵,在聚类成员一栏中选择【无】,因为我们现在还不知道样本股票分为几类比较合适;(5)点击绘制,选择树状图、所有聚类、垂直;(6)点击方法,在聚类方法中选择组间联接,在度量标准一栏的区间选项中选择EUCLIDEAN平

45、方距离,在转换值一栏的标准化选项中选择得分】【Z;聚类分析在证券市场分析中的应用18(7)最后点击确定运行。可得到如下的输出结果图31显示的是用EUCLIDEAN平方距离计算的近似矩阵表(此处由于样本数据较多,故只截取表的一部分),其实质是一个不相似矩阵,其中的数值表示各个样本之间的相似系数,数值越大,表示两样本距离越大图31近似矩阵表32显示的是聚类表,该表反映的是每一阶段的聚类结果,其中的第4列系数表示聚合系数,第2列和第3列表示的是聚合的类,此聚类表是为本论文在后面通过画“碎石图”来确定合适的分类个数做铺垫,并且由表32可知,聚类过程总共进行了39次山东交通学院毕业论文19表32聚类表阶

46、群集组合系数首次出现阶群集下一阶群集1群集2群集1群集217808900422125152005332343530013471235710952123417201061011463001573335517002581965200119376990424102021778051411148078019126138870023133032918032214202794710018151016112260241624261167002117539121400271814201338014261913814211102320192215060030211824151301631223036200613

47、029231620841912282431020969152825283322260735261415242318031275372532170352813281823243429304031562203230171931870203931141832152621343230314225290373322948600038341145213283136355285567272536361595963435373713010611363238381218338373339391172052938300聚类分析在证券市场分析中的应用20图32是冰柱图(此处设置为垂直输出),也是反映聚类状况的图,若

48、按照事先假定的聚类数,在冰柱图中那类的行上从左到右可以找到各类所包含的样本图32冰柱图图33是树状图即聚类谱系图,从中可直观地显示聚类的过程,当知道分类个数时,可以从聚类谱系图中清楚的看出各种股票的归类。山东交通学院毕业论文21图33聚类谱系图聚类分析在证券市场分析中的应用22323分类个数的确定正如在“25系统聚类法中类个数的确定问题”这一节中讨论的那样,我们使用聚类分析中的“碎石图”来确定比较合适的分类个数。利用“表32聚类表”中的第1列和第4列数据,以第1列数据的逆序即以分类数的逆序为横坐标,第4列数据即以聚合系数为纵坐标,选取合适的坐标范围和刻度,在EXCEL中画出“碎石图”,如图34

49、。聚类分析碎石图1611162115913172125293337分类数聚合系数系列1图34碎石图由以上“碎石图”可以形象地看出,当分类个数为5时,曲线开始变得平缓,因此,选择分类数为5是比较合适的。随后,在190SPSS软件中,重复在“322用190SPSS软件对样本公司股票进行聚类分析”进行系统聚类分析的操作,需要变化的操作有两个一个是在第“(3)”步弹出的系统聚类分析对话框中,还要选择【保存】,并在弹出的对话框中输入分类数为5,这一步的目的是为了后面对分类结果进行方差检验做准备;二是在第“(4)”步中的聚类成员一栏中输入分类个数为5,可得到分类数为5时的聚类表,见表33。表33显示的是群集成员,从该表中可以直接知道分为5类的结果以及各自样本的归类表33群集成员山东交通学院毕业论文23群集成员案例5群集1东阿阿胶12潍柴重机23阳谷华泰14鲁泰B15恒顺电气3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。