毕业论文(设计):聚类分析在证券市场分析中的应用.doc
《毕业论文(设计):聚类分析在证券市场分析中的应用.doc》由会员分享,可在线阅读,更多相关《毕业论文(设计):聚类分析在证券市场分析中的应用.doc(41页珍藏版)》请在温州文客信息科技有限公司上搜索。
1、山东交通学院毕业生毕业论文(设计)题目聚类分析在证券市场分析中的应用聚类分析在证券市场分析中的应用2摘要本文随机选取了40家在沪深上市的山东省的公司企业,选择每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率5项指标评价体系。通过系统聚类分析方法对这40家公司企业的股票进行聚类分析,以此对股票的收益性、成长性等方面进行分析,帮助投资者准确地把握股票的总体特性以及预测股票的成长能力,使投资者及时做出最佳的投资决策,进而获得可观的投资回报。最后在聚类分析的基础上,对聚类分析结果采用MEANS方法进行检验,以此来进一步验证分析结果的可靠性和可信性。此研究表明聚类分析方法在证券市场投资
2、分析中具有有效性和实用性。关键词聚类分析,证券市场投资,MEANS方法,投资回报山东交通学院毕业论文3ABSTRACTINTHISPAPER,WERANDOMLYSELECTED40COMPANIESINSHANDONGPROVINCEWHICHWERELISTEDINSHANGHAIANDSHENZHENSTOCKMARKET,ANDWECHOICETHEFIVEINDICATORSEVALUATIONSYSTEMTHATARETHEEARNINGSOFPERSHARE,THENETASSETSOFPERSHARE,THEGROWTHRATEOFTHEMAINBUSINESSREVENUE,
3、THEGROWTHRATEOFTHEMAINBUSINESSPROFITANDTHEYIELDOFTHENETASSETSINORDERTOHELPINVESTORSTOACCURATELYGRASPTHEOVERALLFEATURESOFTHESTOCKANDTHEGROWTHABILITYOFTHESTOCK,WEEFFECTIVELYUSETHEMETHODOFTHESYSTEMCLUSTERINGANALYSISTOANALYZETHESTOCKSPROFITABILITY,GROWTH,ETC,WHICHWEREMENTIONEDABOVETHESTOCKSOFTHE40COMPAN
4、IESABOVEALL,THISCANHELPINVESTORSTOMAKETHEBESTINVESTMENTDECISIONS,ANDGETCONSIDERABLERETURNSINATIMELYMANNERFINALLY,INORDERTOFURTHERVERIFYTHERELIABILITYANDCREDIBILITYOFANALYSISRESULTS,WEUSEMEANSMETHODSTOTESTTHERESULTSOFCLUSTERANALYSISTHESTUDYSHOWSTHATTHEMETHODOFCLUSTERINGANALYSISHASVALIDITYANDPRACTICAB
5、ILITYINTHESECURITIESMARKETINVESTMENTANALYSISKEYWORDSCLUSTERINGANALYSIS,STOCKMARKETINVESTMENT,MEANSMETHOD,RETURNONINVESTMENT聚类分析在证券市场分析中的应用4目录1绪论111论文研究的背景及意义112聚类分析在证券市场分析中的应用价值213聚类分析在证券市场分析中应用的优点214聚类分析在证券市场分析中应用的当前状况215本文的研究内容及内容结构3151研究内容3152内容结构32聚类分析421聚类分析的基本思想422聚类分析的方法423系统聚类法的基本思想和基本步骤5231
6、样本间距离的度量6232类间距离的度量824系统聚类分析方法的比较925系统聚类法中类个数的确定问题103聚类分析在证券市场分析中的应用1231聚类分析在证券市场分析中应用时的指标评价体系的选择12311盈利能力指标12312成长能力指标12313扩张能力指标1332实证研究14321原始样本数据标准化15322用190SPSS软件对样本公司股票进行聚类分析17323分类个数的确定22324聚类结果24325对聚类结果进行检验25326结果分析264总结和展望29总结30山东交通学院毕业论文11绪论11论文研究的背景及意义改革开放以来,随着我国市场经济的迅速、健康发展,国民的金融意识和投资意愿
7、日益增强,而作为市场经济的重要组成部分证券市场,正渐渐地走向成熟,越来越多的投资者把目光投向了股票,历史已经证明,股票不仅在过去是一种已经给投资者提供了可观的长期收益,并且在将来也会是提供良好机遇的投资媒介。一直在宾夕法尼亚大学沃顿商学院担任金融学教授的杰里米J西格尔,他在其名著长期股票投资中就曾经说到“尽管未来回报率可能比过去低,但是仍然存在强有力的证据让我们相信,对于所有追求经济平稳和长期收益的投资者而言,股票还是最好的投资方式。”然而,正如日常生活中那样,股市变幻莫测、股价涨跌无常,投资者要想在股市投资中赢取可观的投资回报,就需要认真研究上市公司的业绩和发展前景,找出真正具有投资价值的股
8、票,从而作出投资决策,进而进行投资。俗话说“物以类聚,人以群分”,在自然科学和社会科学中,存在着形形色色的分类问题。所谓的类,通俗地讲,就是指由相似元素组成的集合。聚类分析,它是研究样品或指标分类问题的一种统计分析方法。聚类分析起源于分类学,在古老的分类学中,人们主要依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。随着人类科学技术的发展,对分类的要求也越来越高,以致有时仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,之后又将多元分析的技术引入到数值分类学中形成了聚类分析。聚类分析的比较典型应用是在商务上,聚类能帮助市场分析人员从客
9、户基本库中发现不同的客户群体,并且用相应适当的模式来刻画不同客户群的特征。比如,在经济学中,为了了解不同地区城镇居民的收入及消费情况,往往需要划分为不同的类型;在生物学中,聚类分析能用于推导植物和动物的分类,对基因进行分类,从而获得对种群中固有结构的认识;在产品质量管理中,聚类分析可以根据各产品的某些重要指标而将其分为一等品、二等品等。又如,在WEB上的文档中,聚类分析也能用于对WEB上的文档进行分类,从而发现信息。聚类分析即是研究分类问题的数据分析方法。聚类分析在证券市场分析中的应用212聚类分析在证券市场分析中的应用价值聚类分析建立在基础分析之上,立足于对股票的基本层面进行量化分析。鉴于基
10、础分析对影响股票价格的诸多因素这一定性分析的不足,聚类分析则很好地弥补了这一缺陷。作为进行长期投资的理性投资者的参考依据,其目的在于从股票基本层面决定的内在价值中发现股票的真正投资价值。另外,在聚类分析模型的建立过程中,我们进一步考虑了公司的成长能力,它对股票的投资价值有着重要影响。成长能力是一个不断变化的趋势,因此我们选取了较能反映公司成长能力的客观指标,如主营收入增长率、主营利润增长率,以便更好地探究股票的成长能力,进而使投资者能够更好地、正确地预测股票的发展前景和发展潜力。13聚类分析在证券市场分析中应用的优点与现代投资组合理论相比,聚类分析方法显得更加直观、实用,并且在应用时所受的局限
11、性小、操作性强,具有一定的优越性,适合于广大投资者采用。聚类分析建立的是一种长期投资理念,因此,在全球金融一体化、自由化浪潮下,并且在我国的证券市场逐步走向成熟的过程中,提倡运用这种理性的投资分析方法,理性的作出投资决策,这样不但可以降低投资风险、规范投资行为,而且有利于促进上市公司更好地参与市场竞争,促进我国证券市场的稳定、健康发展,从而建立一个良好的国内金融市场秩序。另外,单纯从聚类分析这一方法来讲,聚类分析通过对样品或指标(变量)之间存在的相似程度进行度量,将“相似”的归并成类。体现出以下三大显著的优点(1)能综合利用多个变量对样本进行分类;(2)分类结果更加直观,具体体现是聚类谱系图,
12、从聚类谱系图中,我们可以很清楚地观察其分类结果;(3)聚类分析所得到的结果比传统分类方法更细致、全面、合理。这些优点足以更加有利于我们将聚类分析方法应用在证券市场分析中。14聚类分析在证券市场分析中应用的当前状况聚类分析是一种行之有效的指导证券投资的方法。聚类分析首先对各类股票的公司因素、收益性、成长性、扩张性等基本层面进行考察,然后再利用综合指标评价体系来衡量样本股票的“相似程度”。利用聚类分析模型能够帮助投资者山东交通学院毕业论文3准确地了解和把握股票的总体特性,以便及时地作出投资决策,进行投资。在证券投资方面,聚类分析还有很大的发掘空间和研究价值。目前,国内颇具有代表性的研究大多仅仅局限
13、于板块分析,选用的指标也仅仅反映了上市公司的盈利水平,尚不能全面反映股票的总体特性。在现有的研究基础上,本文深入探讨了聚类分析在证券投资中的应用价值,丰富和完善了在证券市场分析中应用聚类分析时的指标体系。15本文的研究内容及内容结构151研究内容本文阐述了聚类分析的理论背景,主要研究了用系统聚类分析方法对样本数据进行分组,但是,我们并不知道样本数据的分组是否合理,因此再利用MEANS方法对其进行检验,从而使得聚类精度有所提高,进而增加分析结果的可靠性和可信性。152内容结构本论文共分四章,具体的内容结构如下第一章是绪论,介绍了论文研究的背景及意义。第二章详细介绍了聚类分析的基础理论,系统聚类法
14、的基本思想、基本步骤、距离度量和类个数的确定问题。第三章给出了聚类分析方法在证券投资市场中的具体应用,并采用MEANS方法对分析结果进行检验,证明其有效性。第四章是对聚类分析方法在证券投资市场中的应用进行总结和展望。聚类分析在证券市场分析中的应用42聚类分析聚类分析是把数据集分解或划分成多个类或组,使同一组中的数据比较相似,不同组的数据差别较大。通过聚类,可以识别数据之间的相似程度,从而发现数据集的分布模式和数据的属性之间的相互关系。21聚类分析的基本思想聚类分析的基本思想是认为研究的数据集中的数据之间存在不同程度的相似性,根据数据的几个属性,找到能够度量它们之间相似程度的量,把一些相似程度较
15、大量的归为一类,另一些相似程度较大的量归为另一类,即同一组内的数据对象之间具有较高的相似程度,而不同组中的数据对象之间是不相似的。而对这种数据对象之间的相似或不相似程度的描述又是由数据属性的取值来确定的,通常就是利用各数据对象之间的距离来表示的。22聚类分析的方法聚类分析的内容非常丰富,从其聚类的方法来看,可分为以下几类(1)谱系聚类法谱系聚类法又称系统聚类法,它是在给出样品间的距离和类与类间的距离定义的基础上,先将每个样品各自当作一类,计算出各类即各样品之间的距离,再将最近的两类合并聚为小类,将已聚合的小类按其相似程度(用类间距度量)再聚合,依此类推,每次减少一类,随着相似程度的减弱,直到最
16、后将全部样品合成一类,并类的全部过程可以用聚类谱系图来描述。(2)快速聚类法快速聚类法又称动态聚类法,它的基本思想是,先确定若干个中心,然后将样本逐个输入,看看样品能否归属哪类,如果可以归属已有的某个类,则归之,且对该中心稍作调整;否则可以建立新类,并调整原有的归属及重新计算新的各类的中心;如此继续下去,直到每个样品皆有归属为止。这种方法可以大大地提高计算速度,但由于初始中心的个数及位置的选取、样品输入的顺序都可能对最后结果产生某些影响,所以在实际运用时要慎重。(3)最优分割法最优分割法又称有序样品聚类法,它是先将全部样品当成一类,然后根据某种最优准则适当地将其分割为两类,再分为三类,山东交通
17、学院毕业论文5直到最后将样品分割为所需的类为止。(4)模糊聚类法模糊聚类法是利用模糊集理论来处理分类问题,它对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果。(5)图论聚类法图论聚类法是利用图论中最小支撑树的概念来处理分类问题,由此也创造了颇具风格的一种方法。(6)聚类预报法聚类预报法是利用聚类方法来处理预报问题。我们知道,在多元统计分析中,如回归分析和判别分析都可以用来作为预报的方法,但是对于那些存在异常数据,例如在灾害性气候的气象预报中,此时若还利用回归分析或判别分析的方法来处理,其效果都不好,而聚类预报弥补了这一不足缺陷。另外,聚类分析根据分类对象的不同,分为R型和Q型两大
18、类R型聚类分析是对变量(或指标)进行分类处理,其作用在于1可以了解变量间及变量组合间的亲疏关系;2可以根据变量的聚类结果及它们之间的关系,选择主要变量进行回归分析或Q型聚类分析等。Q型聚类分析是对样本进行分类处理,其作用在于1能利用多个变量对样本进行分类;2分类结果直观,聚类谱系图能明确、清楚地表达其分类结果;3所得的结果比传统的分类方法更细致、全面、合理。当使用不同的分类方法时,往往会得到不同的分类结果,更何况对于任何观测数据都不会存在唯一“正确”的分类方法。在实际工作中,仍以系统聚类法使用的最多,系统聚类法是目前在实际应用中使用最多的一类方法。因此,在本论文中就使用系统聚类法,即谱系聚类法
19、,并且是进行Q型的聚类分析。23系统聚类法的基本思想和基本步骤设有N个样本,并且每个样本都有P个变量(或指标)。系统聚类法的基本思想是首先定义样品间的距离和类与类之间的距离,开始时先将每个样品各自当作一类,此时样本间距离与类间距离是等价的,再将最近的两类合并聚为小类,聚类分析在证券市场分析中的应用6将已聚合的小类按其相似程度(用类间距度量)再聚合,依此类推,每次减少一类,随着相似程度的减弱,直到最后将全部样品合成一类,并类的全部过程可以用聚类谱系图形象地表达出来。由上述系统聚类法的基本思想,可以得出利用系统聚类法进行聚类分析的基本步骤数据标准化我们所考察的样本数据有不同变量(或指标)时,这些变
20、量(或指标)一般都有不同的量纲、不同的数量级单位、不同的取值范围。为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对数据进行归一化或标准化处理。并且,还要选择样本之间和类之间距离度量的方法;计算N个样本两两之间的距离,得到样本间的距离矩阵0D;刚开始第一步时)(第一步1I,将N个样本各自看成一类,此时类的个数NK,样本间的距离就是类间的距离,然后对步骤2,3,IN执行聚类的步骤和;每次合并类间距离最小的两类为一新类,即此时类的总数减少了1,此时类的总数为1KNI;继续计算新类与其它类之间的距离,得到新的距离矩阵ID。如果合并后类的个数K仍然大于1,则重复步骤和,直到类的总个数是
21、1时为止;画出聚类谱系图;决定分类的个数以及各类的成员。231样本间距离的度量聚类问题中有N个数据1,2,3,IXIN,每个数据有P个变量即属性,IJX表示数据IX的第J个属性,则数据集的所有变量可用如下矩阵表示1111PNNPXXXXX(21)由于变量的多样性,其取值可能是连续值的区间变量、二元变量、序数变量、山东交通学院毕业论文7名义变量等,它们的处理方法是不同的,如工资水平、股票价格、利率、汇率等可以用连续值表示的称为连续变量,由于使用的变量单位不同等诸多因素,它们的值可能相差比较悬殊,为使各变量在聚类分析中地位相同,就需要对数据进行归一化即标准化处理。两个数据的接近程度用距离表示,样品
22、JIXX,之间的距离,JIDXX,一般要求它满足下列条件(1),0,JIDXX且,0,JIDXX当且仅当JIXX;(2),IJJIDDXXXX;(3),JKKIJIDDDXXXXXX。在聚类分析中,有些“距离”不满足(3),我们在广义的角度上仍称它为“距离”。常用的距离有欧式距离、明科夫斯基距离、马氏距离等。下面就简要介绍几种聚类分析中的常用距离设TPXXX,21X是我们所关心的P个指标,对此指标进行N次观测,从而得到N组观测值12,1,2,TIIIIPXXXINX,称这N组观测数据为N个样品。这时,每个样品可看成P维空间的一个点,N个样品组成P维空间的N个点,我们自然就可以用各个样本点之间的
23、距离来衡量各样品之间的相似程度。1欧氏距离1221,PIJIKJKKDXXXX(22)2MINKOWSKI距离(明科夫斯基距离)11,|PMMIJIKJKKDXXXX(23)其中1M。MINKOWSKI距离又称ML距离,2L距离即欧氏距离。3马氏距离112,TIJIJIJDXXXXSXX(24)聚类分析在证券市场分析中的应用8其中S是由样品NXXX,21算得的样本协方差矩阵111NTIIINSXXXX,其中11NIINXX马氏距离适用于作为随机变量的样本点,并且马氏距离用于已知类别的模式情况,而我们所选定的40家公司股票的类别是未知的,因此该距离不能用;明科夫斯基距离是一种范式,也就是说欧氏距
24、离是明科夫斯基距离的一种特殊形式,即在23式中2M时,此时的明科夫斯基距离即欧氏距离。因此,在此处我们选择欧氏距离来度量样本间的距离,欧氏距离是聚类分析中用得最广泛的距离。但是,鉴于本论文中选取的5项指标每股收益、每股净资产、主营收入增长率、主营利润增长率和净资产收益率,正如在本节“231样本间距离的度量”中提到的,它们皆为连续变量,而欧氏距离平方最适合对连续变量进行数据处理,因此,在本论文中,对于样本间距离的选择问题,我们选择欧氏距离平方,190SPSS软件中对应选择距离】【平方EUCLIDEAN,由22式很容易得到欧氏距离平方221,PIJIKJKKDXXXX(25)232类间距离的度量距
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 文钱
下载 | 加入VIP,畅享折扣下载 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 毕业设计 论文 学位论文 论文范文 学士论文 论文范本 论文下载 学士学位论文 论文模板
链接地址:https://www.wenke99.com/p-40525.html