1、聚类分析在证券市场分析中的应用摘要聚类分析是一种非常常用的数据挖掘技术,它在证券投资分析方面有很大的研究和发掘潜能与空间。投资者在实践中可以将聚类分析应用于投资分析中,这样便可对股票的收益、成长、行业因素等方面进行全面的分析与考察,建立全面、合理的评价体系。研究者也可从多方面多视角为市场的营销战略与策略提供非常科学的参考体系,并将其运用于整个市场分析。总之,将聚类分析引入到证券市场的分析中来,为各方面都提供了很好的需求。本文将选取甘肃、宁夏、青海在沪深证券所上市的企业为例,具体分析聚类分析在证券市场分析中的应用。关键词聚类分析;投资分析;证券市场;SPSS软件;ANALYSISOFTHEAPP
2、LICATIONOFCLUSTERINGANALYSISINTHESTOCKMARKETABSTRACTCLUSTERINGANALYSISISAVERYCOMMONLYUSEDDATAMININGTECHNIQUES,ITHASALOTOFRESEARCHINSECURITIESINVESTMENTANALYSISANDTHEPOTENTIALANDSPACEINVESTORSCLUSTERINGANALYSISCANBEAPPLIEDINPRACTICEININVESTMENTANALYSIS,ITCANBEFORSTOCKRETURNS,GROWTH,INDUSTRYFACTORSAND
3、SOONTOCONDUCTACOMPREHENSIVEANALYSISANDINVESTIGATION,ACOMPREHENSIVEANDREASONABLEEVALUATIONSYSTEMRESEARCHERSCANALSOBEUSEDINMANYWAYSMOREPERSPECTIVETOTHEMARKETMARKETINGSTRATEGYANDSTRATEGYOFFERSASCIENTIFICREFERENCESYSTEM,ANDAPPLIEDITTOTHEWHOLEMARKETANALYSISINAWORD,THECLUSTERINGANALYSISISINTRODUCEDINTOTHE
4、STOCKMARKETANALYSIS,PROVIDESAGOODDEMANDFOREVERYTHINGTHISARTICLEWILLSELECTGANSU,NINGXIA,QINGHAI,THELISTEDCOMPANIESINSHANGHAIANDSHENZHENSECURITIESASANEXAMPLE,THECONCRETEAPPLICATIONOFCLUSTERINGANALYSISINTHESTOCKMARKETANALYSISKEYWORDSCLUSTERINGANALYSISINVESTMENTANALYSISSTOCKMARKETSPSSSOFTWARE目录第一章引言111研
5、究背景112聚类分析法113研究意义与方案2第二章聚类分析221聚类分析的原理概述222聚类分析的流程323聚类分析的方法4231系统聚类法类间距离的度量5232系统聚类法类的个数确定6第三章聚类分析在证券市场分析中的应用731聚类分析指标体系的建立7311证券行业分析及指标的选择7312指标评价体系732实证研究10321样本数据标准化11322用软件对数据样本进行聚类12323聚类结果21324结果验证24325结果分析26总结28致谢28参考文献281第一章引言11研究背景我国进入改革开放以来,国内市场经济有着快速、健康的发展条件,证券业也从20世纪90年代开始迅速发展。就像不能否定我国
6、经济发展所取得的成就一样,也不能否定我国证券业在这些年的发展。由于经济的发展,国民收入快速的增多,于是大家纷纷开始将更多的资金投入到金融市场中来,而证券市场又作为非常重要的金融市场,因此越来越多的人们将投资的目标锁定在证券市场。不过,事实也说明了问题,证券市场中,尤其是投资股票在过去的二十几年中,为很多投资者带来了客观的收益。但是,也并不是说证券业的发展只带来了积极的成就,在看到这些成就的同时也应该关注到目前还可能存在的一些不足。活跃在我国证券市场中的有一部分人缺乏投资证券的知识和经验,他们往往只关注于短线的操作,喜欢投机,同时各种媒体也不加以正确的引导,使得投机的氛围在这些人当中越来越浓。证
7、券市场1应该有起到投资与融资、优化资源配置的作用。而这些问题是与这些作用想违背的。现在,很多投资者都知道,证券市场中的股票市场是风云多变的,股价一直以来也是涨跌不定。有位著名的经济学家说过一句话,“如果股市只有操作,没有回报,那就是常说的一种零和博弈,钱只是在不同的人之间转手,并没有创造出更多的财富和价值。”因此,投入于证券市场的资金只有转移到真正能产生更多财富的企业当中,才能创造出更多财富,证券市场也才起到一定的作用。因此,正确引导那些投资者,认真的分析与研究市场和企业的发展前景和盈利能力,要有此心也要有此能。聚类分析就是一个很好且实用的研究方法,它能客观正确的研究与分析证券市场。12聚类分
8、析法回归分析、判别分析与聚类分析2一起称为多元统计分析中的三大分析方法。而聚类分析是建立在某种优化的意义下,按照研究的对象的共性分类,他的基本目标是发现样品的自然分组方法,从而分辨出在某一些共性和特征上相似或相同的事物,并把他们按照这个共性进行划分成若干类别。聚类分析是起源于分类学的,很久以前,人们都没有专门可以利用的数学工具进行定性定量分类,于是只有依靠大家长期以来的经验来进行。伴随着科技的进步,人们对分类的要求也跟着提高,再想依靠传统的经验来分类远达不到要求,于是只有将数学工具引入到了分类中,随着人们科学技术的发展,逐渐便形成了聚类分析。聚类分析的原则是同一类中的个体要具有一定的相2似性,
9、而不同类别的个体之间要具有较大的差异。它的优点和特征在于分类的结果是非常直观和清晰的,它的图标是能够很明确的表现其分类的结果,能够综合利用多个变量进行分类,它进行分类所得到的结果比以前传统的方法更全面、合理。13研究意义与方案聚类分析是一种非常有效的、可以从多角度的为证券投资指导方向的分析方法。这种方法在很多领域都有了广泛的应用,但在证券投资与分析方面还有很大的研究和挖掘空间3。我国的证券业,尤其是股票市场虽然一直处于一个不稳定的状态,但是毕竟还处于快速发展与健全的时期,相信我们所期待的规范时期即将到来。在现有的证券分析研究方案基础上,通过聚类分析的方法4,引入反映公司收益性、成长性、盈利能力
10、等指标运用科学的手段证实它在证券市场分析中的作用,以期能为更多的投资者提供一种全面、客观的分析证券市场的方法并得到大家的认可。同时不断的引导和灌输投资者正确的理念和知识,并从中得到有意义的指导,让市场也可以更快更好的发展。本篇论文首先将从研究的背景出发,说明此论文研究的意义与可行性,引导出所需要用到的研究方法聚类分析法。然后将聚类分析的不同方法和步骤做进一步的解释。最后将聚类分析在市场具体细分中的应用做详细的介绍,并通过选取的45家上市企业为实例,运用SPSS软件进行检验分析。全文通过这三个部分全面的对聚类分析在证券市场分析中的作用做一个深入的分析和总结。第二章聚类分析21聚类分析的原理概述在
11、聚类分析具体应用到证券研究中的时候,我们可以将不同的证券用每股收益、每股净资产、市盈率等财务上的指标加以表现5。那么用数学符号就可以将证券研究表示如下INIIIYYYY,2,1NJMI2,1,2,1其中IY表示所研究的第I个对象,IJY表示要研究的第I个对象的第J个属性。同时可以直观的将研究对象看作是M维空间上的一个点,而聚类分析所要做的就是将M维空间上的N个点加以分类而已。这个分类标准就是距离。距离是作为样品之间的相似程3度的度量,是聚类分析的基础。而我们可以用以下几类距离加以选择绝对值距离、欧氏距离、马氏距离、明科夫斯基距离等。(1)绝对值距离MKJKIKIJYYD1(1)IJD表示的是研
12、究的对象I到研究对象J的距离,而绝对值是以两个研究对象不相关为前提条件的,当这个条件不满足时,其聚类的结果应该得到怀疑。(2)欧氏距离2/112MKJKIKIJYYD(2)(3)马氏距离1YYYYJITJIIJMD(3)其中IY和JY分别表示所研究的对象I和J的M个属性所组成的向量,1是聚类变量的协方差阵MIITIYYYYM1111,其中MIIYMY11(4)明科夫斯基距离QMKQJKIKKIJYYPQD/11(4)其中1Q,当2Q时即为欧氏距离。KP是表示权重,由于其选择的主观性、任意性经常对其丢弃,忽视了研究变量的重要性差异因此研究结果不免偏颇。本文的距离选择了欧氏平方距离,因为后文选取的
13、样本数据是45家企业的股票,它的分类是未知的。而马氏距离适用于随机变量的样本点,并用于已知变量类别的情况。明科夫斯基距离又是一种范式距离,欧氏距离是它的一种形式。但是,又鉴于后文所选取的指标有净利润增长率、资产负债率、基本每股收益、每股净资产等指标,他们都为连续变量,因此选择欧氏平方距离(SPSS软件中为“平方EUCLIDEAN距离”)最为合适。由公式(2)可知,欧氏平方距离为MKJKIKIJYYD122(5)22聚类分析的流程在实际的研究与分析中,运用聚类分析来研究证券市场应当按照一定的顺序与步骤来进行。以股票为例,首先我们得对要研究的股票建立一个综合的评价指标体系,如主营收入增长率、净利润
14、增长率等客观指标。然后根据所了解的各类股票群的一些特征和状况划分出一个分析的范围,再对范围内的股票样本进行数据的收集。对收集4到的数据进行处理,并用相关软件进行分析,最后再做出聚类分析的结果,取出其中有用的信息,为投资者做出决策。其流程图如图21所示图21聚类分析流程图23聚类分析的方法聚类分析有很多种类,大致划分为以下几类(1)快速聚类分析法快速聚类分析发的思想是首先将样品粗糙得分类,再依据样品间的距离按一定的规则逐步调整,直至不能再调整为止。它适用于样本数目较大的数据集的聚类分析,但它也有一定的局限性,需要事先指定分类的数目,并且这个数目对最终分类结果有较大的影响。快速聚类法的步骤首先也是
15、要选择聚类种子点或者中心点,再将每个观察样本分配给最近的种子,然后重新把每个聚集中的中心点作为种子,并不断重复以上过程直到种子的变化足够的小。(2)模糊聚类分析法模糊聚类分析是采用的模糊数学语言对对象按一定的要求进行分类的方法。模糊聚类分析一般是指根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据一定的隶属度来确定聚类关系,即用模糊数学的方法把样本之间的模糊关系定量的确定,从而客观且准确地进行聚类。模糊聚类分析所讨论的对象,事先没有给定任何模式供分类参考,要求按照样本各自的属性特征加以分类。它的原则就是“最小化类间相似性,最大化类内相似性”。(3)最优分割法这种方法又被大家称为有序样品聚类
16、法。简单的讲就是将研究对象的全部样品当作一类,然后根据某种最优的准则将其分割为两类,再分为三类,以此类推,直到样品被分割为我们所需要的类为止。(4)系统聚类分析法建立股票综合评价指标体系选定聚类分析的范围收集股票样本的指标数据求取行业指标的均值对数据进行标准化处理用SPSS软件进行聚类分析根据需要确定聚类程度分析聚类结果,做出决策5其基本思想是假设要研究的对象有N个样品,每个样品有M项指标。首先定义这些样品间的距离,然后将这N个样品看成是N类,再将最近的两类合并聚为新的小类,将已聚合的小类按其相似程度(用类间距度量)再聚合,,依此类推。这样每次缩小一类,直到最后将全部样品合成一类,并类的全部过
17、程可以用聚类谱系图来描述。基本步骤如图22图22系统聚类分析法基本步骤系统聚类分析法的特点为事先可以无须知道分类对象的分类结构,而只需要一批分类数据,然后选好分类统计量,并按一定的方法步骤进行计算,便能得到其分类系统图。它既可以对观测量也可以对变量进行聚类,既可以连续变量也可以是分类变量,提供的距离计算方法和结果显示方法也很丰富。在进行实证分析研究的时候,往往采用不同的聚类分析法就会有不同的分类结果,而在实际过程中,系统聚类分析还是最常用的一种方法,因此本文也采用系统聚类分析法。231系统聚类法类间距离的度量距离作为对样品之间的相似程度的度量是聚类分析的基础。假设以I,J分别表示计算N个样品两
18、两间的距离KN,I1合并距离最近的两类KNIII1K1否画谱系聚类图是决定分类个数及各类的成员6样品JIXX,,IJD表示样品JIXX,之间的距离,含样品数为PN与QN的两个类为PNPPPPXXXG,21,QNPQQQXXXG,21类PG与QG之间的距离为PQD,常用的类间距离定义如下(1)最短距离QPIJPQGJGIDD,MIN两个类中样品之间距离最短的作为类间距离,其特点是样品有链接聚合的趋势,因此不适合一般数据的分类处理。(2)最长距离QPIJPQGJGIDD,MAX两个类中样品之间距离最长者作为类间距离。(3)类平均距离PQGIGJIJQPPQDNND221两类中所有两两样品之间的平方
19、距离的平均作为类间距离。这种方法是一种比较广泛,聚类结果也较好的方法。本论文便采用此方法来进行度量类间距离。232系统聚类法类的个数确定在聚类分析中,最后数据对象的类的个数应该怎么来划分,将哪些划分为一个类别。虽然这没有一个统一的标准,但是常用的几种分类个数方法有(1)根据数据点的散布图直观的确定分类个数如果指标只有2个,那么可以通过数据点的散点分布图来直观的确定。如果有3个变量,则可以绘制三围空间的散点分布图,并通过旋转三维坐标轴由数据点的分布来确定应该分为几类。如果变量超过3个时,则需要综合这些指标,综合成2个或3个,再来确定。(2)根据聚类谱系图确定分类个数数据经过系统聚类法处理后,便会
20、得到相应的谱系图。再根据如下准则确定分类。首先任何类都必须在相近类中是突出的。各类所包含的元素不宜过多。分类的数目要符合实用目的。(3)根据聚类分析折线图确定分类个数在聚类分析中,把离的较近的类进行合并,因此在并类过程中聚合系数会呈现出增加趋势,系数越小表示合并两类的相识程度越大。在聚类分析折线图中,以Y轴表示聚合系数,X轴表示分类数,画出聚合系数随着分类个数的变化曲线图。在曲线开7始变得平缓的地方,选择较为合适的分类数。这种方法的优点就是简洁、直观,因此后文的分类数就是以此为依据来确定分类个数。第三章聚类分析在证券市场分析中的应用31聚类分析指标体系的建立311证券行业分析及指标的选择利用聚
21、类分析,我们首先得将研究的对象进行分类,然后再量化分析与研究,因此我们要建立相应的评价指标。影响整个证券行业价格水平的因素大概有收益性和成长性。这里我们选择每股收益、主营收入增长率和净资产收益率来评价行业因素对证券的影响86。每股收益越高,反映的是整个行业的投资收益越高,每一股的获利的能力也就越强。主营收入增长率反映的是行业发展速度的一个快慢,发展速度快的行业当然前景就远大扩张的能力与速度就越快,而处于成长期的行业呢,对未来的收益预期就会较高。净资产收益率反映的是每股净资产的实际获利能力,是非常具有公正与客观的指标。312指标评价体系从综合考虑行业和公司的因素出发,可以有十几个具有一定代表性的
22、指标组成一个证券的综合评价指标体系,如图31所示。但是,由于从行业分析的指标来看,本文所选取的45家企业数据不能完整、系统的代替整个行业的指标数据,因此后文的实证研究着重以公司因素方面的业绩指标数据为主,进行聚类分析研究。其选择的指标有盈利能力、偿债能力、资产管理能力、成长能力、股本扩张能力。8图31聚类分析指标体系图(1)盈利能力指标平均资产总额净利润总资产利润率;(平均股东权益)平均净资产净利润净资产利润率;主营业务收入主营业务利润主营业务收益率;期末总股本净利润每股收益;总资产利润率是直接整体反映公司的获利能力大小,净资产利润率是反映公司对股东投资回报的大小。而主营业务是公司的未来发展方
23、向和现阶段利润的来源,主营业务收益率越大,说明该公司目前的竞争能力就越强。(2)偿债能力股票综合评价指标体系行业每股收益行业净资产收益率行业主营收入增长率总资产收益率净资产收益率资产负债率主营业务收益率流动比率速动比率每股收益每股未分配利润净利润增长率每股净资产每股公积金总资产周转率主营收入增长率流通股股本行业因素公司因素收益性成长性盈利能力偿债能力资产管理能力成长能力股本扩张能力9期末资产总值期末负债总值资产负债率;期末流动负债期末流动资产流动比率;期末流动负债期末速动资产速动比率;资产负债率反映的是长期偿债的能力。流动比率与速动比率则反映的是短期偿债能力,如果两者过于低,则说明公司的经营策
24、略有点保守,过高也不行,说明有扩张过渡的嫌疑,资金的流动没有保障。(3)资产管理能力期末总资产主营业务收入总资产周转率;资产管理能力是评价一个公司在资产管理方面的效率,它可以衡量一个公司的经营实力和资金方面的利用的能力,因此总资产周转率是反映公司资产总额的周转速度的快慢。(4)成长能力1上期主营业务收入本期主营业务收入主营业务增长率;1上期净利润本期净利润净利润增长率;主营业务增长率反映的公司扩大规模的能力,也是表现在重点发展方向的成长性。而净利润增长率者是反映公司发展以及给投资者的回报。成长性好的公司表现在资产的扩张能力强、资产重组能力好、盈利增长速度快等方面。(5)股本扩张能力期末总股本期
25、末净资产每股净资产;期末总股本期末资产公积金每股公积金;期末总股本未分配利润每股未分配利润;每股净资产是每份股所代表的股东权益额,反映的是内在价值。每股公积金则是10指从公司的利润以外的收入中提取的一种公积金,其用途是扩大公司生产经营活动和增加公司资本。每股未分配利润是企业的一股所拥有的未分配利润,可以在以后年度继续分配,它是属于所有者权益的组成部分。每股净资产、每股公积金、每股未分配利润的值是越高,表明公司的扩张能力就越强,公司为投资者的回报能力也就可能越大。32实证研究目前,在我国沪深两地上市的企业有非常多,数据量太大。因此,本文将选取在沪深两地上市的甘肃、青海、宁夏三个省份的上市企业共4
26、5家为例,来进行实证分析研究。由于这45家企业对于研究行业影响因素来说,数据量又太小,不具有较强的代表性,因此主要选择了业绩指标体系。我们共选择了5个评价指标体系,分别是净利润增长率、净资产收益率、资产负债率、基本每股收益、每股净资产。此次使用的上市公司财务数据均来自中国银河证券海王星的数据中心,数据截至日期为2013年9月30日,第三季度末。详细的数据如下表31所示表3145家企业财务数据代码名称净利润增长率净资产收益率资产负债率基本每股收益每股净资产000552靖远煤电8511425385045346000672上峰水泥9859456566394011156000779三毛派神354476
27、652807011155000791甘肃电投27107111797176056498000929兰州黄河18075453215015331000981银亿股份84898065041464000995皇台酒业36244015685701509002145中核钛白1332612259400428002185华天科技3048948451023268002219恒康医疗1305224932819039182002644佛慈制药1843492161027784300021大禹节水2809318656900517300084海默科技251461582412008484600108亚盛集团215412667
28、012232600192长城电工6924234971017402600307酒钢宏兴3923166798004305600311荣华实业658601856001137600354敦煌种业372915045994031189600516方大炭素33995534182016321600543莫高股份28422281112008361600687刚泰控股490022275529203513511600720祁连山11849945853057522600738兰州民百82988914162024273600886国投电力25971167779150426601798蓝科高新22243794097025
29、31000606青海明胶20452047311001197000792盐湖股份59724536445046101002646青青稞酒27941607104068438600117西宁特钢97790817844003393600243青海华鼎22941542631017324600714金瑞矿业41979342673006166600771广誉远101462978394001019600869远东电缆316735576945016292601168西部矿业107941845561009471000595西北轴承7449221186843026136000635英力特526732612544023
30、903000815美利纸业5484212681041176000862银星能源2533817689072019098000962东方钽业69590954798005557000982中银绒业333215247504039274002457青龙管业3994673176023497600146大元股份40112006227100711600165新日恒力2303086015003378600449宁夏建材687825264585043834600785新华百货10612665758092741由上面表内数据可知,共统计了45家企业,因此共有样本45个,每个样本有5个变量。又因为在聚类问题中有N个数
31、据NIXI,3,2,1,数据有P个变量(属性),IJX表示数据IX的第J个属性,因此数据集的所有变量可以用一个矩阵表示NPNPXXXXX1111(1)其中5,45PN。321样本数据标准化消除原始数据量纲不同的影响,是为了使所有样本的指标数据能够更好的加以比较,以便于更好的聚类分析,因此要进行样本数据标准化。而通常使用的变换方法有极差标准化、标准差标准化。所有样本均可表示为12NPNPXXXXX1111均值则表示为NIIJJXNX11标准差表示为NIJIJJXXNS1211极差为IJNIIJNIJXXR11MINMAX那么极差标准化为PJRXNIRJIJJJJIJIJRXXX,2,10,2,1
32、0变化后的数据均值为0,极差则为1,且1IJX。标准差标准化是PJSNISJJJJIJIJSXXX,2,100,2,10用此方法后数据的均值为0,标准差为1。用这两种方法标准化后,都消除了量纲的影响。但用极差标准化进行的过程中,只与变量的最大最小值有关,如果两个变量取值相近,而在原始变量中存在很显然的极大值时,会使得两个变量的分析权重不同。用标准差标准化时就会保持相对的稳定性。322用软件对数据样本进行聚类在此次的软件分析中,利用的是SPSS软件对数据进行聚类分析9,其具体的步骤为(1)将表31中样本的数据导入到软件中去。如图3233所示13图32导入变量图33数据导入14(2)在软件中依次选
33、择分析、分类、系统聚类,打开它的系统聚类分析对话框,如图34所示图34聚类分析对话框(3)在对话框中,将这5项指标体系依次导入变量栏中,将名称导入个案栏中,如图35所示图35指标导入15(4)点击统计量,选择合并进程表、相似性矩阵、聚类成员栏选择“无”。再点击绘制,选择树状图、所有聚类、垂直。最后选方法,在聚类方法中选择组间联接,度量栏标准栏的区间选项中选择平方EUCLIDEAN距离,转换值栏的标准化选项选择“Z得分”。最后确定运行。每一步的选择如图3638所示图36统计量图37绘制16图38方法运行后得到以下的结果,表32是一个用平方EUCLIDEAN距离计算后的近似矩阵表,其中的数值是表示
34、各个样本之间相似的系数,值越大表示样本间的距离越大。由于数据量太大,因此只选择了一部分。表32近似矩阵表近似矩阵案例平方EUCLIDEAN距离1靖远煤电2上峰水泥3三毛派神4甘肃电投5兰州黄河6银亿股份7皇台酒业1靖远煤电000449311167144993390210194262上峰水泥4493100050140276434298845480464813三毛派神11671501400002077431541444940124甘肃电投4499276432077400096593742163765兰州黄河33904298831549659000650956086银亿股份2101454801444
35、93742650900086687皇台酒业942646481401216376560886680008中核钛白453341336348893521906431615399华天科技124542760554572738103875501310恒康医疗32504825314986111355993101621504511佛慈制药7672534731113311984446099181680812大禹节水462642151447410072304544499071713海默科技6057453233589119307618952813414亚盛集团4278449362579121582948537554
36、315长城电工237342853473170857563188445016酒钢宏兴4719428694910916829953470151417荣华实业1079450016183520996273317113876118敦煌种业1868749299359524490942816520327719方大炭素240343613371785282314615436720莫高股份744648838290015708109012445923521刚泰控股1934417291442074216014598510440而聚类表是反映每一阶段的聚类结果,其中第2列和第3列表示的是聚合的类,第4列系数表示聚合的系
37、数。由表33可知道聚类过程共进行了44次。表33聚类表聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21923032001622440089002631231094001543033109001458161810066843221501472541222002085192310011934393120013101136449003411514476801612264255000181315345700920148306066415158126561432116596601112917132068700321832679001225193537900002420152592413
38、729218299871503322122112500312373211730033241835122201930253171356180351826624136502312710211455003828274415860034295151618162032301838168224043311620342226363251321092917353378219223213734112733241028413535366425323736144131310383737439435334038110578936274039284574290041401375713837424111288825343
39、942421111143340414343118169834230444412461624300得到的冰柱图如图39,也是反映聚类状况的图。图39垂直冰柱图树状图即聚类谱系图,也可以从中直观的显示聚类的过程,如果知道分类数时候,19也可从中看出各种股票的归类。其树状图如图310所示;图310树状图20经过以上数据的分析,将表33聚类表中的第1、4列数据用EXCEL做出一个聚类分析折线图,如图311可看出,选择分类个数为10个时曲线基本最为平缓,因此分为10个类是比较合适的。聚类分析折线图05101520253035404550147101316192225283134374043分类个数聚合系
40、数系列1图311聚类分析折线图然后用软件再进行聚类分析,并在弹出的系统聚类分析对话框中选择“保存”,并将分类数设为10,可以得到系统已经分类好的图,如图312;21图312系统分类图323聚类结果用软件进行聚类分析后得到的聚类结果如表34313所示;表34第一类第一类代码名称000552靖远煤电000981银亿股份600720祁连山600886国投电力000982中银绒业表35第二类第二类代码名称000672上峰水泥22表36第三类第三类代码名称000779三毛派神000929兰州黄河002185华天科技300084海默科技600108亚盛集团600192长城电工600311荣华实业60051
41、6方大炭素600543莫高股份600738兰州民百601798蓝科高新000606青海明胶601168西部矿业000962东方钽业002457青龙管业600146大元股份表37第四类第四类代码名称000791甘肃电投表38第五类第五类代码名称000995皇台酒业002145中核钛白300021大禹节水600307酒钢宏兴600117西宁特钢600243青海华鼎600714金瑞矿业23600771广誉远600869远东电缆600146新日恒力表39第六类第六类代码名称600687刚泰控股002219恒康医疗表310第七类第七类代码名称002644佛慈制药000792盐湖股份000635英力特60
42、0449宁夏建材表311第八类第八类代码名称600354敦煌种业000595西北轴承000815美利纸业000862银星能源表312第九类第九类代码名称002646青青稞酒表313第十类第十类代码名称600785新华百货24324结果验证对聚类结果的分类,我们将用软件进行验证。其详细步骤如下(1)在软件界面菜单栏依次点击分析、比较均值、均值,然后打开了平均数的对话框。将指标变量都放入因变量列表中,将分组变量放入自变量列表中,如图313所示图313均值对话框(2)点击确定,运行后结果显示如表314(3)检验平均数的差异就在菜单栏上依次点击分析、比较均值、单因素方差,然后将指标变量放到因变量列表,
43、将分组变量放入因子列表,如图314,点击确定后数据处理的结果如图315表314均值报告表AVERAGELINKAGEBETWEENGROUPS净利润增长率加权净资产收益率资产负债率基本每股收益1均值8570201292206944404440N5555标准差107260843521371238330074032均值98594500656006394001100N1111标准差3均值40856294443350691025N1616161625标准差175187433839931380152105614均值271071001179007176005600N1111标准差5均值8456502484
44、06840200440N10101010标准差21845277196343766890087466均值31027002384004055503700N2222标准差254204891541491748675028287均值2933075397253933753475N4444标准差369832721163001983646114428均值25396251879007502252925N4444标准差349054633005971357798092519均值2794001607001040006800N1111标准差10均值1060001266005758009200N1111标准差总计均值32
45、38713382335132401673N45454545标准差152641075944980218572525983图314方差分析对话框26图315平均数差异检验325结果分析将每一类的相应指标均值汇总,如下表315表315均值汇总表类别净利润增长率加权净资产收益率资产负债率每股收益每股净资产1857021292269444044437322985945656639401115634085625294437533506875010253329375427107111797176056498584565248468402004424176310272384405550371585729330
46、753972539337503475882758253962518797502250292514975927941607104068438271010601266575892741将此表按照前文的指标评价体系选择来整理,便于我们更好的综合分析,因此把相应指标汇总成表316表316汇总表盈利能力指标成长能力指标偿债能力指标扩张能力指标类别每股收益净资产收益率净利润增长率资产负债率每股净资产104441292285702694443732201165698594563941563010252944375408562533506875332937540561179271071717649850044
47、24848456568402241760372384310274055515857034753972529330753933758827580292518792539625750225149759681607279410404381092126610605758741根据上表中的汇聚数据来分析第一类盈利能力好,成长能力一般,偿债能力较强,扩张能力也一般。第二类股票盈利能力不也尽人意,但成长能力好,有一定的潜力,值得大家对它有一定的期望。第三类成长能力弱,没有太多的空间,但他的扩张能力还不错。第四类和第七类是明显的优绩股,他们的成长能力都很强。第四类的偿债能力更强,投资环境更加安全,同时成长能力
48、也更强,未来发展的预期较高,是潜力股,而第七类的扩张能力则更加突出。第八类股票明显的低收益、低成长性的差绩股,而且扩张能力也不好,说明企业的经营和财务不是很好,发展或许有下滑的趋势。第九类的收益很好,但其偿债能力和成长空间较小,投资该类证券眼见收益是很好,但不值得做长期的投资发展。第十类也是盈利能力很好,比起第九类它的偿债能力与扩张能力更好,但它的成长能力却很差。因此,由以上的聚类结果分析可以知道,聚类分析能够对股票的盈利性、成长性、扩张性、偿债能力等进行多方面的分析。它也有利于投资者更全面的了解证券的特性和预测它的潜能,进而为自己的投资做出最好的选择。28总结聚类分析法是在应用上非常广泛的一
49、种多元统计分析法,在证券市场分析中也有很大的研究价值。本文是通过选取反映公司的盈利能力指标、成长能力指标、偿债能力指标、扩张能力指标来对聚类结果进行分类分析,并从中分析出各个公司在某些方面的实力。这些分类分析结果都有利于投资者作出正确、理智的投资,对很多投资者来说都具有极强的实践性。通过对聚类分析的结果进行验证也说明了结果的可靠与可信性。本文只选取了西北三个省份的上市公司为数据来源,如若有大量的证券数据进行分析则可能更加显示出聚类分析的优势,也能更加突出聚类分析结果的准确性和可参照性。同时,由于本篇论文仅仅从企业业绩的各项指标上采集数据进行了分析与研究,并未对企业行业因素进行数据采集分析,因此,在以后的研究中还需要广泛采集数据将行业影响因素一同考虑在内,分析出更加全面、科学的结论。在对分类个数的确定上,也可看出并不是唯一的,这还
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。