1、多元统计分析课程大作业论文题目:分地区按登记注册类型分全社会固定资产投资(2015 年)分 院: 经济与统计分院 专业班级: 统计 1402 班 学生姓名: 马 小 伟 学 号: 1405060207 1分地区按登记注册类型分全社会固定资产投资(2015 年)本文目的随着综合国力的发展,经济水平日益提升,按登记注册类型分全社会固定资产投资出现差异性。本文以各省份及直辖市为研究对象,数据来源于 2015 年中国统计年鉴中相关数据,选取其中 9 个反映全社会固定资产投资的指标,运用 SPSS 软件采用多元统计方法中系统聚类法,结合中国综合经济实力的环境和各省份及直辖市综合经济实力的实际情况和特点,
2、对各省份及直辖市固定资产投资进行聚类分析。因某些特殊原因及政治敏感问题,登记注册类型中的港澳台商投资、外商投资和内资合计不在本文分析。一、理论基础聚类分析聚类分析是将个体或对象分类,使得同一类中的对象之间的相似性比其他类的对象的相似性更强。其目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化。聚类分析主要方法有系统聚类法,模糊聚类法, K-均值法,有序样本的聚类,分解法与加入法等多种分类方法。本文运用系统聚类对样品进行分类。其运用的主要思想是,首先样品(或指标)间各个自形成一类,然后将关系密切的合并成一个新的小类,形成 个类;再从剩余样本中找出与新小类1n关系最为密切的个体或小类加以
3、合并再聚为一类形成 个类,以此类推,直到把所有的样品2(或指标)全部聚合完毕,再将不同的类型划分出来,形成一个由小到大得分类系统,将这个分类系统画成一张谱系图便可决定分多少类,每类各有那些样品。在进行聚类分析时,计算类与类之间距离的方法有五种:1.最短距离法: (2-1)),(),(min),( lqDlplrDkkk2.最长距离法: (2-2),ax, sss3.类平均法: (2-3)22211pqkrqkprpk -n-n4.重心法: (2-4)D-D, rrqrp ,5.离差平方和法: (2-qpDnqknpknk wkrwqwrpw , 2222 5)123二、全社会固定资产投资(20
4、15 年)的应用数据(一)指标建立与数据选取影响全社会固定资产投资(2015 年)因素有很多,从分地区按登记注册类型看,各地区固定资产投资具有不同特点。登记注册类型中国有成分在各个地区均为发展主力;股份合作和联营两项在各个地区的固定资产投资所占成分较少;而对于整个中国(除港澳台)来说,有限责任公司和私营已然成为新生力量,在固定资产投资占据相当一部分数额。根据 2015 年中国统计年鉴中10-3 分地区按登记注册类型分全社会固定资产投资(2015 年)的一部分统计数据,本文选用 9 个指标反映各省份及直辖市固定资产投资水平。影响全社会固定资产投资(2015 年)因素的 9 个指标分别为: 国有;
5、 集体; 股份合1x23x作; 联营; 有限责任公司; 股份有限公司; 私营; 个体;x 其他。具体数据见表 1-4x56x7x891。表 1-1 分地区按登记注册类型分全社会固定资产投资(2015 年) 计量单位:亿元地区 国有 集体 股份合作 联营有限责任公司股份有限公司私营 个体北京 1631.7 126.1 2.8 2.2 4381.6 191.8 513.7 50.3天津 2739.8 736.6 45.8 96.3 3457.1 423.1 3194.4 17.4河北 4674.2 676.2 148.4 110.9 7449.6 1383.8 11673.8 657.6山西 40
6、21.4 866.5 22.1 37.2 2844.4 374.7 3874.8 401.9内蒙古 5281.3 124 19.5 27.9 4716.4 577 2332.4 222.4辽宁 3013.6 233 21.4 35.6 4105.9 523 7850.6 335.8吉林 2871.5 90 30.6 17.8 3936 568.3 3641.8 309.8黑龙江 2877.1 76.9 38.5 34 2899.3 148.4 2772.9 373.3上海 1567.1 50.8 2.8 23.7 2254.6 248.3 1017.1 3.3江苏 8031.5 1767.4
7、91.7 122.4 8566.2 1210.2 21162 431.9浙江 6289.2 886.9 72.3 53.7 8144.3 669.5 7714.5 716.84安徽 4872.1 295 52.4 37.5 5993.7 1130.8 9570.7 634.1福建 5531.6 958.3 33.4 40.8 5856.7 520 5795 405.4江西 3471.8 86 31.3 66 4874.1 459.4 6891.3 473.1山东 5717.4 2870.3 224.6 134.5 11576.6 2154.2 19260.2 1008.6河南 4226.8 1
8、354.5 163.3 114.7 10978.1 2215.5 11116 826.4湖北 5743.7 545.7 82 46.1 6760.8 1090.4 8801.5 492.6湖南 6873.7 518.3 142.6 130.7 5147.9 892 8447 829.4广东 5265.4 1263 108.3 39.8 10200.5 1300.6 6772.7 737.3续表 1-1 分地区按登记注册类型分全社会固定资产投资(2015 年) 计量单位:亿元广西 3954.4 194.8 56.5 44.5 3421.5 591.8 5379.7 790.1海南 804.3 0
9、.8 16.7 5.1 1571.1 271.8 315.9 97.1重庆 4512.5 89.6 160.1 15.8 3071.8 425.3 4073.3 172.7四川 8781.1 152 49.1 127.7 7553.6 991.1 5401.4 635.6贵州 5452.4 29.4 12.8 11.6 2698.2 266.3 1935 276.9云南 6046.4 453.8 22.1 37.8 3179 415.7 2461.2 510.2西藏 934.8 1.6 0 3.1 26.2 96.3 84.2 18.4陕西 7447.1 627.5 59.8 116.7 46
10、57.4 632.7 3465.9 396.8甘肃 3536 334 18.1 40.4 1683.8 258.6 1898.7 151.3青海 1797.6 15.4 6.3 2 627.2 101 487.9 75.9宁夏 1197.3 2.8 1.8 5.8 724.3 51.2 1400.1 81.8新疆 4895.3 30.8 43.2 31 2599.7 649.4 2039.5 304.9备注:以上表 1-1 指标数据根据 2015 年中国统计年鉴中 10-3 分地区按登记注册类型分全社会固定资产投资(2015 年)的一部分统计数据得到。(二)数据的分析本文依据固定资产投资对全国
11、(除港澳台)31个县区进行聚类分析,对表1-1统计数据,运用5SPSS软件对31个样本进行系统聚类操作。其中,样本与样本间距采用欧式平方距离,类与类间距离采用组间联结法,得到表1-2凝聚顺序表。表 1-2 凝聚顺序表群集组合 首次出现阶群集阶 群集 1 群集 2 系数 群集 1 群集 2 下一阶1 24 31 481951 0 0 62 4 22 1172950.4 0 0 103 29 30 1208051.33 0 0 94 2 8 1303209.79 0 0 75 9 21 1557965.48 0 0 116 24 25 1626656.01 1 0 137 2 7 1714230.
12、115 4 0 148 6 14 1767668.64 0 0 199 26 29 1785897.195 0 3 1110 4 20 3016644.89 2 0 1411 9 26 3081484.47 5 9 2012 12 17 3220776.19 0 0 15续表 1-2 凝聚顺序表13 5 24 4117276.940 0 6 1714 2 4 4961993.200 7 10 1815 12 18 5457570.015 12 0 2116 11 19 6854451.610 0 0 2417 5 28 7576139.505 13 0 1818 2 5 9219482.378
13、 14 17 25619 6 13 10692684.850 8 0 2320 1 9 12328562.868 0 11 2521 3 12 12959383.640 0 15 2322 23 27 14624164.680 0 0 2723 3 6 19314863.585 21 19 2424 3 11 22510411.506 23 16 2725 1 2 22623291.006 20 18 2926 10 15 29249782.820 0 0 3027 3 23 34909485.638 24 22 2828 3 16 59013658.229 27 0 2929 1 3 763
14、41798.482 25 28 3030 1 10 324679041.276 29 26 0表 1-2 反映了每一阶段聚类的结果,表中详细的描述了聚合的类,聚合系数与每阶段聚合的步骤。聚类表显示各类之间的距离,第 1 阶段样品 24 和样品 31 聚为一类,跳转到第 6 阶段,第6 阶段样品 25(陈仓区)与小类 24 聚为一类(此时的小类 24 为第 1 阶段的样品 24 与样品 31),跳转到第 13 阶段,以此类推,最后所有样品聚为一类。0 5 10 15 20 25 30 35050000000100000000150000000200000000250000000300000000
15、350000000分 类 数聚类系数图1-1 聚合图7图1-1是聚合系数随分类数变化的曲线,由图可以看出,当分类数为3类时,曲线变得比较平缓,故将全国各省市及直辖市(除港澳台)分为3大类。图1-2 树状图从图1-2树状图中我们可以由分类个数得到分类情况。因为我们已将全国各省市及直辖市(除港澳台)分为3大类,因此分类数为,所以从距离大概为4的地方往下切,得到分类结果如下。8第一类区域24,31,25,5,28,2,8,7,4,22,20,9,21,29,30,26,1第二类区域23,27,11,19,6,14,13,12,17,18,3,16第三类区域10,15图1-3 冰柱图图 1-3 是冰柱图。本文将样品共分为 3 大类,从图的最左边群集数(类数)选择 3,每个样品右边都有阴影部分表示,如果样品右边的阴影长度少于 3,那么它就和前面多于 3 的样品聚为一类,如此下去,直到找到全部 3 类为止。三、结论第一类地区:贵州,新疆,云南,内蒙古,甘肃,天津,黑龙江,吉林,山西,重庆,广西,上海,海南,青海,宁夏,西藏,北京。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。