1、1简析多元统计在水资源利用方面的应用摘要:随着社会的发展与进步,重视多元统计在水资源利用方面的应用对于现实生活中具有重要的意义。本文主要介绍多元统计在水资源利用方面的应用的有关内容。 关键词多元统计;水资源;数据;应用; 中图分类号:C811 文献标识码:A 文章编号: 引言 我国是贫水国家,虽然水资源总量丰富,但人均占有量很低。21 世纪将是我国经济高速发展时期,水资源短缺,固然有其自然的原因,也与气候变化有关,但人为的浪费,用水不合理也是很重要的因素。本文运用多元统计方法,选取一些具有代表性的指标,对全国 30 个省市自治区的水的利用状况进行了综合分析,希望为各地区合理、优化、节约用水提供
2、一些科学依据。 一、多元统计分析及其意义 多元统计分析是数理统计学 30 多年来迅速发展起来的一个分支随着计算机的普及, 各种统计软件不断推出, 多元统计分析方法已广泛应用到教育管理的各个领域。多元统计分析是运用数理统计的方法来研究多变量问题的理论和方法, 它是一元统计学的推广在许多教育问题中, 教育现象涉及到的变量不是一个, 而是多个变量, 且这些变量间又存在一2定的联系, 需要处理多个变量的观测数据, 如果用一元统计方法就要对多方面分别进行分析, 而一次分析一个方面, 同时忽视了各方面之间存在的相关性, 这样会丢失很多信息, 分析的结果不能客观全面地反映情况。 多元统计分析能够使复杂的指标
3、简单化, 每个事物现象都表现为多个方面, 需要有多个指标来描述、刻画事物的质和量, 这些构成指标体系的多个指标各有侧重地解释着同一个事物的质, 必然存在着多重共线性, 为了将这些指标反映的内容综合起来, 寻找一个简单综合指标, 多元统计分析能帮助在不损失信息的情况下, 通过变换和构造模型, 剔除指标间相互制约的成分, 使复杂数据简单化. 比如, 主成分分析、因子分析以及对应分析等多元统计分析方法就是这一类方法。 二、数据来源与指标选取 由于各地受人口密度,经济结构,作物组成,节水水平,水资源条件等多种因素的相互影响,用水指标值有很大差别。本文引用的数据摘自文献1中具有代表性的 5 个方面的 i
4、o 个指标。(原始数据略)。 (1)工业方面:x6万元工业增加值用水量(m3)fx8工业年用水量(亿 m3); (2)农业方面:x9农业年用水量(亿 m3); (3)生活方面:x2人均用水量(m3) , x4 城镇生活人均生活用水量(L/d ) , xs农村居民人均生活用水量(L/d ) , x,生活年用水量(亿 (4)环境方面:二, 。生态年用水量(亿 m3); (5)经济方面:x,人均国内生产总值(万元)xs万元国内生产总值3用水量(m3)。 三、多元统计分析 3. 1 聚类分析 聚类分析的内容非常丰富,本文采用 Q 型的系统聚类法进行分析。由于数据存在量纲和数量级的差别,在聚类之前先进行
5、标准化处理,计算样品之间的距离采用欧氏距离的平方,类与类之间的距离采用类平均法(具体过程利用 SPSS12 在计算机上完成,结果见图 1) 系统聚类的结果能够给出 n 个样品自成一类到全部样品聚为一类,这个过程中所有结果都有,根据我国区域划分和图 1 可知,根据在水资源利用方面的 10 个指标,可将全国 30 个省市划分为三类较好,具体为: 第 1 类:北京,天津,河北,辽宁,上海,江苏,浙江,福建,山东,广东,黑龙江; 第 2 类:山西,吉林,安徽,江西,河南,湖北,湖南,广西,海南,重庆,四川,贵州,云南,陕西,甘肃,青海; 第 3 类:内蒙古,宁夏,新疆。 从三类来看,水供应量最少的是新
6、疆等西部偏远地区,其次是广大的中部地区,水资源消耗量最大的是东部发达地区。上述分类是否合理,下面将运用判别分析的方法进行检验。 3. 2 判别分析 判别分析是已知研究对象分成若干类型,并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别方程,然后将4样品的属性代人判别方程,对样品进行判别分类。 判别分析的类型很多,本文运用应用比较广泛,对分布、方差没有什么要求的费歇尔(Fisher)判别(又称典型判别)方法(本例采用 SPSS12软件)对上述聚类分析的情况做判别,其具体步骤如下。 (1)计算类内离差平方和阵甲和类间离差平方和阵 B。 (2)给出 W-1B 的特征根(即典型判
7、别方程的特征值)以及方差贡献率(见表 1);特征根数取变量数及类别减 1 中的较小值,本例为 3 类,变量数 10,因此特征根个数为 2,其中第一个特征根为 3. 4,方差贡献率为53.5%,能够解释所有信息的”. 50k ,而这二个特征根累计方差贡献率100%,说明这两个典型方程能反映所有原始信息。 (3)计算 W-1B 的 2 个特征根所对应的特征向量,即得出两个典型判别方程对应的系数(见表 2),由表 2 得 由此可计算出各地区的两判别因子得分(见表 3)。 (4)判别方程的有效性检验。建立的判别方程是否显著,即对下面的识别样品归类的准确性如何,是否可信,需要检验。维尔克斯统计量表达为:
8、类内离差平方和矩阵的行列式与总离差平方和矩阵行列式的比值。从表 4 可得,相伴概率均为 0,远远小于置信水平 0. O1,从而得两个判别方程的判别能力都很显著。 5(5)样品判别归类。由两个显著的判别方程构成一个判别空间,将样品数据代人 2 个判别方程进行计算,各类的判别方程取值在该 2 维空间中构成 3 组点集群,每组点集群都有一个重心点,对应的向量分别是:Y1=(0. 645 , 2. 056 ) ;Y2=(一 1. 287 ,一 0. 942 );Y3=( 4. 5,一 2. 516 )。样品判别归类时,将待判样品点代人 2 个判别方程,得 2 个判别值,可将之看作 2 维空间中的一个点
9、,例如以第一个样品北京作为待判样品,则对应的向量为 y1=( 0. 521,2. 784 ),考察样品点北京与各类重心欧氏距离的平方,距离平方分别为 由此得北京到第 1 类的重心距离最短,所以北京判归到第 1 类。所有样品的判归结果见表 3。 (6)对判别效果作检验。如果各个总体的均值向量在统计上没有显著差异,作判别分析意义不大。所以下面对均值向量做检验。 带入数据,得: 所以三组均值有显著差异,即说明上述判别分析有效,也即检验了聚类分析的结果是合理的。 结束语 (1)图 1 中的序号 5 样品内蒙古,聚类分析为第 3 类,而判别分析为6第 1 类,这与上面采取的方法有关,也与内蒙古的数据有关
10、,其数据介于 1 类和 3 类之间,差别不显著。 (2)从图 1 的分类结果可以看出,第 1 类几乎全是沿海或东部的经济发达省市,水供应充足,人口稠密,高科技产业和服务业较发达,用水较合理,投资环境最好,文化水平也较发达;而第 3 类均为偏远地区,水供应量严重不足,人口稀疏,气候干燥,经济、文化发展也比较落后,投资环境最差的省市;中部 16 个省级行政区大多以重工业为主,经济、文化处于中等水平,水消耗量也较大,有一定的节水空间。这些分析统计与实际情况基本一致,所以从这些分析可以得到,一个地区首先要保证水资源供应充足,利用合理,投资环境才可能好,从而才能吸引更多外资,最终经济、文化才能较快发展,人民生活水平得到较大提高。 参考文献 1中华人民共和国水利部,中国水资源公报M.北京:中国水利水电出版社,2011. 2张尧庭,方开泰.多元统什分析引论M.北京:科学出版社,2002. 3章文波,陈红艳.实用数据统计分析及 SPSS 12. 0 应用M.北京:人民邮电出版社,2006. 4李世奇,杜惫琴.Maple 计算机代数系统应用及程序设计M.重庆:重庆大学出版社.,2009
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。