1、1关于我国各地区工业废气排放情况的研究摘 要:本文以中国 2009 年各地区工业废气排放的情况为研究对象,首先根据各地区工业废气排放的情况进行分类,将要研究的复杂问题简单化,接着运用贝叶斯判别分析法将待判的几个地区分到已知类中,而后运用降维的思想将影响各地区工业废气排放的多个指标转化为少数几个综合指标,进而分析我国工业废气排放的主要原因。 关键词:废气排放 聚类分析 判别分析 主成分分析 降维 本文主要研究 2009 年我国各地区工业废气排放的情况,采用多元统计中的聚类分析法、贝叶斯判别分析法、主成分分析法将要研究的复杂问题简单化,将多个指标转化为少数几个综合指标,进而分析我国工业废气排放的主
2、要原因。 一、使用系统聚类法对各大中城市进行分类与结论 各地区工业废气排放量是反映一定时期内工业废气排放量变动趋势和程度的相对数,包括工业二氧化硫排放量、工业烟尘排放量、工业粉尘排放量、工业二氧化硫去除量、工业烟尘去除量、工业粉尘去除量。我们将要研究的是这六个指标下 15 个地区(北京、天津、贵阳、西宁、重庆、太原、南京、杭州、济南、石家庄、呼和浩特、哈尔滨、郑州、武汉、长沙)废气排放情况的问题,对这个问题进行系统聚类,其中样品间距离采用欧氏距离,类间距离的度量分别采用离差平方和法和最长距离法做聚类图。输出结果。 2数据来源:2010 中国统计年鉴,中华人民共和国国家统计局网站:http:/
3、按离差平方和法,由图我们可以将 15 个地区进行系统聚类: 第一类:北京、天津、太原、南京、杭州、济南;第二类:石家庄、呼和浩特、哈尔滨、郑州、武汉、贵阳、西宁;第三类:重庆;第四类:长沙。 数据来源:2010 中国统计年鉴,中华人民共和国国家统计局网站:http:/ 按最长距离法,由图我们可以将 15 个大中城市进行系统聚类: 第一类:北京、天津、太原、南京、杭州、济南;第二类:石家庄、呼和浩特、哈尔滨、郑州、武汉、贵阳、西宁;第三类:重庆;第四类:长沙。 由聚类图不难看出两种分类方法分析结果是完全一致的。 从聚类图上我们可以把我国 15 个地区工业废气排放情况分成四类: 第一种类型,这些地
4、区都是国家重点工业建设经济区域,工业技术先进,也是最近几年我国工业经济发展速度最快的地区,尤其北京是我国首都,发展尤为重要,而太原主要有煤炭事业; 第二种类型,这些地区都是正处于发展建设中,工业经济发展处于稳步建设中,与北京等地相比显然不属于同一类型; 第三种类型,重庆属于老工业基地,现在又走新型工业化建设道路,故与上面的两种类型都有所区别; 第四种类型,长沙属于新型工业建设基地,坚持走新型工业化道路,3与上面三种类型显然不能化为同一类。 二、使用判别分析对未知分类地区进行分类与结论 现从未分类的地区中选出 6 个地区:沈阳、合肥、广州、成都、西安、乌鲁木齐进行判别分析,分析它们属于哪一类型。
5、假设他们都属于第一类,现调用 SAS9.1 统计软件进行贝叶斯判别分析,分析结果。 数据来源:2010 中国统计年鉴,中华人民共和国国家统计局网站:http:/ 从分类看出,只有广州属于第一类,其余地区划分为第二类。 广州是全国重要的工业基地,华南地区的综合性工业制造中心,属于我国经济发达地区,因此,应归为第一类。沈阳、合肥、广州、成都、西安这些地方,工业经济处于稳步建设中,与第二类的各个地区的经济发展相似,所以应归为第二类。而乌鲁木齐重点发展油气加工及化学工业,废气排放的状况和第二类的各地区也应属于同一类别。 三、使用主成分分析各地区工业废气排放情况与结论 对我国各地区废气排放情况进行统计分
6、析,选出六个影响指标中较重要的作为主成分。 工业二氧化硫排放量; 工业烟尘排放量; 工业粉尘排放量; 工业二氧化硫去除量; 工业烟尘去除量; 工业粉尘去除量。 这些指标基本可以反映我国各地区废气排放情况,再用 SAS 软件中的主成分分析对 X1 X6 进行主成分分析。分析的结果。 在上述第一表达式中, X1 的系数最大,表明第一主成分值大时工业二氧化硫排放量较大,因此可以把第一主成分称为二氧化硫排放因子;4在第二表达式中, X3,X5 的系数最大,说明第二个主成分值越大时,工业粉尘排放量、工业烟尘去除量越大,因此可以把第二主成分称为工业粉尘排放因子;在第三表达式中, X6 的系数最大,说明第三
7、个主成分值越大时工业粉尘去除量越大,因此可以把第三主成分称为工业粉尘去除因子;在第四表达式中, X2,X4 的系数最大,说明第四个主成分值越大时工业烟尘排放量、工业二氧化硫去除量越大,因此可以把第四主成分称为工业烟尘排放因子。由以上讨论可知,4 个变量可分为 4 类:X1,X3,X5, X6,X2,X4 。 数据来源:2010 中国统计年鉴,中华人民共和国国家统计局网站:http:/ 由前两个主成分的散点图可知,我国各地区废气排放情况是居中的占大部分,偏高或偏低的占小部分。 在影响各地区废气排放情况的六个指数中,最重要的指数是工业二氧化硫排放量,它是造成废气排放最主要的因素,像北京等一线地区,
8、工业技术快速发展,在发展工业经济建设的同时燃烧掉大量的燃料,释放出各种污染大气的气体,二氧化硫就是主要的污染物之一。而到目前为止北方地区获取能源的主要供给为煤炭,大量的煤炭在燃烧的过程中就会释放出过量的污染气体、固体颗粒,致使二氧化硫的含量在废气排放中所占的比例越来越重。 参考文献: 1 盛来运.中国统计年鉴M.中国统计出版社,2010. 2 裴喜春.SAS 及应用(第二版)J.北京:中国农业出版社,52007(7). 3 任雪松, 于秀林.多元统计分析J.北京:中国统计出版社,2007(7). 4 王静龙,梁小筠.参数统计分析J.北京:高等教育出版社,200(4). 5 杨启帆,康徐升,赵雅图.数学建模J.北京:高等教育出版社,2008(5). 6 Dallase Johnson,Applied Multivariate Methods for Data AnalysisJ.Beijing:Higher Education Press, 2005(5). (责任编辑:康伟)