1、 课 程 设 计 论 文应用多元统计方法对部分省市经济发展的研究The Research of College Students Gradesby Multivariate Statistical Method学 院:理学院专 业:应用统计学姓 名:徐茂发 指导教师:周兰锁职 称:讲 师论文提交日期:二 一七年五月摘 要随着时代的发展和社会的进步,人们对人力资源的开发越来越重视,用人单位在跳远人才时,对应聘者的科学文化水平和知识结构要求越来越高,特别是随着高等教育的迅速发展、招生规模的不断扩大,知识的快速更新,对生源结构和教师结构都产生了很大的影响。作为人才培养的高地,高等学校如何提高教学质量
2、,为社会培养有用的高级人才,一直是教育界研究的重要课题。本文抽取 2013 级理学院统计学专业一班 36 名学生和 2012 级理学院统计学专业一班 28 名学生的大二学年成绩作为样本,运用聚类分析,因子分析的多元统计方法以及采用 SPSS19.0 分析软件对数据进行定量的分析。首先采用了统计方法对原始数据进行了预处理,采用聚类分析方法把学生分为四大类,然后用因子分析方法把繁多的课程总结成两大主因子,给出了因子得分模型。通过分析研究,我们得出,学生的总成绩高低并不能反映学生能力的大小,通过权衡各科比重,得到学生综合成绩,才能反映学生真正学习能力。而且通过因子分析,也可以看出学生比较薄弱的科目,
3、也对今后教学给出了侧重点。关键词:多元统计 聚类分析 因子分析 The Research of College Students Gradesby Multivariate Statistical MethodAbstractWith the development of the times and social progress, people pay more and more attention to the development of human resources, the employing units in the selection of personnel, which r
4、equests applicant more and more high level in the scientific and cultural level and knowledge structure. Especially with the rapid development of high education, expanding enrollment and rapid updating of knowledge which bad a great influence on students and teacher structure. As training ground, ha
5、s always been an important research subject in the educational circles, for how to improve the teaching quality of higher education and the training of high-level personnel useful to society.This paper bases on the grades of the 36 students from class one of 2013 professional faculty of science stat
6、istics and the grades of the 28 students from class one of 2012 professional faculty of science statistics. It applies cluster analysis, multivariate statistical methods of factor analysis and SPSS19.0 analysis software for quantitative analysis of the data. First, it adapts the original data to get
7、 grade point pretreatment and uses cluster analysis method to divide the students into 4 parts. Then, it uses factor analysis method to divide the wide range of courses into 2 parts, which gives the factor score model. Finally, it uses statistical analysis methods to have strengths and weaknesses of
8、 students grades on the courses. This can help to promote teachers targeted teaching and improve the quality of the courses.Key words: Multivariate statistics; Cluster analysis; Factor statistical; SPSS19.0目 录1 引言 .11.1 概述 .11.2 研究背景与意义 .11.3 国内研究现状 .11.4 数据来源 .21.5 数据的预处理 .22 聚类分析 .22.1 聚类分析的基本思想 .
9、22.2 聚类分析结果 .33 因子分析 .43.1 因子分析法的数学模型 .43.2 因子分析法的基本步骤 .64.3 因子分析的应用 .64.3.1 KMO 检验 .64.3.2 因子陡坡检查,除去坡线平坦部分的因子 .74.3.3 方差贡献率检验 .74.3.4 显示未旋转的因子矩阵 .84.3.5 因子旋转 正交旋转 .94.3.6 因子得分系数矩阵 .104.3.7 综合得分指标函数 .104.3.8 综合排名的比较 .105 统计方法的应用 .135.1 学生成绩的比较 性别对学生成绩的影响 .135.1.1 独立样本 T 检验 .136 总结 .14致谢.15参考文献.16附录.
10、17插图和附表清单 表 1 必修课程名称 .2表 2 KMO 检验与 Bartlett 球形检验 .6表 3 因子分析共同度 .6表 4 因子方差分析的总解释 .7表 5 未旋转后因子载荷矩阵 .8表 6 旋转后因子载荷矩阵 .9表 7 因子结构 .9表 8 因子得分系数矩阵 .10表 9 综合得分及排名 .11表 10 综合排名及总分排名比较 .12表 11 独立样本 T 检验 .13表 12 男女学生成绩情况 .14图 1 聚类分析图 .3图 2 碎石图 .7内蒙古农业大学课程设计论文 11 引言1.1 概述多元统计分析的理论是最近发展起来的理论学科,人们对它的研究还很不善有很多新的统计分
11、析方法还没有得到人们的重视,虽然有的统计方法在理论上得到认可,但是在实际应用中不是很广泛.多元统计分析在经济、金融、医药等领域应用比较广泛,但是在教育教学上的应用却受到了限制.尤其是一些普通教师没有真正认识到它的有用性,这种想法是不可取的.多元统计分析在教育领域没有得到很好的应用,主要原因是进行教育教学研究的学者对统计理论掌握的不深,不知道统计结果在教育教学上说明什么;另一方面,对数据有一种恐惧感,尤其是对大量的原始数据不会处理;再就是对计算机的使用有一定的障碍,即不会使用统计软件等。基于以上原因,本文就是想利用多元统计分析软件SPSS,对所涉及到的高等院校的各个领域进行探讨,每个领域都要用到
12、多元统计分析方法对数据进行处理,通过统计分析得到的结论去指导学生成绩的评价,同时也给老师和职能部门进行决策提供理论依据。1.2 研究背景与意义学生的个性特征和群体分类特征是学生管理工作中非常重要的信息,尤其是毕业生,需要对他们做出综合评价,以向用人单位提供学生的各方面特征信息。目前,对学生综合评价的一般模型主要有平均分模型、平均学分积模型等。另外,多元统计分析中的聚类分析、因子分析等也是很好的综合评价方法,但大多数大学或院系都是用前两种模型即平均成绩、平均学分积模型作为评价学生的定量依据。用这两种方法比较简单,但有缺点,掩盖了学生的个性,不能反映学生各方面的特点,也反映不出学生的专业能力,对学
13、生作全面的综合评价来说不是很理想。因此,本文着重突出因子分析方法,力求通过成绩给学生一个相对完美的评价。目前对大学生成绩评定方法的研究取得了很大的进展,主要成果有: 比例制、考查制、学分制、德育考评制度等。大学生四年学习成绩是大学四年学习生活的记录,这些记录基本反映了该生四年的学习情况,但在高校学生管理中,经常需要从各方面评价学生的成绩,如评奖学金、向用人单位推荐分配学生等,都需要从各方面评价学生成绩,多元统计分析方法已有应用。1.3 国内研究现状多元统计分析已广泛地应用到社会科学和自然科学的许多领域中。特别是在经济、金融、医药等领域应用比较广泛,但是关于多元统计分析在高校教学中的应用,前人作
14、了很多工作.但是他们所阐述的都是具体针对某一方面的应用,只解决了某一方面的问题,在利用多元统计方法上也受到了某种局限性,大部分文献所利用的多元统计方法都是单一的,没有多种方法结合起来应用,使得在研究过程中得出的结论2 应用多元统计方法研究大学生成绩说理性不强;在进行统计分析时所利用的统计软件版本比较老,给分析带来了限制,如果用最新版本的软件可能得到更多的统计信息;文献中所得到的分析结果没有得到很好的解释和说明.另外,文献中出现了两个极端,一但是在教育教学上的应用却受到了一定的限制。尤其是一些普通高校教师在教学管理上很少应用,以至于影响了他们的工作效率。利用社会科学统计软件包SPSS,对高等师范
15、院校教师所涉及到的各个领域进行探讨,能使高校教师的教学工作有的放矢。成绩作为考试的结果,不仅是对学生学业和教师教学效果的检验和评定,具有激励学生学习及教师工作,更是一种信息,具有反馈教学活动、服务于教育决策、为教育科研提供资料等作用。为充分发挥考试的效能,综合评价考试质量,及时反馈教学效果,沟通教学信息,教学部门对考试成绩进行统计分析和总结是非常必要的。1.4 数据来源以内蒙古农业大学理学院 2013 级应用统计学专业的 36 名学生和 2012 级理学院统计学专业一班 28 名学生大二两学期的期末考试成绩为样本,将 64 名同学看做是 64个观测值,按照他们的学号将 2013 级学生依次编号
16、为 1,2,3,36;将2012 级学生依次编号为 37,38,39,64。将这 10 门课程看做是 10 个指标,下图表 1 就给出了这一学期的 10 门课程。 表 1 必修课程名称Table1 The title of required courseX1 数学分析 X2 概率论 X3 数理统计X4 常微分方程X7 马克思主义原理X10 大学英语 4X5 抽样调查X8 毛泽东思想和中国特色社会主义理论体系概论X6 应用随机过程X9 大学英语 31.5 数据的预处理虽然每门课程的成绩都为学生在大学里的表现提供了一定的信息,但各门课程的学分不一样,其重要性不一样,为了减少误差,我们将每门课程的学
17、分在总学分中所占的比重作为课程重要性的衡量标准,在用统计方法对成绩分析之前,先要对原始数据进行预处理,将每门课程的成绩乘以该课程在总课程中的比重,表达式为 *1,264;1,20jijijwXijY 上式中 表示第 名同学的第 门课程的原始成绩, 表示第 门课程的学分,ijX jwj表示总学分, 为预处理后的成绩。下面先应用聚类分析将学生的学习成绩做一Yij个大致分类,看看整体的状况,然后应用因子分析给出学生成绩的综合评价模型 1。内蒙古农业大学课程设计论文 32 聚类分析2.1 聚类分析的基本思想聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结
18、构,并且对每一个数据集进行描述的过程。其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似。聚类分析根据分类对象的不同可划分为 型聚类分析和 型聚类分析。 型RQR聚类是指对变量进行聚类, 型聚类是指对样本进行聚类;根据处理方法的不同又Q分为:系统聚类法、图论聚类法、有序样品聚类法、动态聚类法、模糊聚类法等等 2。2.2 聚类分析结果通过 SPSS19.0 对学生成绩进行聚类分析,距离采用欧式距离,类间距采用平均距离,结果如下表所示:图 1 聚类分析图Fig.1 Dendrogram4 应用多元统计方法研究大学生成绩如图所示,把研究对象分为了四大类:第一类:3,3
19、5,7,11,20,24,27,5,4,23,49,61,40,46,44,28,59,42,53,16,19,18,36,6,21,41第二类:25,34,15,26,1,57,60,48,64,56,31,55,10,13,47,30,22,62,2,8,50,9,32,12,39,51,38,43,52,37,58,45,54第三类:14,33,17,29第四类:63由此可知:第一类学生成绩优秀,第二类学生成绩良好,第三类学生的成绩为合格,第四类学生的成绩为不合格。从分类结果看出,统计学专业的学生在这一学年的成绩整体相当不错,仅有一位同学的成绩不合格,与实际情况一致。3 因子分析3.1
20、因子分析法的数学模型假设有 个样品,每个样品有个指标,这 个指标之间有较强的相关性。为了np便于研究,并消除由于观测量纲的差异及数量级不同所千万的影响,将样本观测数据进行标准化处理,合标准化后的变量均值为 0,方差为 1。为方便,把原始变量及标准化后的变量向量均用 X 表示,用 表示标准化的公共因子。12,()mF如果:(1) 是可观测随机向量,其均值向量 E(X)=0,协方差12p(,),矩阵 cov(X)=,且协方差矩阵与相关阵列 R 相等;(2) 12(,)(mF 是不可观测的变量,其均值向量 E(F)=0,协方差矩阵 cov(F)=I,即向量 F 的各分量是相互独立的;(3) 12(,)p与 F 相互独立,且 E( )=0, 的协方差阵 是对角方阵 2120cov()0pE即 的各分量之间也是相互独立的,则模型