1、差异显著性分析摘要 本文通过差异显著性分析解决了两专业的每门课程和数学水平是否有明显差异问题,通过 Pearson 相关系数解决了高等代数分别与线性代数,概率论和数理统计得分是否有相关的问题。关键词 t-检验 Pearson 相关系数问题重述 下述 2 个表格是工科甲乙两个专业的高等数学上册、高等数学下册、线性代数、概率论等数学课程的成绩数据,请根据数据分析并回答以下问题: (1)针对每门课程分析,两个专业的分数是否有明显差异? (2)针对专业分析,两个专业学生的数学水平有无明显差异? (3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况? (4)根据以上分析,面向工科同学,
2、撰文阐述你对于大学数学课程学习的看法。表 1 甲专业四个班的各科成绩甲专业 1 班 甲专业 2 班 甲专业 3 班 甲专业 4 班学号 高数高数线代概率高数高数线代概率高数高数线代概率高数高数线代概率1 70 63 63 66 85 66 70 96 93 76 87 87 66 70 79 852 62 65 68 77 60 46 0 86 60 60 60 64 69 65 76 803 61 61 75 63 76 73 60 89 90 75 67 73 77 66 85 854 60 66 74 69 78 60 72 67 93 89 89 97 70 63 73 735 71
3、69 79 65 60 64 64 76 74 83 82 81 84 76 73 906 86 81 80 90 94 93 75 90 80 62 73 65 88 65 83 957 37 60 65 65 37 60 78 83 71 80 93 78 75 64 77 808 69 63 68 71 62 60 71 61 74 65 71 72 65 83 82 609 60 64 60 60 90 74 90 95 69 76 64 70 72 79 79 8510 85 60 0 62 61 73 80 68 70 64 65 70 60 61 63 8211 86 73 85
4、 69 45 64 63 90 85 71 68 78 73 71 63 6812 88 81 80 89 80 62 70 61 93 66 69 86 95 78 67 7413 74 65 89 81 67 62 76 96 80 76 74 84 75 72 68 8814 87 66 86 84 60 60 45 63 83 88 87 76 60 71 67 6415 91 81 83 87 69 80 68 83 60 87 63 55 74 65 72 7616 75 75 63 78 79 71 86 91 94 83 87 96 68 77 80 8217 82 96 86
5、 90 85 65 82 93 65 60 79 72 60 82 88 9518 93 93 98 97 87 88 89 97 83 72 60 51 60 63 78 7019 65 81 82 93 77 66 77 85 89 66 67 76 82 84 87 9320 79 76 82 80 60 63 65 60 65 60 60 60 60 67 63 6921 38 64 60 52 65 69 74 74 74 66 73 83 0 64 67 8122 90 63 60 24 79 64 72 47 62 85 60 62 61 61 80 6223 66 74 66
6、65 78 77 82 81 79 90 60 83 69 64 83 9024 433 64 63 60 64 62 66 89 87 75 51 49 60 69 39 3125 90 62 60 66 86 89 90 94 93 83 80 90 0 84 66 6126 72 60 72 68 67 82 74 78 88 78 75 74 60 70 67 6927 43 60 60 72 64 60 82 69 76 82 81 92 67 60 60 6228 82 66 74 77 60 49 60 61 69 69 66 88 85 76 66 8929 60 81 60
7、65 81 60 86 80 76 60 83 69 60 62 60 6530 87 89 83 90 60 49 60 61 79 60 69 67 65 82 60 6031 92 72 69 77 72 75 81 79 77 62 60 76 83 63 75 7632 86 49 61 70 74 60 60 79 40 80 46 22 74 74 82 7033 79 69 60 60 63 66 86 80 79 60 82 81 60 63 77 6434 60 61 67 73 94 80 93 96 90 94 95 96 68 74 60 8135 60 62 70
8、66 91 77 71 84 65 77 78 83 74 64 63 8736 72 63 65 65 60 70 60 78 73 69 85 90 60 73 73 3937 64 60 74 67 60 40 0 73 65 87 74 8438 70 78 60 87 81 64 60 72 64 72 77 6039 60 66 65 88 61 87 60 6540 60 64 60 70表 2 乙专业三个班的各科成绩乙专业 1 班 乙专业 2 班 乙专业 3 班学号 高数高数线代概率高数高数线代概率高数高数线代概率1 82 0 50 63 69 74 85 96 79 81 8
9、9 932 60 66 68 73 65 62 71 84 80 66 78 743 76 76 60 82 60 64 60 71 60 64 65 694 60 61 77 73 64 74 76 80 87 64 73 855 66 64 69 83 85 72 84 89 73 82 84 896 69 65 67 63 66 72 89 93 100 85 95 977 77 65 71 72 71 65 82 88 94 88 97 968 66 75 60 63 75 64 68 69 66 70 69 469 72 60 67 66 60 65 61 67 65 60 70 7
10、310 60 64 60 75 78 64 82 83 92 97 70 7011 60 60 60 36 66 69 81 81 62 66 65 6012 76 69 63 89 85 91 93 81 92 77 72 9413 64 66 77 85 45 60 68 60 67 62 70 7714 80 65 83 75 64 69 66 66 84 64 76 8115 63 64 81 72 60 64 70 71 71 60 77 6816 60 42 66 62 64 60 68 60 60 69 63 8917 73 82 91 88 64 60 64 82 76 60
11、70 7018 86 78 62 60 60 62 60 60 60 61 62 7119 62 64 69 84 74 62 61 61 86 62 60 7220 85 65 88 80 60 73 65 72 61 60 60 6721 61 62 63 81 63 65 71 60 87 70 79 8622 61 37 41 64 44 73 70 82 93 95 100 9623 67 62 76 73 78 66 80 85 62 84 73 8024 60 40 50 60 78 66 64 66 75 64 73 8025 60 66 60 83 60 64 72 84 6
12、0 49 60 3526 60 40 60 68 60 62 76 77 88 79 65 6227 64 46 74 69 60 65 73 67 95 86 95 8628 90 84 93 92 71 69 80 63 83 44 60 8129 43 39 50 69 60 61 60 87 60 71 69 8030 67 62 60 83 86 73 83 84 91 78 75 8031 88 75 65 82 60 63 60 77 63 61 91 8832 86 75 69 65 60 64 61 66 92 87 94 9533 73 40 60 60 0 0 0 0 6
13、0 64 71 6534 43 65 60 60 60 69 60 60 73 66 72 9235 73 66 60 85 60 76 60 6936 60 63 81 77 61 60 71 8637 65 74 68 7738 78 81 65 753940模型假设 1、甲专业中有一个数大于 100 分,由于是百分制,所以将此数换成 0.2、因为每一科的分数总体多数都是处在中间 60 分左右,不会高分的占多数也不会是低分的占多数,所以样本可以看作是来自正态或近似正态总体。模型建立1、对问题(1)用 T 检验来判定两个专业每一科的平均值的差异是否显著,因为 T 检验就是用于小样本,总体标准
14、差 未知的正态分布资料,是用于小样本的两个平均值差异程度的检验方法。它是用 T 分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。1.建立假设、确定检验水准 H0: = 0 =60(无效假设,) H1:(备择假设) 双侧检验,检验水准:=0.05 2.计算检验统计量 ,v=n-1 3.查相应界值表,确定 P 值,下结论2、问题(2)也是用 T 检验来判定两专业的数学水平的均值的差异是否显著,方法与问题(1)一样。只是针对对象不同3、问题(3)用 Pearson 相关系数来分别判断线性代数,概率论和数理统计得分是否与高等代数的优劣相关。Pearson 相关系数是用来反映两个变量线性
15、相关程度的统计量。相关系数用 r 表示,其中 n 为样本r 描述的是两个变量间线性相关强弱的程度。r 的绝对值越大,表明相关性越强。模型求解1、分别对高数 I,高数 II,线代,概率,用 T 检验对两个专业样本求出它们的 P 值,若 P 值小于 0.10,则差异显著,因为 P(高数 I)=0.362586,P(高数 II)=0.003922,P(线代)=0.779552,P(概率)=0.718893.所以针对高数 II,两专业的差异显著。2、先对甲专业样本的每一科求均值,得出高数 I,高数 II,线代,概率的均值作为样本一,再对专业样本的每一科求均值,得出高数 I,高数 II,线代,概率的均值
16、作为样本二,用 T 检验对这两样本求出它们的 P 值,若若 P 值小于 0.10,则差异显著。因为 P(专业)=0.419651,所以两专业的数学水平差异不显著。3、对先求出每位学生两科高代上下册的平均值来当作是高代的分数,然后分别算出高代与线代 r1=0.552091,高代与概率论和高代与数理统计的 Pearson 相关系数r2=0.508041,若 r 的绝对值越大,表明相关性越强。4、从求解 3 就可以看出高代的优劣是会影响到线代和概率论和数理统计的得分情况的,所以可以知道一科学得不好是会影响到其他相关学科的,毕竟对于工科学生,大学里的大部分课程都是相互有贯通的,都是有联系的,一般地,一科可能是另一科的基础,只有在学好这科的前提下才能学好另一科。模型评价这个模型可以用于比较两个专业之间各科成绩和数学水平的优劣,以及各科之间的相关性。也可以推广到到其他领域,用来比较两组数据之间的差异显著性和两种变量之间的相关性。