心理统计学重点分析.doc_文客久久网wenke99.com

资源描述

1、1心理统计学重点分析一描述统计（一）统计图表1）统计图次数分布图：直方图：用以矩阵的面积表示连续性随即变量次数分布的图形。次数多边形图：一种表示连续性随机变量次数分布的线形图，属于次数分布图。累加次数分布图：分为：累加直方图和累加曲线图；其中累加曲线的形状大约有三种：一种是曲线的上枝长于下枝（正偏态），另一种是下枝长于上枝（负偏态），第三种是上枝，下枝长度相当（正态分布）。其他统计图：条形图：用于离散型数据资料；圆形图：用于间断性资料；线形图：更多用于连续性资料，凡预表示两个变量之间的函数关系，或描述某种现象在时间上的发展趋势，或一种现象随另一种现象变化的情况，用这种方法比较好。散点图：

2、2）统计表简单次数分布表分组次数分布表相对次数分布表：将次数分布表中各组的实际次数转化为相对次数，即用频数比率表示。累加次数分布表双列次数分布表：对有联系的两列变量用同一个表来表示其次数分布。（2）集中量数1）算术平均数 M1niiXN优点：反应灵敏；计算严密；计算简单；简明易解；适合于进一步用代数方法演算；较少受抽样变动的影响；缺点：受极端数据的影响；若出现模糊不清的数据时，无法计算平均数；计算和运用平均数的原则：同质性原则；平均数与个体数值相结合的原则；平均数与标准差。方差相结合原则；性质：在一组数据中每个变量与平均数之差的总和等于零在一组数据中，每一个数都加上一个常数 C，所得的平均数为

3、原来的平均数加常数 C在一组数据中，每一个数都乘以一个常数 C，所得的平均数为原来的平均数乘以常数 C2)中数：Md 按顺序排列在一起的一组数据中居于中间位置的数，即这组数据中，一般数据比它大，一般数据比它小。注意计算方法；3)众数：Mo 是指在次数分布中出现次数最多的那个数值；2三者的关系：正偏态分布中，MMdMo负偏态分布中，Mj 格中的择优分数。当完全一致时 U=1.当完全不一致时，U=-1/K(K 为奇数)U=-1/(K-1) (K 为偶数)4)点二列相关与二列相关（1）点二列相关适用于一列数据为等距或等比数据,而且其总体分布为正态，另一列为离散型二分称名变量。多用于评价是非类测验题组

4、成的测验的内部一致性等问题;pqbtXrs5是与二分称名变量的一个值对应的连续变量的平均数，是与二分称名变量的另一个pX qX值对应的连续变量的平均数，p 与 q 是二分称名变量两个值各自所占的比率，s t是连续变量的标准差（2）二列相关适用于两列变量都是正态等距变量，但其中一列变量被人为地分成两类。pqbtXrsy注: 两者之间的区别: 二分变量是否为正态分布,总的原则是,如果不是十分明确,观测数据的分布形态是否为正态分布,这是不管观测数据代表的是一个真正的二分变量还是基于正态分布的人为的二分变量,都用点二列相关;当确认数据分布形态为正态分布,都应选用二列相关;5) 相关适用于两个变量都是

5、只有两个点值或只表示某些质的属性。 adbcr d其中 a、b、c、d 分别为四格表中左上、右上、左下、右下的数据具体见卡方检验二推断统计（一）推断统计的数学基础（略）（2）参数估计1）点估计，区间估计，与标准误（1）一个良好估计量的标准：（1）无偏性：即用多个样本的统计量作为总体参数的估计值，其偏差的平均值为 0；例如，用样本平均数作为总体平均数的估计值，就是无偏性；因为无限多个样本平均数 X 与的偏差之和为零；但方差 S2 不是 2的无偏估计， 2 的无偏估计是：S 2n-1=x 2/（N-1）（2）有效性：当总体参数的无偏估计不止一个统计量时，无偏估计变异量小者有效性高，变异大者有效

6、性底，即方差越小越好；例如的估计量有Mo,Md,X 但是，只有 X 是变异量最小。（3）一致性：即当样本无限增大，估计值应能够越来越接近它所估计的总体参数，估计值越来越精确，逐渐接近于真值；即当 N，X ,S 2n-1 2;(4)充分性：指一个容量为 n 的样本统计量，是否充分地反映了全部 n 个数据所反映的总体信息。例如 X 能反映所有数据所代表的总体的信息，故 X 的充分性高；二 Mo，Md 只反映了部分数据所反映的总体信息，充分性低；（2）区间估计：区间估计的原理是根据样本分布理论，应样本分布的标准误计算区间长度，解释总体参数落入某置信区间可能的概率；2）总体平均数的估计63）标准差与

7、方差的估计（可以先算出方差的区间，再求标准差的区间）（3）假设检验1）假设检验的原理：（1）两类假设备则假设：因变量的变化、差异却是是由于自变量的作用往往是我们对研究结果的预期，用 H1表示。虚无假设：实际上什么也没有发生，我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用，用 H0表示。（2）小概率原理小概率原理：小概率事件在一次试验中几乎是不可能发生的。两类错误型错误：当虚无假设正确时，我们拒绝了它所犯的错误，也叫错误。型错误：当虚无假设是错误的时候，我们没有拒绝所犯的错误，也叫错误。两类检验的关系+ 不一定等于 1在其他条件不变的情况下，与不可能同时减小

8、或增大（4）检验的方向性单侧检验：强调某一方向的检验，显著性的百分等级为双侧检验：只强调差异不强调方向性的检验，显著性百分等级为 /22）样本与总体平均数差异的检验3）两样本平均数差异的检验4）方差齐性的检验：（1）样本方差与总体方差当从正态分布的总体中随机抽取容量为 n 的样本时，其样本方差与总体方差比值服从 2分布：由自由度查 2表，依据显著性水平判断20ns1df（2）两个样本方差之间独立样本其中当两样本自由度相差不大时可用代替查表时2sF大小 ns-1（双侧检验）12,1dfnf相关样本其中124strn2dfn5）相关系数的显著性检验积差相关a.当 =0 时：其中21r

9、tn2dfn7b.当 0 时：先通过查表将 r 和转化为费舍 Zr和 Z 然后进行 Z 检验。 13rZn（4）方差分析1）方差分析的原理与基本过程方差分析的基本假定(1) 总体正态分布，也就是要求样本必须来自正态分布的总体；（2）变异的相互独立性，总变异可以分解成为几个来源不同的部分，这几个部分的来源必须明确，而且彼此要相互独立；(3)各实验处理内的方差要一致，各实验处理内的方差彼此应无显著差异，这是方差分析中最为重要的基本假定。方差分析中的方差齐性检验:Fmax=S 2max/S2min (07 年考过大题) 2）完全随机设计的方差分析自由度计算： 1TBWdfNkfnk式中查表示的分子

10、与分母的自由度就是 dfB 和 dfw 的自由度；BMSF查 F 表时查单侧表注意利用样本统计两进行方差分析的例子3）随机区组设计的方差分析总差异组内差异组间差异个体差异随机误差自由度的计算：dfT=N-1;dfB=k-1dfw=dfR+dfE drR=n-1 ;dfE=(k-1)(n-1);注意 SSR 的公式4）事后检验为什么不能用 t 检验？会使错误的概率明显增加。使用的方法 N-K 检验法；HSD 检验法；详见甘怡群P135 和张厚粲P290；5）二因素分析（1）基本概念：一个 2*3 的两因素实验设计，A 因素有两个水平，B 因素有三个水平；当忽略 b 因素个水平的差异，只取

11、 A 因素的 A1 水平和 A2 水平计算方差时，得到 A 因素的8主效应；同理 B 因素的主效应；当一个因素的不同水平在另一个因素不同水平上的变化趋势不一致时，就产生了交互作用；(2)事后比较对二因素方差分析进行事后比较,其中主效应的检验与单因素方差分析原理相同,但是交互作用的事后比较,则包含事后整体检验和事后多重比较两种情况;第一,二因素方差分析主效应显著后,不一定要进行事后多重比较,进行事后多重比较的前提是有三个以上的水平; 第二,多因素交互效应显著后,对主效应必须进行事后比较;这里的多因素是指 3 个或三个以上的水平,由于不能确定是哪几个水平建有显著差异,因此必须进行事后比较;另外,对

12、主效应的进一步解释,需要通过多重比较分析;主效应的检验是在忽略其他因素的情况下检验一个因素的处理效应;第三,交互效应的事后比较,包括限定提条件的主效应的整体比较(单纯主效应比较,上面说到了),和达到显著性水平后,该限定条件的主效应的事后多重比较(了解) 注: 交互作用不显著,检验每个因素的主效应就很重要,但若交互作用显著,则对每个因素的主效应的检验,意义就不大了;另外,主效应的事后比较与主效应的检验是两回事;主效应的事后比较是指一个因素不同水平间(一般至少 3 个)确定到底哪几个间存在显著差异;主效应的检验,就和单因素的检验原理相同;（5）回归分析1）一元线性回归分析（1）最小二乘法：AYab

13、X其中：，2YabX（2）回归系数与相关系数的关系：r= yxyb（3）线性回归的基本假设：线性关系假设：X,Y 在总体上具有线性关系；正态性假设：Y 服从正态分布；独立性假设：有两个意思：一个是某一个 X 对应的一组 Y值和与另一个 X 对应的一组 Y 值之间没有关系，彼此独立；另一个就是，误差项独立，不同的 X 所产生的误差之间应相互独立，且与自变量也应独立；误差等分散性假设：特定 X 水平的误差，除了呈随机化的常态分布，其变异量也应相等，称为误差等分散性；2)一元线性回归方程的检验91）方差分析法 REMSF其中而其222T YSYn1Tdfn其A222R XbRf其ETRSSEdf

14、n（2）回归系数检验其中bt 2YXbsS而，它的意义是一个统计量，表示以为中心值上下波动的标A2XYsnAY准差（在知道相关系数时）21XYsr3）测定系数 TRSr22就是说相关系数的平房等于回归平方和在总平方和中所占的比例，如果说 =0.64，表明2r变异量 Y 的变异中有 64%是由变量 X 引起的，或者说有 64%可以由 X 的变异解释。所以叫做测定系数；2r4）一元线性回归方程的应用回归分析的目的，就是在测定自变量 X 与因变量 Y 的关系为显著相关后，借助于你和的较优回归模型来预测在自变量 X 为一定值时因变量 Y 的发展变化。当我们根据给出的 X值而预测得到点估计 Y

15、时，Y 只代表了预测值的中点，而计算在特定置信区间内的区间估计则依靠以下公式：根号部分当 n 很大时近似为 1 其中 t 的自由度取 221PpXYitsnXn-2，为对应该的方程解出的点估计 Y 值；pP一般计算时使用，其中；YXpSt2A2XYsn（6）卡方检验卡方检验的假设：（1）分类相互排斥，互不包容；10（2）观测值相对独立；（3）期望次数的大小：每个单元格中期望次数至少在 5 以上，分类中不超过 20%的类别的理论次数可以小于 5。单元格人数过少时处理方法：（1）单元格合并法（2）增加样本数（3）去除样本法（4）使用校正公式基本公式 22oef其中为观察次数；为理论

16、期望次数ofef公式的适用范围要求观察彼此之间独立，并且单位格的理论期望次数不能小于 5（小于 5时可与相邻的组合并）1）拟合度检验 2匹配度检验是用样本数据来检验总体分布的形状或比率，以确定与假设的总体性质的匹配度。其中为分类数1dfC2）独立性检验 2独立性检验帮助我们考察多种因素的不同分类之间是否独立。它是检验行和列两个变量彼此有无关联的一种统计方法，适用于命名型变量和顺序型变量。其中和分别为行列分类数1dfR（7）非参数检验1）独立样本均值差异的非参数检验1）秩和检验法两样本容量均小于 10将容量较小的样本的各数据等级求和，T 值检验表中的临界值比较。两样本容量均大于 10 TZ其中而12Tn12Tn（2）中数检验法将两个样本数据混合从小到大排列求混合排列的中数分别找出每个样本中大于和小于中数的数据的个数，列成四格表（中数本身不在内）对四格表卡方检验公式进行计算

展开阅读全文