1、统计数据的类型及其特点统计数据是采用某种计量尺度对事物进行计量的结果,采用不同的计量尺度会得到不同类型的统计数据。从上述四种计量尺度计量的结果来看,可以将统计数据分为以下四种类型: 定类数据表现为类别,但不区分顺序,是由定类尺度计量形成的。 定序数据表现为类别,但有顺序,是由定序尺度计量形成的。 定距数据表现为数值,可进行加、减运算,是由定距尺度计量形成的。 定比数据表现为数值,可进行加、减、乘、除运算,是由定比尺度计量形成的。 前两类数据说明的是事物的品质特征,不能用数据表示,其结果均表现为类别,也称为定性数据或品质数据(Oualitative data);后两类数据说明的是现象的数量特征,
2、能够用数值来表现,因此也称为定量数据或数量数据( Quantitative data)。由于定距尺度和定比尺度属于同一测度层次,所以可以把后两种数据看作是同一类数据,统称为定量数据或数值型数据。 区分测量的层次和数据的类型是十分重要的,因为对不同类型的数据将采用不同的统计方法来处理和分析。比如,对定类数据,通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和 x2 检验等;对定序数据,可以计算其中位数和四分位差,计算等级相关系数等非参数分析;对定距或定比数据还可以用更多的统计方法进行处理,如计算各种统计量、进行参数估计和检验等。我们所处理的大多为数量数据。 这里需要特别指出的是,
3、适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性。比如:在描述数据的集中趋势时,对定类数据通常是计算众数,对定序数据通常是计算中位数,但对定距和定比数据同样也可以计算众数和中位数。反之,适用于高层次测量数据的统计方法,则不能用于较低层次的测量数据,因为低层次数据不具有高层次测量数据的数学特性。比如,对于定距和定比数据可以计算平均数,但对于定类数据和定序数据则不能计算平均数。理解这一点,对于选择统计分析方法是十分有用的。 统计学的研究方法统计学研究对象的性质决定着统计学的研究方法。从认识的角度统计学是用辩证唯物主义的观点,认识统计研究的特点和一般规律性。具体
4、来讲,统计学所特有的研究方法主要有大量观察法、统计分组法、综合指标法、归纳推断法等。 (一)大量观察法。 大量观察法是统计研究的特有方法。构成社会经济现象总体的各个统计单位由于各种因素的影响,彼此数量之间存在不同差异。差异有大有小,差异原因有主有次,只有在大量观察的基础上,综合各单位的统计数据和各个调查单位表现出来的偶然的数值差异,才能互相抵消;也只有在大量观察基础上形成的总体平均数,才能显示总体的一般水平和发展变化规律。而少数资料或短时间的数值差异变化,是难以得到正确的分析结论的。 (二)统计分组法。 统计分组法在统计研究中占有重要地位,它不仅是统计资料整理的重要组成部分,而且在整个统计工作
5、阶段都能发挥自己特有的作用。从统计设计阶段开始,要根据研究对象的特点,制定分类标准,确定反映总体不同性质特征的分类指标体系。在统计调查阶段,要根据具体的分组规定和分组方法,分门别类地收集有关数据。在统计资料整理阶段,需对搜集来的原始资料,按统计分析的要求进行分析或再分组。到统计分析阶段,则可以用类型分组、结构分组、水平分组、依存关系分组、时间阶段分组等各种分组方法进行统计分析,以反映总体内部不同分组条件下事物的相互联系、相互制约、彼此差异的现状、本质特征及其发展变化趋势。 (三)综合指标法。 统计分析过程,就是运用经过综合的统计指标反映社会经济现象的数量关系。不仅分析现象的总体数量水平,而且分
6、析现象的结构关系、比例关系、平衡关系、投入产出关系等等。一种统计指标,往往只能反映总体的某一个侧面,要了解现象的全貌,统计研究常常把几个、十几个甚至几十个统计指标联系在一起,组成指标体系,从不同侧面反映现象和事物的综合情况。综合指标法就是运用表明社会经济现象不同侧面的统计指标,对现象总体展开全面、细致、深入分析研究的方法。 综合指标法按指标的基本表现形式,可分为总量指标、相对指标和平均指标等。通常将这三种指标统称为综合指标。在这三类指标的基础上,进一步展开综合统计分析,其统计分析的重要形式有:对比分析、平均分析、差异分析、动态分析、因素分析、相关分析、平衡分析、统计推断和预测分析等。 (四)归
7、纳推断法 归纳法是从个别到一般的推理方法,是统计研究中常用的方法。 在综合指标法中将个别现象的数值综合汇总成总体数值,概括反映总体一般的数量特征,所采用的方法就是归纳法。在研究社会经济现象的总体数量关系时,当研究的总体单位数很多甚至是无限总体(单位数不可数)时,可采用抽样调查方法,观察部分单位进行计算和分析,根据结果来推论总体。例如,为了解产品质量,从正在流水线上大规模生产的产品零部件中抽取其中的一部分产品进行检验,借以推断这批产品质量的好坏,并以一定的置信标准来推断所做结论的可靠程度。这种根据样本数据来推断总体数量特征的归纳推理方法称为统计推断法。统计推断是现代统计学的基本方法。这种方法既可
8、用于对总体参数的估计,也可用做对总体的某些假设检验。广泛应用于农产品产量的估计,工业产品质量检查与控制,以及根据时间数列进行预测所做的估计和检验。 方差分析的基本思想多组样本均数比较时要用方差分析,而不能作任两组均数间比较的 t 检验。因为后者会明显增大犯第一类错误的概率。方差分析和前面介绍的 u 检验、t 检验一样,也属于是参数检验方法,它要求各组数据均服从正态分布,且各组的总体方差相等,即方差齐性。用样本方差描述其总的离散趋势。而样本方差的分子是离均差平方和,又叫作总变异SS 总;完全随机设计的方差分析是将多组数据内部的总变异分解为组内、组间变异两部分;组内变异反映的是随机变异,组间变异反
9、映了随机变异和可能起作用的研究因素。组内变异除以组内自由度得到组内均方,组间变异除以组间自由度得到组间均方。如果研究因素不起作用,即假定 H0 成立,那么组间均方与组内均方之比(F 值)将服从组间,组内的 F 分布,从而可以确定 P 值并得出统计结论。简要说明假设检验中的小概率原理,并说明如何构建假设假设检验的基本思想是应用小概率的原理。所谓小概率原理,是指发生概率很小的随机事件在一次实验中是几乎不可能发生的。根据这一原理,可以做出是否接受原假设的决定。要是在一次试验中 A 竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。所谓假设检验,就是事先对总体参数或总体分布形式做出一个假设,然后利
10、用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受式拒绝原假设。比如,对于某机器设备,生产工艺改变后,要检验新工艺对产品的某个主要指标是否有影响时,就需要抽样检验总体的某个参数(如均值、方差等)是否等于改变工艺前的参数值,这类问题就属于假设检验问题。假设检验的步骤:1提出原假设和备择假设对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。原假设又称零假设,是正待检验的假设,记为 H0;备择假设是拒绝原假设后可供选择的假设,记为 H1。原假设和备择假设是相互对立的,检验结果二者必取其一。接受 H0 则必须拒绝 H1;反之,拒绝 H0 则必须接受
11、H1。原假设和备择假设不是随意提出的,应根据所检验问题的具体背景而定。常常是采取“不轻易拒绝原假设”的原则,即把没有充分理由不能轻易否定的命题作为原假设,而相应地把没有足够把握就不能轻易肯定的命题作为备择假设。一般地,假设有三种形式:(1)H 0: 0;H 1: 0。这种形式的假设检验称为双侧检验。如例 614 中可提出假设:H 0:4 厘米; H1:4 厘米。(2)H 0: 0;H 1: 0(或 H0: 0;H 1: 0) 。这种形式的假设检验称为右侧检验。2选择适当的统计量,并确定其分布形式3选择显著性水平 ,确定临界值4做出结论根据样本资料计算出检验统计量的具体值,并用以与临界值比较,做
12、出接受或拒绝原假设H0 的结论。如果检验统计量的值落在拒绝区域内,说明样本所描述的情况与原假设有显著性差异,应拒绝原假设;反之,则接受原假设。卡方检验的统计思想卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。 它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 1. 检验一个总体的方差或标准差检验一个总体的方差或标准差2. 假设总体近似服从正态分布假设总体近似服从正态分布3. 使用使用 2 分布分布4. 检验统计量检验统计量 220(1)(1)nsn假设 双侧检验 左侧检验 右侧检验假设形式H0: =H1 : H0: H1 : 统计量 220(1)ns拒绝域2(1)n212212()n 2(1)nP 值决策 拒绝 H0P