1、统计学题目分析 第一章:总论 1.统计学的分类: A:理论统计学:描述统计学、推断统计学 (研究的内容是统计的一般理论和方法) B:应用统计学:国民经济统计学、社会统计学、人口统计学 (研究的内容是运用于某一特定领域的统计问题) 2.统计学的发展史 : A:国势学派( 记述学派):德国康令和阿亨瓦尔。以文字技术和比较为主,反映各国的国情国力。(偏重事物性质的解释、不注重数量分析) B: 政治算术学派:英国威廉配第和格朗特。代表著作是政治算术 :利用数字、重量、尺度的方法,并配以朴素的图表 C: 数理 统计学派:比利时凯特勒 。 将大数法则和概率论引入统计学,最小平方法、误差理论、正态分布理论等
2、成为统计学的主要内容。 D: 社会统计学派:德国克尼斯 。 统计学是社会科学,强调对总体进行大量观察,通过研究其内在联系来揭示社会现象的规律。 3.统计学的研究对象和特点 统计学就其研究对象而言,具有数量性、总体性和差异性特点 数量性: 统计研究对象是客观事物的数量方面。 总体性:社会经济统计认识社会经济现象时,主要是研究社会经济现象的总体数量规律,即通过大量的观察,获得足够多的统计资料,说明、认知总体现象的变化情况及规律。 差异性:就是要从所研究现象总体的各个个体之间的差异中概括出共同普遍的特征,并对差异情况作出必要的反映。 4.统计总体和总体单位的特征、判定及其联系。 判定: 总体: 统计
3、研究的客观对象的全体,是具有某种共同性质的事物所组成的集合体(也称为母体) 个体: 构成统计总体的个别事物称为个体(也称总体单位) 特征: 总体具有: 具有大量性、同质性、差异性等特征 联系: 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 A.总体容量随着个体数的增减可变大变小。 B.随着研究目的的不同,总体中个体 可发生变化。 C.随着研究范围的变化,总体与个体的角色可以变化。 5.统计标志与统计指标的概念、分类与区别。 概念:统计标志: 用以描述个体所具有的特征的名称。标志在每个个体上的具体表现结果称为标志表现。 统计指标: 反映社会经济现象总体数量特征的概念及
4、其具体数值 分类:统计标志: A.按表示方式不同,可以分为品质标志和数量标志 B.按在每个个体上的表现结果是否相同可以分为不变标志和可变标志 统计指标: A:: 按计算范围分类 : 总体指标 、 样本指标 B:按表现形式分类:总量指标、相对指标、平均指标 C: 按内容特征分类 :数量指标、质量指标 D: 按反映现象的时间分类 :静态指标、动态指标 E:按功能分类:描述指标、预警指标、评价指标 区别: A.指标和标志说明的对象不同 B.指标和标志的表现形式不同 第 2章:统计数据的收集、整理与显示 1. 统计调查方案的有关内容。 统计数据收集 :确定数据收集目的、设计数据收集方案、 开展数据收集
5、活动、评估数据收集质量、 2.普查、抽样调查、重点调查、典型调查组织形式的特点 普查特点: 专门组织的一次性调查 、 全面调查 抽样调查特点: 一是在样本的抽取上遵循随机原则 。 二是在调查的功能上能以部分推断总体。 三是在推断的手段上运用概率估计的方法。 四是在推断的理论上,以大数定律和中心极限定理为依据 。 五是在推断的效果上,抽样误差可以计算并加以控制。 重点调查特点: 以客观性原则来确定调查单位 、 属于范围较小的全面调查 典型调查特点: A.调查单位是根据调查目的有意识选择出来的少数具有代表性的单位 B.调查结果具有代表性 C.调查单位少,具有一定的代表性 D.调查方法机动灵活,省时
6、省力 3.统计分组的性质 分与合 、穷尽与互斥、反映本质差异、可能掩盖差异、关键是分组标志的选择和分组界限的确定 4.组中值的计算 A. 当缺下限时,组中值 =本组上限 -邻组组距 /2 B. 当上下限都齐备时,组中值 =(本组上限 +本组下限) /2 C. 当缺上限时,组中值 =本组下限 +邻组组距 /2 第 3章:变量分布特征的描述 1.计划完成程度的计算(尤其是计划指标用提高或降低百分数表示时) 计划完成程度 =(实际完成数 /计划完成数) *100% 例题: 2.平均指标和相对指标的区分; A.概念不同。 相 对 数是两个有联系而性质不同的总体对比而形成相对数指标。平均指标 是反映同质
7、总体单位标志值一般水平的指标。 B.反映的问题不同。相对指标 反映两不同总体现象 形成的密度、强度。平均指标反映同一现象在同一总体中的一般水平。 C.计算公式及内容 不同。平均指标 分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一 一对应的关系 。而相对指标 是两个总体现象之比,分子分母没有一 一对应关系。 D.有的强度相对指标的分子分母可倒置;平均指标 则不可。 E.作用不同。平均指标的作用有: 反映总体各单位变量分布的集中趋势 和一般水平;比较同类现象在不同空间或不同阶段的发展水平;分析现象之间的依存关 系;作为评价事物和作为决策的数量标准或参考;可进行数量估算。 相
8、对指标的作用有: 说明一个国家、地区或部门的经济实力或社会服务能力; 进行国家、地区之间的比较,确定发展不平衡和发展的差距。 3.时期指标、时点指标的内涵及特点 总量指标按反映的时间状态,分为时期指标和时点指标,时期指标表明现象总体在一段时间内发展过程的结果,时点指标表明现象总体在某一时刻的数量状况。 时期指标的特点:各时期指标数值具有可加性、指标数值大小与包含的时期长 短有直接关系、指标数值是连续登记、累计的结果 时点指标的特点:各时点指标数值不具有可加性、指标数值大小与其时间间隔长短无直接关系、指标数值是间断计数的。 4.组距数列中算术平均数和标准差的计算 算数平均数计算公式 : 标准差计
9、算公式 : 5.受极端数值影响的是哪些平均指标,不受极端数值影响的是哪些平均指标 平均指标的具体表现称为平均数,平均数因计算方法的不同可分为数值平均数和位置平均数,数值平均数包括算数平均数、调和平均数、几何平均数,位置平均数包括中位数和众数。其中,数值平均数受极端 值影响,位置平均数不受极端值影响。所以 受极端值影响的平均指标:算数平均数、几何平均数、调和平均数 不受极端值影响的平均指标:中位数、众数 6.众数、中位数的特征 众数特点 : A.众数不受分布数列的极大或极小值的影响 . B.当分组数列没有任何一组的次数占多数,而是近似于均匀分布 fxffff fxfxfxx n nn21 221
10、1KiiiKiiffXX1122)(时,则该次数分配数列无众数。若将无众数的分布数列重新分组或各组频数依序合并,又会使分配数列再现出明显的集中趋势。 中位数特点 : A.中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从 而在一定程度上提高了中位数对分布数列的代表性。 B.有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。 C.缺乏敏感性。 D.各单位标志值与中位数的离差绝对值在所有平均指标中最小 7.算术平均数、调和平均数、标准差和标准差系数的计算(包括对平均数代表性大小的判别) 算数平均数分为简单算数平均数和加权算术平
11、均数 简单算术平均数: 加权算术平均数: 调和平均数分为简单调和平均数和加权调和平均数 简单调和平均数: 加权调和平均数: n xn xxxx n 21 fxffff fxfxfxx n nn21 22111211 1 1nnnHxx x x 12121212 1121, 1nnnnjn jnm m m m mHm m m m m m mx x x xwwwwx x x 式 中标准差计算: 标准差系数计算: 8.次数分布的类型与判定(左偏、右偏、对称分布等) 9. 左偏、右偏、对称分布三种情形下,均值、中位数、众数的大小比较 。 在对称分布(即正态)时 ( Me中位数、 Mo 众数) 在右偏时
12、 在左偏时 在适度偏态时 KiiiKiiffXX1122)(xSVXV S 或oe MMx xMM eo oe MMx )(3 xMxM eo 对称分布 右偏分布 左偏分布 第四章:抽样估计 1.总体分布、样本分布和抽样分布的区别 总体分布:是指总体中所有个体关 于某个变量(标志)的取值所形成的分布。 样本分布:样本中所有个体关于某个变量(标志)的取值所形成的分布。 抽样分布: 样本统计量的概率分布,由样本统计量的所有可能取值和与之相应的概率组成。 2.抽样误差的表现形式(抽样实际误差、抽样标准误和抽样极限误差) 抽样误差有三种形式: 抽样实际误差 : 是抽样估计值与总体参数真值之间的绝对离差
13、,表示为 抽样标准误差: 是反映抽样误差一般水平的指标,实质含义是 指样本统计量抽样分布的标准差 抽样极限误差 : 是指以样本估计量估计总体参数时所允许的 最大误差范围 3.统计量优劣的评价标准(无偏性、有效性、一致性和充分性) 评价估计量好坏的标准有四个:无偏性、有效性、一致性和充分性 01MMx xMM 10 01 MMx符合标准的称为优良估计量 4.抽样极限误差、抽样精度和概率保证程度的关系 其中, 表示抽样极限误差, Z(a/2)表示概率保证程度, SE( )抽样标准误差 抽样极限误差: 相对抽样极限误差: 抽样精度: Ax=1- x Ap=1- p 所以,三者的关系为: 概率保证程度
14、越大,抽样极限误差越大 抽样极限误差越大,抽样估 计的精确度越小 5.重复抽样和不重复抽样两种情形下,简单随机抽样的均值(或成数)的区间估计以及必要样本容量的确定。例如课后计算题第 3 和第 4题。 简单随机抽样情况下,主要计算公式如下: ( 1)区间估计 总体均值的区间估计: 22,-x z x zse x se x其中: 2sse x n重 复 : 2 2 2- 11N n s n s sse x fN n N n n 不 重 复 : )(2/ SEZ pxPpXx%1 0 0%1 0 0%1 0 0%1 0 0pPxXpppxxx 总体比例 P 在 1-置信水平下的置信区间为: 22(
15、1 )( 1 - )1pppznppp z fn 重 复 抽 样 :或 不 重 复 抽 样 :( 2)样本容量的计算: 重复抽样 对于总体均值: 2222axxzsn 重 复对于总体成数: 2222appzsn 重 复 不重复抽样 1nn nN 重 复不 重 复重 复第 7章:相关回归分析 1.函数关系与相关分析的区别 函数关系: 指现象之间存在确定性的数量依存关系。在这种关系中,当某一变量或某些变量 取任意一个值时,另一变量都会有一个确定值与之严格对应,并且这种对应关系可以用一个数学表达式来反映。 相关关系: 也称统计相关,是指现象之间存在的非确定性的数量依存关系。即现象之间虽然存在着数量依存关系,一个现象发生数量上发生变化时,另一个现象数量水平也会相应地发生变化。但这种数量变化关系并不是严格一一对应的,当一个变量数值确定时,另 个变量可能有许多个可能的取值与之相对应,这些数值围绕着它们的平均数上下波动。 )(xfy )(xfy