1、统计学简答题及参考答案1.简述描述统计学的概念、研究内容与目的。概念:它是研究数据收集、整理和描述的统计学分支。研究内容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。研究目的:描述数据的特征;找出数据的基本数量规律。2.简述推断统计学的概念、研究内容与目的。概念:它是研究如何利用样本数据来推断总体特征的统计学分支。研究内容:参数估计和假设检验的理论与方法。研究目的:对总体特征作出统计推断。3.什么是 总体和样本?总体和样本?总体是指所研究的全部个体总体是指所研究的全部个体 (数据数据 )的集合,其中的每一个元素称为个体的集合,其中的每一个元素称为个体(也称为总体单位)(也称为总体单位
2、) 。可分为有限总体和无限总体:可分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的,可数的。有限总体的范围能够明确确定,且元素的数目是有限的,可数的。无限总体所包括的元素数目是无限的,不可数的。无限总体所包括的元素数目是无限的,不可数的。总体单位数可用总体单位数可用 N 表示。表示。样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为样本容量,记为 n 。4.什么是普查?它有哪些特点?普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它普查就是为了特定的研究目的,而专门
3、组织的、非经常性的全面调查。它有以下的特点:有以下的特点:1) 通常是一次性或周期性的通常是一次性或周期性的2) 一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间3) 数据的规范化程度较高数据的规范化程度较高4) 应用范围比较狭窄。应用范围比较狭窄。5.什么是抽样调查?它有哪些特点?抽样调查是指 从总体中随机抽取一部分单位作为样本进行调查,并根据样从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。本调查结果来推断总体特征的数据搜集方法和统计推断方法。它具有经济性好、时效性强、适应面广、准确性高等特点它具有经济性好、时效性强、适
4、应面广、准确性高等特点 。6.简述统计调查方案的概念及应包括的基本内容。答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。它应包括的基本内容有:1明确调查目的;2确定调查对象和调查单位;3设计调查项目;4设计调查表格和问卷;5确定调查时间;6组织实施调查计划;7调查报告的撰写,等等。7.简述统计分组的概念、原则和具体方法。答:(1)概念根据统计研究的目的和客观现象的内在特点,按照某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。统计分组标志有两种:品质标志或数量标志。(2)原则穷尽原则
5、;互斥原则。即“不重复、不遗漏”的原则。(3)具体分组方法按品质标志分组按数量标志分组(A)单项式分组与组距式分组;(B)间断组距式分组和连续组距式分组;应遵循“上限不在组内”原则:凡是总体中某一个单位的变量值为相邻两组的界限值,则这一个单位就归入作为下限值的那一组内。(C)等距分组与异距分组。8.简述 组距分组的基本步骤。组距分组的基本步骤。( 1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的( 2)确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值)确定组距:组距是一个组的上限与下限之差,可根据全部数据的
6、最大值和最小值及所分的组数来确定,即:和最小值及所分的组数来确定,即:组距组距 (最大值最大值 - 最小值最小值 ) 组数组数( 3)统计出各组的频数,并整理成频数分布表。)统计出各组的频数,并整理成频数分布表。9.简述算术平均数的概念及其数学性质。答:算术平均数是指一组数据的总和,除以这组数据的项数所得的结果。它是最常用的数值平均数,分为简单算术平均数和加权算术平均数两种。其数学性质是:(1)算术平均数与变量值个数的乘积,等于各个变量值的总和。(2)各变量值与其算术平均数的离差之总和,等于零。(3)各变量值与其算术平均数的离差平方之总和,为最小值。10.简述均值的概念和特征。简述均值的概念和
7、特征。均值就是算术平均数,它的均值就是算术平均数,它的 基本公式基本公式 为:为:算术平均数算术平均数 =总体标志总量总体标志总量 /总体单位数总体单位数 =X i/n其特征如下:其特征如下:1) 集中趋势的最常用测度值集中趋势的最常用测度值2) 一组数据的均衡点所在一组数据的均衡点所在3) 体现了数据的必然性特征体现了数据的必然性特征4) 易受极端值的影响易受极端值的影响5) 用于数值型数据,不能用于分类数据和顺序数据用于数值型数据,不能用于分类数据和顺序数据6) 可根据原始数据或者分组数据来计算,计算公式略有差异。可根据原始数据或者分组数据来计算,计算公式略有差异。11.简述 众数、中位数
8、、均值的特点与应用场合。众数、中位数、均值的特点与应用场合。1) 众数众数 不受极端值影响不受极端值影响 具有不唯一性具有不唯一性 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2) 中位数中位数 不受极端值影响不受极端值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3) 均值均值 易受极端值影响易受极端值影响 数学性质优良数学性质优良 数据对称分布或接近对称分布时应用。数据对称分布或接近对称分布时应用。12.简述算术平均数、众数、中位数的概念及数量关系。答:(1)概念算术平均数是指一组数据的总和除以这组数据的项数所得的结果,也称为均值, 可用 X表示。它是最常用的数值平均数
9、,分为简单的和加权的算术平均数两种。众数是指一组数据中出现频数最多、频率最高的变量值,可用 MO 表示。它是最常见、最普遍的状况,是对现象集中趋势的度量。 中位数是指将数据由小到大排列后,位置居中的数值,可用 M e 表示。(2)三者的数量关系是:在对称分布中,三者相等。即: =Me=Mo;X在左偏分布中,一般有 ,就接受 H0 。28.解释假设检验中的两类错误第类错误(弃真错误)指原假设为真时,拒绝原假设。其发生的概率记为 , 称为显著性水平。第类错误(取伪错误)指原假设为假时,未拒绝(即接受)原假设。其发生的概率记为 。29.简述假设检验中的小概率原理1) 小概率是指在一次试验中,一个几乎
10、不可能发生的事件发生的概率。2) 在一次试验中小概率事件一旦发生,我们就有足够的理由拒绝原假设。3) 小概率由研究者事先确定。30.解释假设检验的决策规则 1. 给定显著性水平 ,查表得出相应的临界值 za或 za/2, ta或 ta/2 2. 将检验统计量的数值与 水平的临界值进行比较 3. 作出决策 双侧检验:|统计量| 临界值,拒绝 H0 左侧检验:统计量 临界值,拒绝 H031.简述假设检验的基本步骤1. 陈述原假设 H0和备择假设 H12. 从所研究的总体中抽出一个随机样本3. 确定一个适当的检验统计量,并利用样本数据计算出其具体数值4. 确定一个适当的显著性水平 ,并查表得出其临界
11、值,指定拒绝域5. 将统计量的数值与临界值进行比较,作出决策 统计量的数值落在拒绝域中,就拒绝 H0。否则,就接受 H0 也可以直接利用 P 值作出决策。如果 P,就接受 H032.简述相关分析与回归分析之间的联系1) 有共同的研究对象:都是对变量间相关关系的分析。2) 只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。3) 相关分析只表明变量间相关关系的性质和程度,要确定相关的具体数学形式依赖于回归分析。4) 相关分析中相关系数的确定,建立在回归分析的基础上。33.直线相关系数有哪些特点? 相关系数的取值在-1 与 1 之间。 当 r=0 时,表明 X 与 Y 没有
12、线性相关关系,但可能存在着其它的非线性相关关系。 当 00, 表明 X 与 Y 为正相关;若 r0, 表明 X 与 Y 为负相关。 当|r|=1 时,表明 X 与 Y 完全线性相关:若 r=1,称 X 与 Y 完全正相关;若 r=-1,称 X 与 Y 完全负相关。34.为什么只能对未知的总体参数作估计?总体参数是未知的、不可直接观测的、不能精确计算的,能够得到的只是变量的样本观测值。结论: 只能通过变量的样本观测值,选择适当的统计方法去近似地估计回归系数等总体参数。前提: u 是随机变量其分布性质不确定,必须作某些假定,其估计才有良好性质,其检验才可进行。原则: 使参数估计值“尽可能地接近”总
13、体参数的真实值。35.编制时间数列的基本原则及其具体要求是什么?答:可比性原则-保证时间数列中各项数据的可比性,是编制时间序列的基本原则。其具体要求是:(1) 、时间一致;(2) 、总体范围一致;(3) 、经济内容、计算口径、计算方法、计算价格、计量单位等方面一致。36.比较时期数列和时点数列之间的 4 个不同特点。答:时期序列的各个数据为时期指标值(流量),表示时期现象在各段时期内的发展总量。时点序列的各个数据为时点指标值(存量),反映时点现象在各个时点上所处的数量状态和所达到的水平。时期序列中各期数据具有可加性,通过加总即可得到更长一段时间内的发展总量,有实际意义。时点序列中各时点数据不能
14、相加,具有不可加性,即它们相加的结果没有实际意义。时期序列中数值的大小与所属时期长短有直接的关系,一般是时期越长,数值就越大。时点序列中各时点数的大小与时点间隔长短没有直接的联系。并不是时点间隔长,时点数就大一些。时期序列中各期数据是对每段时间内发生的数量连续登记、累计的结果。时点序列中各数据通常不可能、也不必要连续登记,一般是对代表时点进行间断计数的结果。37.时间数列的分解分析有哪些基本假设?基本假设是:(一)现象 Y 只有四个构成要素:长期趋势 T、季节变动 S、循环变动 C 和不规则变动 I。 (二)构成要素存在以下的组合模型:乘法模型: Y = TSCI加法模型: Y = T + S
15、 + C + I乘加模型:Y = TS + CI ,等等。38.简述季节变动的概念及其研究意义。季节变动是指社会经济现象因受自然因素或社会因素影响,而形成的在一年内有规则的周期性变动。测定季节变动的意义在于: 分析与测定过去的季节变动规律 对未来现象的季节变动作出预测 消除季节变动对时间序列的影响。39.常用的对比分析方法及其相对数指标有哪些?答: 根据分析目的和比较基准的不同来划分,对比分析主要有下述几种常用方法。(1)结构分析,可计算结构相对数(即比重) ;(2)比例分析,可计算比例相对数(简称比例) ;(3)空间比较分析,也叫横向对比分析,可计算空间比较相对数;(4)动态对比分析,也称为
16、纵向对比分析,可计算动态相对数;(5)计划完成程度分析,可计算计划完成程度相对数;(6)强度、密度和效益分析,可计算强度相对数。40.简述统计 指数的概念及其分类指数的概念及其分类指数是一种对比分析指标,具有相对数的形式()指数是一种对比分析指标,具有相对数的形式() 。其对比方式有:不同时间、不同空间、实际与计划对比。其对比方式有:不同时间、不同空间、实际与计划对比。指数的分类有:指数的分类有: “数量指标指数数量指标指数 ”与与 “质量指标指数质量指标指数 ”; “个体指数个体指数 ”、 “总总指数指数 ”与与 “类指数类指数 ”; “动态指数动态指数 ”与与 “静态指数静态指数 ”; “
17、综合指数综合指数 ”与与 “平均指平均指数数 ”; “简单指数简单指数 ”与与 “加权指数加权指数 ”等。等。41.简述加权综合指数的概念及其编制原理。答:采用加权综合方法计算的总指数,称为加权综合指数。其编制的基本原理是:.为了解决复杂现象总体的指数化指标不能直接加总的问题,必须引入同度量因素,使其转化成相应的、能够相加的价值总量形式;同度量因素通常也称为综合指数的权数,因为它具有权衡各个个体重要性的作用。引入了同度量因素的综合指数,通常被称为加权综合指数。.为了在综合对比过程中,单纯反映指数化指标的变动或差异程度,又必须将引入的同度量因素的水平固定起来。要注意同度量因素的两个问题:指标性质
18、(数量或质量指标)的确定、固定水平所属时期的选择。42.简述加权平均指数的概念及其编制原理。答:采用加权平均方法计算的总指数,称为加权平均指数。其编制的基本原理是:先计算出个体指数,再将个体指数加以平均即可求得总指数,这种方法计算的总指数也称之为平均指数。由于各个个体指数的重要性不同,所以,平均指数通常需要加权。编制平均指数有两大问题: 采用哪种平均法?(1).算术平均法计算较为简便,也比较直观,所以其应用较为普遍。(2).根据所掌握的数据和服从研究目的之需要,调和平均法和几何平均法也有一定的实用价值。 权数如何确定?(1).既要考虑实际经济意义,又要考虑获取资料的可行性和简便性。(2).权数主要有:基期总值 (q0p0)、报告期总值(q 1p1)和固定权数(w i)等三种。要注意平均指数的两个问题:要注意平均指数的两个问题: “权数权数 ”的选择、的选择、 “型式型式 ”的选择。的选择。