第四章统计描述.ppt

上传人:ga****84 文档编号:448248 上传时间:2018-10-07 格式:PPT 页数:144 大小:2.33MB
下载 相关 举报
第四章统计描述.ppt_第1页
第1页 / 共144页
第四章统计描述.ppt_第2页
第2页 / 共144页
第四章统计描述.ppt_第3页
第3页 / 共144页
第四章统计描述.ppt_第4页
第4页 / 共144页
第四章统计描述.ppt_第5页
第5页 / 共144页
点击查看更多>>
资源描述

1、第四章 统计描述,第一节 总量指标第二节 相对指标第三节 平均指标第四节 变异指标,教学目的 理解总量指标、相对指标、平均指标、变异指标的概念、作用和种类,掌握各种指标的计算和应用。能够运用本章所述的统计指标对客观现象的规模、水平和各种数量关系进行科学描述。重点难点 总量指标、相对指标、平均指标和变异指标的计算和应用,标准差和特殊情况下加权算术平均数权数的选择。,用统计指标去概括和分析现象总体的数量特征和数量关系的方法,称为综合指标法,简称综合指标。 综合指标从它的作用和方法特点的角度可概括为三类:,总量指标相对指标平均指标,第一节 总量指标,一、总量指标的概念和作用,总量指标是反映社会经济现

2、象一定时间、地点、条件下的总规模、总水平或工作总量的统计指标。 总量指标表现形式是绝对数,不是抽象的绝对数,计量单位是有名数。 总量指标也可表现为总量之间的绝对差数,如增加量、减少量等。,例如:2012年我国财政收入117209.8亿元。,例如:2012年我国国内生产总值比上年增加46218.1亿元。,总量指标在社会经济统计中的作用 :,总量指标能反映一个国家的基本国情和国力,反映某部门或单位等人、财、物的基本数据 。总量指标是制定政策、编制计划、实行社会经济管理的重要依据 。 总量指标是计算相对指标和平均指标的基础。,(一)按其反映现象总体内容的不同分为:,二、 总量指标的种类,总体单位总量

3、指标说明总体的单位总数。,例:企业数、学校数、职工人数、学生人数。,总体标志总量指标说明总体中某种标志值总和。,例:总产量、总产值、工资总额、税金总额。,(二)按其反映的时间状况不同分为:,时期指标 反映现象总体在某一时期内发展过程的总数量,即流量。(可连续计数,与时间长短有关,是累计结果),时点指标 反映现象总体在某一时刻(瞬间)上的规模或水平,即存量。 (间断计数,与时间间隔无关,不能累计),实物指标是根据事物的自然属性或物理性能,采用自然单位或度量衡单位计算的总量指标。,自然单位:辆、双、头、根、个 度量衡单位:吨、米、克、立方米 双重单位:公里/小时、人/平方公里复合单位:吨公里、千瓦

4、小时 标准实物单位:按统一标准折算,对有些性质相同但规格或含量不同的产品总量的计算,要按折合标准实物量的方法计算。,例如,能源统计以标准燃料每千克发热量7000Kcal为标准单位。,(三)按其计量单位不同分为:,货币单位使不能直接相加的产品产量过渡到能够加总,用于综合说明具有不同使用价值的产品生产总量或商品销售量等的总规模、总水平。,价值指标是以货币为单位计算的总量指标。,劳动量指标是以劳动时间为单位计算的总量指标。,工时 工人数和劳动时数的乘积工日 工人数和劳动日数的乘积台时 设备台数和开动时数的乘积,由于具体条件不同,不同企业的劳动量指标不具有可比性,因此,劳动量指标只限于企业内部使用。,

5、三、 总量指标的计算原则,(一)科学性 以科学的理论确定总量指标的含义、范围和计算方法。(二)可比性 注意历史条件变化对指标内容和范围的影响。(三)统一性 指标的计算口径,即计算的范围、计算方法、计量单位要统一。,第二节 相对指标,又称相对数,是两个有联系的指标数值之比,用以反映现象的发展速度、强度、结构或数量联系程度。,一、相对指标的概念和作用,相对指标的主要作用:,相对指标能具体表明社会经济现象之间的比例关系。相对指标能使一些不能直接对比的事物找出共同比较的基础。 相对指标便于记忆、易于保密。,从上表中看来,好象甲厂比乙厂劳动生产率高( 600400);而将其换算成相对指标,实际发展速度是

6、乙厂大于甲厂。由此可看出相对指标可以弥补总量指标的不足。,- 人口密度:人/平方公里 - 平均每人分摊的粮食产量:千克/人,系数或倍数:是将比的基数抽象化为1; 成数:是将比的基数抽象化为10;百分数:是将比的基数抽象化为100; 千分数:是将比的基数抽象化为1000。,相对指标的数值有两种表现形式:,无名数(抽象化的数),分以下几种:,有名数,(一) 计划完成程度相对指标,用来检查、监督计划执行情况的相对指标,通常以%表示。,二、相对指标的种类及其计算,计划完成相对数的作用,说明各计划指标的完成程度 反映计划执行进度 反映经济计划执行中的薄弱环节,(1) 根据总量指标计算计划完成相对数,计算

7、结果表明该厂超额10%完成总产值计划。,计划完成程度相对指标的计算,设某工厂某年计划工业总产值为200万元,实际完成220万元,则:,(2) 根据平均指标来计算计划完成程度相对数,某企业某月生产某产品,计划每人每日平均产量50件,实际每人每日平均产量为60件,则:,计算结果表明该企业实际劳动生产率超过20%完成了计划任务。,(3)根据相对指标计算计划完成程度相对数,某企业生产某产品,上年度实际成本为420元/吨,本年度计划单位成本降低6%,实际降低7.6%,则:, 比计划多完成1.71%,本题也可换算成绝对数计算:,计划 -6% 394.8元/吨 (1-6%) 420实际 7.6% 388.0

8、8元/吨 (1-7.6%) 420,某企业计划规定劳动生产率比上年提高10%,实际比上年提高15%,则:, 该企业劳动生产率超额4.5%完成计划任务。,按降低率规定计划任务,其计划完成相对数为:,按提高率规定计划任务,其计划完成相对数为:,计划执行进度的考核,逐日、逐月、逐季地检查计划执行的进度情况,采用计划期中某一段时期的累计实际完成数与全期计划任务数之比来表示。,计划执行进度:,时间进度:,某企业某年工业总产值年度计划为1200万元,一、二、三月份实际完成量分别为100万元、90万元、120万元,则计划执行进度如何?,计划执行进度:,时间进度:,长期计划的检查,(1)累计法计划任务数是规定

9、在整个计划期间应完成的累计数,(2)水平法计划任务数是规定末期应达到的水平,某煤矿计划在“十五”期间,为国家生产400万吨原煤,或达到年产量100万吨原煤。实际统计资料如下:2001年产量68万吨,2002年产量72万吨,2003年产量77万吨,2004年产量86.6万吨。计算该矿“十五”期间原煤产量计划完成情况。,水平法。从2004年5月2005年4月共完成101.2万吨,提前8个月零3天。,解:累计法。期末共完成425.9万吨,超额6.5%完成任务,超出25.9万吨,提前2个月零11天。,(二) 结构相对指标,结构相对指标是在总体分组的基础上,将总体的某部分数值与总体全部数值对比而得出的比

10、重或比率,它可以反映总体的构成情况。,上海“十五”期间GDP构成(%),结构相对指标的作用:,(三) 比例相对指标,比例相对指标是同一总体内不同组成部分的指标数值对比的结果,用来表明总体内部的比例关系。,2. 首先将总体全部数值抽象化为100,求得各部分数值在总体中所占百分数,然后将各部分的百分数连比得比例相对数。,1. 将作为比较基础的数值抽象化为1、10、100或1000,看被比较的数值是多少。,常用的比例形式有两种:,(四) 比较相对指标(类比相对指标),比较相对指标是反映同类现象在不同空间条件下数量对比关系的综合指标,用以说明某一种现象同一时间在不同地区(或单位)发展的差异程度。,某年

11、有甲、乙两企业同时生产一种性能相同的产品,甲企业工人劳动生产率为19 307元,乙企业劳动生产率为27 994元。,说明甲企业劳动生产率比乙企业低31% 。,计算比较相对数时,作为比较基数的分母可取不同的对象,一般有两种情况:, 比较标准是一般对象,这时,分子与分母的位置可以互换。, 比较标准(基数)典型化,把企业的各项技术经济指标都和国家规定的质量水平比较,和同类企业的先进水平比较,和国外先进水平比较等,这时,分子与分母的位置不能互换。,(五) 强度相对指标,强度相对指标是两个性质不同但有联系的总量指标之比,用来表明某一现象在另一现象中发展的强度、密度或普遍程度。,用百分数表示,说明平均每百

12、元销售额负担多少流通费。产值利润率、资金利润率一般用千分数表示。,强度相对数的数值表示有两种方法:, 一般用复名单位表示, 也有少数用百分数或千分数表示,某城市人口100万人,有零售商业机构5000个,则:,有些强度相对数有正、逆两种计算方法:,强度相对指标可以颠倒分子分母计算,故有正逆指标之分。区分正逆指标时,主要看其数值大小与反映事物的强度大小是否一致,一致者为正指标,不一致者为逆指标。,正指标的数值愈大,表示零售商业网密度愈大,它是从正方向说明现象的密度;逆指标的数值愈大,表示零售商业网密度愈小,它是从相反方向说明现象的密度。,某年某地区平均人口数为100万人,医院病床数为2500张。则

13、: 上述计算结果2.5张/千人,说明每千人拥有的医院病床2.5张,数值越大,表示每千人拥有的床位数越多,说明医疗保障程度越高,它从正面说明所研究现象的强度或密度,故称正指标;400人/张说明平均每张病床要供400人使用,指标数值越小,说明医疗保证程度越高,所以是逆指标。,说明一个国家、地区、部门的经济实力或为社会服务的能力 反映和考核社会经济效益 为编制计划和长远规划提供参考依据,强度相对数的作用:,(六) 动态相对指标,基期 作为对比标准的时间报告期同基期比较的时期,也称计算期,动态相对指标是现象报告期水平与基期水平之比,用来反映现象在时间上的发展变化情况,又称为动态相对数或发展速度。,某地

14、区国内生产总值2008年为1100亿元,2009年为1210亿元,其动态相对指标或发展速度为:,计算表明该地区国内生产总值动态相对数或发展速度为110,它表明该地区2009年国内生产总值比上年增长了10。,六种相对指标的比较,2.相对指标要和总量指标结合起来运用。,1.注意二个对比指标的可比性。,三、正确运用相对指标的原则,3.多种相对数结合运用,4.在比较二个相对数时,是否适宜相除再求一个相对数,应视情况而定。若除出来有实际意义,则除;若不宜相除,只宜相减求差数,用百分点表示之。(百分点 即百分比中相当于百分之一的单位),第三节 平均指标,(集中趋势),数量抽象性 只能就同类现象计算集中趋势

15、代表性,一、平均指标的概念和作用,平均指标是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。,平均指标的特点:,平均指标的作用:,1.反映现象集中趋势2.比较现象时空差异3.分析现象依存关系4.提供估计推断基础,平均数,数值平均数,位置平均数,众数中位数,算术平均数几何平均数调和平均数,平均指标按计算方法不同可分为:,根据总体所有标志值计算,根据标志值所处的位置来确定,二、算术平均数(Average),(一)算术平均数的基本公式, 注意区分算术平均数与强度相对数,标志值和单位之间存在一一对应关系,式中: 算术平均数 各单位的标志值 n 总体单位数 总和符号,

16、(二)简单算术平均数,适用于未分组资料,某生产小组有5名工人,生产某种零件,日产量(件)分别为12、13、14、14、15,则平均每个工人日产零件数为多少?,解:平均每个工人日产零件数为:,式中: 算术平均数 各组数值 f 各组数值出现的次数(即权数),(三)加权算术平均数,适用于总体资料经过分组整理形成变量数列的情况,这20名服装营业员的平均月销售量为:,某商场20名服装营业员某月销售量分组资料,起到权衡轻重的作用,决定平均数的变动范围,算术平均数的计算取决于变量值和权数的共同作用: 变量值决定平均数的范围; 权数则决定平均数的位置,在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平

17、均数,其公式为:,设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。,权数的选择,根据指标的含义,选择适当的权数。,某公司所属20个企业资金利润率分组资料如下表,计算该公司20个企业的平均利润率。,加权算术平均数受两因素的影响: 变量值大小的影响。次数多少的影响。,而简单算术平均数只反映变量值大小这一因素的影响。,加权算术平均数与简单算术平均数不同在于:, 各个变量值与算术平均数离差之和等于零,(四)算术平均数的数学性质,简单平均数:,加权平均数:, 各个变量值与算术平均数离差平方之和等于最小值, 算术平均数的两点不足,易受极端变量值的影响,使 的代表性变小;受极大值的影响大于受极小

18、值的影响;当组距数列为开口组时,由于组中值不易确定,使 的代表性也不很可靠。,1)简单调和平均数,适用于总体资料未经分组整理、尚为原始资料的情况,式中: 为调和平均数; 为变量值 的个数; 为第 个变量值。,调和平均数(Harmonic mean)是各个变量值倒数的算术平均数的倒数。,三、调和平均数(又称“倒数平均数”),2)加权调和平均数,适用于总体资料经过分组整理形成变量数列的情况,式中: 为第 组的变量值; 为第 组的标志总量。,当己知各组变量值和标志总量时,作为算术平均数的变形使用。,因为:,调和平均数的应用,m是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。,某厂工人

19、工资资料如表所示,求该厂工人的平均工资。,(一)由平均数计算平均数时调和平均数法的应用:,已知某商品在三个集市贸易市场上的平均价格及销售额资料如下表所示,求该商品的总平均价格。,(二)由相对数计算平均数时调和平均数法的应用:,已知某公司各企业产值计划完成程度及实际完成数如表所示,求全公司计划完成程度(即各企业平均计划完成程度)。,某公司有3个工厂,已知其计划完成程度(%)及实际产值资料如下,求平均完成计划程度。, 调和平均数的特点,如果数列中有一标志值等于零,则无法计算 ;,它作为一种数值平均数,受所有标志值的影响;但较之算术平均数, 受极端值的影响要小。,四、几何平均数(Geometric

20、mean),几何平均数又称“对数平均数”,是若干项变量值连乘积开其项数次方的算术根。,应用:,用于计算现象的平均比率或平均速度,1)简单几何平均数,适用于总体资料未经分组整理尚为原始资料的情况,式中: 为几何平均数; 为标志值的项数; 为第 个标志值。,几何平均数的计算方法,某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平均合格率。,分析:,设最初投产100A个单位 ,则第一道工序的合格品为100A0.95;第二道工序的合格品为(100A0.95)0.92; 第五道工序的合格品为(100A0.950.920.900.85)0.

21、80;,因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 100A0.950.920.900.850.80 则该流水线产品总的合格率为:,即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。,解:,思考,若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。,因各车间彼此独立作业,所以有 第一车间的合格品为:1000.95; 第二车间的合格品为:1000.92; 第五车间的合格品为:1000.80。则该企业全部合格品应为各车间合

22、格品的总和,即总合格品=1000.95+1000.80,分析:,不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为,应采用加权算术平均数公式计算,即,解:,这说明该厂车间产品平均合格率为92.31%,某机械厂有铸造车间、机加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为95%、92%、90%,求平均车间产品合格率。,2)加权几何平均数,适用于总体资料经过分组整理形成变量数列的情况,式中: 为几何平均数; 为第 组的次数; 为组数; 为第 组的标志值或组中值。,几何平均数的计算方法,某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8

23、,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第2年末的本利和为:, ,第12年末的本利和为:,分析:,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。,解:,分析,第1年末的应得利息为:,第2年末的应得利息为:,第12年末的应得利息为:, ,则该笔本金12年应得的利息总和为:=V(0.034+0.052+0.151),这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为,假定本金为V,所以,应采用加权算术平均数公式计

24、算平均年利息率,即:,解:,(比较:按复利计息时的平均年利率为6.85),受极端值的影响较 和 小, 几何平均数的特点,如果数列中有一个标志值等于零或负值,就无法计算G,是否为比率或速度,各个比率或速度的连乘积是否等于总比率或总速度,是否为其他比值,算术平均法,求解调和平均数的方法,数值平均数计算公式的选用顺序,指标,由定义可看出众数存在的条件:,五、众数(Mode),众数是在总体中出现次数最多的那个标志值。, 只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。,若有两个次数相等的众数,则称双众数。,下三图无众数:, 在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。

25、,某种商品的价格情况,众数M0=3.00(元),出现次数最多的标志值就是众数。,根据单项数列确定众数:,2.利用比例插值法推算众数的近似值。,1.确定众数所在组;,下限公式:,上限公式:,根据组距数列确定众数:,其中:,表中70-80,即众数所在组。, 众数的特点,众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受各单位标志值的影响,从而增强了对变量数列一般水平的代表性。不受极端值和开口组数列的影响。,众数是一个不容易确定的平均指标,当分布数列没有明显的集中趋势而趋均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。,六、中位数 (Median),将总体中

26、各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。,中位数把标志值数列分为两个部分,一部分标志值小于或等于它,另一部分标志值大于或等于它。,中位数的作用:,不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。主要用于测度顺序数据的集中趋势,表示现象的一般水平。,1、将标志值按大小顺序排列。2、确定中点位置。3、确定中位数。 当n是奇数时,则处于中间位置的标志值就是中位数;当n是偶数时,则处于中间位置的两个标志值的算术平均数就是中位数。,根据未分组资料确定中位数:,n为奇数时等于第(n+1)/2个数。n为偶数时等于第n/2和n/2+1个数的平均值,1,2 ,5,9 ,11

27、,中位数=5,1,2 ,5 , 9,11,18,中位数=(5+9)/2=7,1、计算各组的向上(或向下)累计频数2、确定中位数所在组 单项数列该组的标志值即为所求中位数 组距数列3、按公式计算中位数 下限公式 上限公式,根据分组资料确定中位数:,某村居民户按子女数分组资料如表所示,求家庭子女数的中位数。,单项数列,某企业按日产零件分组如下:,组距数列,根据下表资料计算农户年均纯收入中位数。,下限公式:,上限公式:, 中位数是一种位置平均数,不受极端值及开口组的影响,具有稳健性。, 各单位标志值与中位数离差的绝对值之和是个最小值。, 对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般

28、水平。,中位数的特点,(一),三者的关系,七、各种平均数之间的相互关系,用同一资料计算的结果,几何平均数大于调和平均数而小于算术平均数,只有当所有变量值都相等时,这三种平均数才相等。,1.当总体分布呈对称状态时,三者合而为一,(算术平均数 众数 中位数),2. 当总体分布呈非对称状态时,所以,当分布只是适当偏态时,三者之间的数量关系是:,根据卡尔皮尔逊经验公式,还可以推算出:,一组工人的月收入众数为2800元,月收入的算术平均数为3100元,则月收入的中位数近似值是:,(一)平均指标只能适用于同质总体,八、平均指标的运用原则,(二)用组平均数补充说明总平均数,(三)用分配数列补充说明平均数,第

29、四节 变异指标,(离散程度),1.可以衡量平均数代表性的大小,一、变异指标的含义和作用,各变量值远离其中心值的程度,称离中趋势。描述离中趋势用离散指标,也称变异指标,就是综合反映总体各单位标志值差异程度的指标。,变异指标的作用:,离散指标愈大,平均数代表性愈小;离散指标愈小,平均数代表性愈大。,甲、乙两学生某次考试成绩列表,甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。,甲、乙两钢铁企业某年第一季度供货计划完成程度统计表,两企业供货计划虽然都完

30、成了,但计划执行的均衡性不同,甲企业按月均衡地完成了规定的季度供货计划,而乙企业则前紧后松,缺乏均衡性。,2.可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。,3.确定抽样数目和计算抽样误差的必要依据,常用的离散指标主要有: 全距、平均差、标准差、方差、变异系数等。,在抽样推断中,计算抽样平均误差和必要抽样数目的时,都需要方差或标准差。,(一)全距(Range)的概念与计算:,二、全距 R,全距是总体各单位标志值最大值和最小值之差,用以说明总体中标志值变动范围的大小。,全距数值愈小,反映变量值愈集中,标志变动度愈小;全距数值愈大,反映变量值愈分散,标志变动度愈

31、大。,(二) 全距的特点, 优点:计算方便,易于理解。, 缺点:全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略方法,不能全面反映总体各单位标志的变异程度。,往往应用于生产过程的质量控制中。,三、平均差 A.D.,(一)平均差(Average Deviation)的概念和计算,平均差是数列中各单位标志值与平均数之间绝对离差的平均数。,平均差能够综合反映总体中各单位标志值变动的影响。平均差愈大,表示标志变异度愈大,则平均数代表性愈小;反之,平均差愈小,表示标志变异度愈小,则平均数代表性愈大。,平均差的计算:,1.未分组资料,2.分组资料,以某车间100个工人按日产量编成变量数列的资料:,

32、 平均差是根据全部标志值与平均数离差而计算 出的变异指标,能全面反映标志值的差异程度;, 平均差计算有绝对值符号,不适合代数方法的 演算使其应用受到限制。,(二)平均差的特点,四、标准差 S.D.()和方差,(一)标准差(Standard Deviation)概念和计算:,标准差是离差平方平均数的平方根,是方差的平方根,又称“均方差”。其意义与平均差基本相同。,1.未分组资料,2.分组资料,标准差的计算:,计算的一般步骤:, 算出每个变量值对平均数的离差; 将每个离差平方; 计算这些平方数值的算术平均数; 把得到的数值开平方,即得到。,标准差的简捷法公式,未分组资料,分组资料,对同一资料,所求

33、的平均差一般比标准差要小,即A.D.,(二)标准差与平均差A.D.的关系,(三)标准差的应用,1.测度分布偏度,2.计算标准分,3.在抽样推断时计算抽样误差。,交替标志的标准差,交替标志又叫是非标志。总体中的所有单位,如按某一标志分组,其中一部分具有某种特征,而另一部分不具有该种特征,它们在总体中会交替出现,则称此标志为交替标志。例如,将全部产品分为合格品与非合格品两组;将全部人口分为男性和女性两组等。,交替标志不是数量标志,而是品质标志,它的表现只有两种:“是”与“非”,或“有”与“无”等。要测定其平均数和标准差,须将标志表现性质上的差异转化为数量表现的差异。通常以1表示总体中具有某种性质的

34、单位的标志值;以0表示总体中不具有该种性质的单位的标志值。例如,将“合格品”用标志值1表示,则“不合格品”的标志值为0;将“男”的标志值定为1,则“女”的标志值就为0。通过这种转化,即可计算交替标志的平均数和标准差。,设总体单位数为 ,具有某种特征的单位数为 ,不具有某种特征的单位数为 。,假设具有某种特征的单位数占总体单位总数的比重为 ,不具有某种特征的单位数占总体单位总数的比重为 。,交替标志平均数和标准差计算表,交替标志的算数平均数为:,交替标志的标准差为:,某工厂生产10000件产品,其中不合格品100件,试求该批产品的平均合格率及其标准差。,解:该批产品的平均合格率,该批产品的标准差

35、,五、变异系数,变异系数,也称离散系数,是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。,标准差系数计算公式为:,离散系数值越小,说明平均数代表性就越好;离散系数值越大,说明平均数代表性就越差。,而断言甲组离散程度大于乙组,或乙组的平均数代表性高于甲组,都是不妥的。因为这两组的水平相差悬殊,应计算离散系数来比较:,分布形状的描述,集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据是否对称、偏斜的程度以及分布的扁平程度等,也就是数据的分布形状。分布形状的描述用偏度和峰度。,一、分布形状及其描述指标,(一)根据未分组的资料

36、计算偏度系数 其计算公式为:其中, 是标准差的三次方。,偏度是对分布偏斜方向和程度的测度。测度偏斜的程度需计算偏度系数。,偏度系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏度系数等于零;如果偏度系数不等于零,表明分布是非对称的。,二、偏度系数,(二)根据分组资料计算偏度系数 根据已分组的资料计算偏度系数,可采用下面的公式:,当分布对称时,离差三次方后正负离差可以相互抵消,因而SK的分子等于零,则SK=0; 当分布不对称时,正负离差不能抵消,就形成了正或负的偏度系数SK。 当SK为正值时,表示正偏离差值较大,可以判断为正偏或右偏;反之,当SK为负值时,表示负偏离差值较大,可以

37、判断为负偏或左偏。 在计算时,将离差三次方的平均数除以 是将偏度系数转化为相对数。SK的数值越大,表示偏斜的程度越大。,峰度是分布集中趋势高峰的形状。它通常是与标准正态分布相比较而言的。若分布的形状比标准正态分布更瘦更高,则称为尖峰分布。若比标准正态分布更矮更平则称为平峰分布。对数据分布峰度的度量值,称为峰度系数。,(一)根据未分组资料计算峰度系数,在根据未分组数据计算峰度系数K时,其计算公式如下:,三、峰度系数,(二)根据分组资料计算峰度系数,根据分组数据计算峰度系数是用离差四次方的平均数再除以标准差的四次方,其计算公式如下: 公式中将离差的四次方除以 是为了将峰度系数转化为相对数。用峰度系数说明分布的尖峰和扁平程度,是通过与标准正态分布的峰度系数进行比较而言的。标准正态分布的峰度系数为0,当K0时为尖峰分布,当K0时为扁平分布。,某班30名女生身高测量数据如下表所示,试求其偏度和峰度。,解:1、作计算表如下:,2、计算有关指标:,算术平均数标准差偏度系数峰度系数,谢谢观赏!,

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。