1、经济、管理基础课程统计学原理1 - 1数理统计统计学经济、管理基础课程统计学原理1 - 2第一章 绪论n1 1 什么是数理统计n1 2 数理 统计几个基本概念n1 3 抽样分布经济、管理基础课程统计学原理1 - 3学习目标1. 理解数理统计的涵义2. 理解了解统计研究对象的特点3. 了解统计研究的基本环节4. 了解统计学的产生与发展过程5. 重点掌握数理统计的基本概念与抽样分布经济、管理基础课程统计学原理1 - 41 1 什么是数理统计一、统计( Statistics)的涵义我们先从数理统计学开始,数理统计学是研究收集数据、分析数据并据以对所研究的问题作出一定的结论的科学和艺术。数理统计学所考
2、察的数据都带有随机性(偶然性)的误差。这给根据这种数据所作出的结论带来了一种不确定性,其量化要借助于概率论的概念和方法。数理统计学与概率论这两个学科的密切联系,正是基于这一点。 Statistics: the science of collecting, analyzing, presenting, and interpreting data. (不列颠百科全书)经济、管理基础课程统计学原理1 - 5统计学起源于收集数据的活动,小至个人的事情,大至治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记载。现今各国都设有统计局或相当的
3、机构。当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问 数理统计学的内容。 经济、管理基础课程统计学原理1 - 6这样的统计学始于何时?恐怕难于找到一个明
4、显的、大家公认的起点。一种受到某些著名学者支持的观点认为,英国学者葛朗特在 1662年发表的著作 关于死亡公报的自然和政治观察 ,标志着这门学科的诞生。中世纪欧洲流行黑死病,死亡的人不少。自 1604年起,伦敦教会每周发表一次 “死亡公报 ”,记录该周内死亡的人的姓名、年龄、性别、死因。以后还包括该周的出生情况 依据受洗的人的名单,这基本上可以反映出生的情况。几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。他因这一部著作被选入当年成立的英国皇家学会,反映学术界对他这一著作的承认和重视。 图 1英国约克大学葛朗特图 2
5、 帕齐利 经济、管理基础课程统计学原理1 - 7这是一本篇幅很小的著作,主要内容为 8个表,从今天的观点看,这只是一种例行的数据整理工作,但在当时则是有原创性的科研成果,其中所提出的一些概念,在某种程度上可以说沿用至今,如数据简约(大量的、杂乱无章的数据,须注过整理、约化,才能突出其中所包含的信息)、频率稳定性(一定的事件,如 “生男 ”、 “生女 ”,在较长时期中有一个基本稳定的比率,这是进行统计性推断的基础)、数据纠错、生命表(反映人群中寿命分布的情况,至今仍是保险与精算的基础概念)等。 葛朗特的方法被他同时代的政治经济学家佩蒂引进到社会经济问题的研究中,他提倡在这类问题的研究中不能尚空谈
6、,要让实际数据说话,他的工作总结在他去世后于1690年出版的 政治算术 一书中。 经济、管理基础课程统计学原理1 - 8图 4: 高斯 当然,也应当指出,他们的工作还停留在描述性的阶,不是现代意义下的数理统计学,那时,概率论尚处在萌芽的阶段,不足以给数理统计学的发展提供充分的理论支持,但不能由此否定他们工作的重大意义,作为现代数理统计学发展的几个源头之一,他们以及后续学者在人口、社会、经济等领域的工作,特别是比利时天文学家兼统计学家凯特勒 19世纪的工作,对促成现代数理统计学的诞生起了很大的作用。 数理统计学的另一个重要源头来自天文和测地学中的误差分析问题。早期,测量工具的精度不高,人们希望通
7、过多次量测获取更多的数据,以便得到对量测对象的精度更图 3 拉普拉斯 经济、管理基础课程统计学原理1 - 9高的估计值。量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家 拉普拉斯 曾对这个问题进行了长时间的研究,现今概率论中著名的 “拉普拉斯 分布 ”,即是他在这研究中的一个产物,这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德 19世纪初( 1805)在研究慧星轨道计算时发明的 “最小二乘法 ”,他在估计过巴黎的子午线长这一工作中,曾使用这个方法。现今著作中把这一方法的发明归功于 高斯 ,但 高
8、斯 使用这一方法最早见诸文字是 1809年,比勒让德晚。一种现在逐步取得公认 这项发明系由二人独立做出,看来使比较妥当的。另外一个重要成果是德国大学者高斯 1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。正态分布也常称为 高斯 分布,其曲线是钟形,极象颐和园中玉带桥那样的形状,故有时又称为 “钟形曲线 ”,它反映了这样一种极普通的情况:天下形经济、管理基础课程统计学原理1 - 10图 4: 高斯 图 5:连续型随机变量 天下形形色色的事物中, “两头小,中间大 ”的居多,如人的身高,太高太矮的都不多,而居于中间者占多数 当然,这只是一个极粗略的描述,要作出准确的描述,须动用高等
9、数学的知识。正是其数学上的特性成为其广泛应用的根据。 正态分布在数理统计学中占有极重要的地位,现今仍在常用的许多统计方法,就是建立在 “所研究的量具有或近似地具有正态分布 ”这个假定的基础上,而经验和理论(概率论中所谓 “中心极限定理”)都表明这个假定的现实性,现实世界许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。大批生产的产品,其质量指标各有差异 。看来毫无规则,但它们在总体上服从正态分布。这一点,显示在纷乱中有一种秩序存在,提出正态分布的 高斯 ,一生在多个领域里面有不少重大的贡献,但在德国 10马克的有 高斯 图像的钞票上,单只画出了正态曲线,以此可以看出人们对他这一贡献评价之高。