1、 概率论与数理统计大作业 题 目: 还原正态分布之高斯推导过程 学 院: 化学工程学院 姓 名: 赵振华 学 号: 1403020128 班级序号: 14 专业班级: 装控 1407 任课教师: 李明 2016 年 4月 27 日 还原正态分布之 高斯推导过程 摘要 : 正态分布 是 概率中最重要的分布,其发现极大的促进了概率论和数理统计的发展,虽然正态分布的获得过程本身包含 着 大量 的 数理统计思想,对之有详尽的了解 有益于 对其他理论的理解,但 其 推导过程一般少见于统计著作,因此本文将正态分布函数形式的推导过程还原与众,弥补众多著作的正态分布的发现和推导过程。 背景 前言 正态分布又
2、称高斯分布,是由数学家 棣莫弗 和 数学王子高斯各自独立发现的, 1733 年 , 棣莫弗 有 二项分布的逼近推导出正态分布, 1809年高斯 在推导误差分布函数是发现正态分布,两位数学家在不同的数学文化背景下,采用不同的方式得到相同的正态分布,可谓知识都是相同的,两种方式可相互证明,更体现正态分布的客观性和科学性 。中心 极限定理 表明: “任何随机分布当样本足够大时 , 都会逼近正 态分布 。 ”正态分布在 数理统计 研究历史上具有里程碑式的意义。但是正态分布 的推导过程能被统计学著作提到的少之又少,又有许多想本人一样的学生对正太分布的来源和其 推导 过程有着强烈的兴趣,于是几 费 周折在
3、 陈希孺 院士 数理统计学简史 一书上找到一两百字的有关介绍,再结合其他资料整理得到两种推导过程,但是本人还是大二,目前只能理解和深入研究高斯的推导过程,故本主要介绍了高斯的正态分布 的 推导过程。 1、 高斯 正态分布之推导 最初 的 高斯 密度分布函数思想动机来源于对误差 规律 的认识。 众所周知,随机误差属于一种典型的随机变量。直觉上,对一 个物体的测量,用多次测量的结果的算术平均数作为总体平均真值的估计肯定优于用单次测量结果作为其估计值,而且似乎并不存在其它更好的估计量。那么误差随机变量所服从的分布或者说其密度函数一定是这么一个“周密”的函数,它总能使样本的算术平均数成为总体真值估计量
4、中最优良的估计量。 设 总体真值为 X,测量误差的随机样本 为 X1,X2,X3,X4, , Xn, 设误差密度函数为 f(x), 那么这些误差的出现概率为 L(x)=f(X1-X)f(X2-X)f(X3-X)f(Xn-X) (1) 要找出最有希望的误差函数应使 L(x) 达到 最 大 , 高斯认 为 ( X的算术平均数) 就是 X 的估计值 , 并使 L(X) 取得极大值 。 对 ( 1) 式 两边同时取对数 lnL(x) = ( )=1( 2) 对 (2)式两边同时求导 d(lnL(x)dx = (_ )( )=1( 3) 引入 辅助函数 g(x) = ()(),又 因为 X=时 L(x)
5、取 最大值 , 所以 ( )=1= 0 (4) 伽利略认为 : 观测误差对称的分布在 0 的两 侧 , 拉普拉 斯 给出误差分布 f(x) 应满足 g(x) = g(x), 又因为 f(x)是 连续函数,所以 f(x)是奇函数, 所以 g(x)也是 奇函数,有 -g(x)=g(-x), g(0)=0。 X1,X2,X3,X4, , Xn 是 随机变量,可任意取值,不妨取自然是 m 使 得n=m+1, 且令 X1=X2=X3=X4=Xm=-X, Xn=mX,所以 = + = 0 所以 (4)式 可转化为 mg(x) +() = 0, 因为是奇函数所以 mg(x) = () (5) (5)式 对一
6、切自然数 m 和实数 X 都 成立,而唯一满足 (5)式 的 连续方程是 g(x) = 即 ()() = ,积分 可得 f(x) = k122 (6) 由 ()+ = 1, 应有 c 0, 取 c = 12, 则有 k = 12, 所以 f(x) = 12222 推导 完毕! 2、 正态推导 过程之思考 高斯 的推导过程有几个极具创新 性 的地方 2.1 在 给定总体密度 f(x)的 条件下,什么样的 X 才能使 L(x)的 至最大 ,则这个取值就是总体真值的估计值,在这个基础上非常创新的让样本空间的算术平均值作为 X 的估计值,然后 逆向 思维 确定 之后 再寻找这么 一个密度函数 f(x)
7、。 2.2 确定 f(x)之后 求解 ( )=1 = 0 方程 时得出结果 mg(x) =(), 这中间的过程是一个值得思考的过程,也是本人在阅读文献时 理解起来比较费劲的一部分,不是一般人能想到的。 3、 结论 将 正态分布的高斯推导过程还原与众,尽管只是站在一个角度、一个方面还原了正态分布,但 其 实际意义远不止对 该 推导过程 本身 的掌握,更是在于对 高斯 核心统计思想的深刻体会,学习他创新性的研究视角和研究 手段 ,具有极高的显示理论价值。 参考 文献 1 徐传胜 ,张梅东 .正态分布两发现过程的数学文化比较 J.纯粹数学与应用数学 ,2007,23(1):137-144.DOI:1
8、0.3969/j.issn.1008-5513.2007.01.029. 2 李津委 . 正 态 分 布 源 泉 的 追 溯 与 启 示 J. 成 都 教 育 学 院 学报 ,2004,18(z1):56-57.DOI:10.3969/j.issn.1674-6120.2004.z1.029. 3 尉迟江 . 对 高 斯 分 布 函 数 形 式 的 推 导 J. 统 计 与 信 息 论坛 ,2009,24(5):3-6.DOI:10.3969/j.issn.1007-3116.2009.05.001. 4 陈希孺 数理统计学简史 M长沙:湖南教育出版社, 1998: 125 127 5 李贤平 . 概率论 基础学习指导书 . 北京 :高等教育出版社, 2011.1