第十九章 二项分布A基本概念二项分布的来源二项分布的正态近似比率z检验本书前面的章节主要介绍了参数统计的方法,如果变量为等距或等比数据,且数据分布服从正态分布(或t分布等),那么我们可以采用参数统计方法进行分析。如果所有数据都是称名或者顺序数据,或者等距/等比数据不满足参数统计的分布假设,就需要采用非参数统计方法。比如,期末考试6道判断题,一个学生她答对多少道题才算她考试通过呢?对于这样的问题,即使这个学生完全不会,那她也很可能蒙对3道题,那她蒙对4道、5道、6道的概率是多少呢?根据概率的乘法原则,几个独立事件同时出现的概率等于这些事件发生概率之积。这样做对X道题的概率为这个公式代表的分布称为二项分布。当一个事件或者观察可以被分类到两个具有一定发生概率的类别中的一个且是唯一一个时(男女、对错等),就可能产生一个二项分布,也成为伯努利分布;这样的事件被称为二分事件。对应的两个类别的概率通常用P和Q表示,P+Q=1.扔硬币就是一个典型的二分事件,P=Q=0.5,随着试验次数(扔的次数)N增加,二分事件所对应的发生概率P和Q不会变化。通常把第一类别(概率P的时间)的实验次数称为X,即二项分布