从最大似然到EM算法浅解一、最大似然扯了太多,得入正题了。假设我们遇到的是下面这样的问题:假设我们需要调查我们学校的男生和女生的身高分布。你怎么做啊?你说那么多人不可能一个一个去问吧,肯定是抽样了。假设你在校园里随便地活捉了100个男生和100个女生。他们共200个人(也就是200个身高的样本数据,为了方便表示,下面,我说“人”的意思就是对应的身高)都在教室里面了。那下一步怎么办啊?你开始喊:“男的左边,女的右边,其他的站中间!”。然后你就先统计抽样得到的100个男生的身高。假设他们的身高是服从高斯分布的。但是这个分布的均值u和方差d2我们不知道,这两个参数就是我们要估计的。记作e=u,dT。用数学的语言来说就是:在学校那么多男生(身高)中,我们独立地按照概率密度p(x|e)抽取100了个(身高),组成样本集x,我们想通过样本集x来估计出未知参数e。这里概率密度p(x|e)我们知道了是高斯分布N(u,d)的形式,其中的未知参数是e=u,d+T。抽到的样本集是X二怜.叫,其中Xj表示抽到的第i个人的身高,这里N就是100,表示抽到的样本个数。由于每个样本