精选优质文档-倾情为你奉上一 实验目的通过对Iris数据进行测试分析,了解正态分布的监督参数估计方法,并利用最大似然估计对3类数据分别进行参数估计。在得到估计参数的基础下,了解贝叶斯决策理论,并利用基于最小错误率的贝叶斯决策对3类数据两两进行分类。二 实验原理Iris data set,也称鸢尾花卉数据集,是一类多重变量分析的数据集。其数据集包含了150个样本,都属于鸢尾属下的三个亚属,分别是山鸢尾 (Iris setosa),变色鸢尾(Iris versicolor)和维吉尼亚鸢尾(Iris virginica)。四个特征被用作样本的定量分析,分别是花萼和花瓣的长度和宽度。实验中所用的数据集已经分为三类,第一组为山鸢尾数据,第二组为变色鸢尾数据,第三组为维吉尼亚鸢尾数据。1.参数估计不同亚属的鸢尾花数据的4个特征组成的4维特征向量服从于不同的4维正态分布。以第一组为例,该类下的数据的特征向量服从于4维均值列向量,维协方差矩阵的4元正态分布。其概率密度函数为如下: 参数估计既是对获得的该类下的山鸢尾数据样本,通过最大似然估计获得均值向