精选优质文档-倾情为你奉上IRIS数据集下基于最小错误率和最小风险的贝叶斯决策的实验与分析贺翔硕51011. 问题描述1.1Iris数据集Iris数据集包含3类4维样本,分别标为1, 2, 3。其中, 每类样本数目为50, 且服从正态分布,每个数据样本有4个特征向量,分别代表萼片长度, 萼片宽度, 花瓣长度和花瓣宽度。1.2要求假设Iris数据是正态分布的,要求考虑各种实验可能性(分组数量、分组策略、先验概率等),用样本对多维正态密度函数进行参数估计(均值向量和协方差矩阵),最后对3类Iris两两分类。2. 原理描述2.1贝叶斯公式已知共有类别,统计分布为正态分布,已知先验概率及条件概率密度函数,对于待测样品,贝叶斯公式可以计算出该样品分属各类别的概率,即后验概率。贝叶斯公式为因此给定一个未知类别的数据样本,贝叶斯分类法将预测属于具有最高后验概率的类。故此问题的数学描述为:多元正态概率模型下的贝叶斯分类。2.2参数估计其中,条件
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。