1、第十章:统计学习与推理普通高等教育“十二五 ”规划教材生物信息学Bioinformatics第一节 统计学习与推理基础一、 fisher经典参数统计理论fisher把判别分析、回归分析 和密度估计问题等表达为特定参数化模型的参数估计 问题,并 提出了估计所有模型未知参数的 方法 最大似然法。二、经典非线性法ANN( artificial neural network)三、小样本统计学习理论(一) VC维(二)推广性的界对各种类型的函数 集,统计 学习理论系统地研究了其经验风险与期望风险之间的 关系 , 即推广 性的 界。(三)结构风险最小(四)小样本与转导推理四、基于概率的方法基于概率的方法主
2、要包括贝叶 斯 (Bayes)推理及隐马尔可夫 模型 (hidden Markov model,HMM),其中 贝叶斯推理需利用来源于经验和历史资料的先验 信息。第二节 统计模型与参数推断一、参数估计量的评选标准(一)无偏性参数估计量的期望值与参数真值是相等 的,这种 性质称为无偏 性。具有 无偏性的估计量 称为无偏估计量。(二)有效性(三)相合性(四)充分性与完备性二、最小二乘估计三、最大似然估计(一)似然函数对于离散型 随机变量,似然函数 是多个独立事件的概率函数的 乘积,该 乘积是概率函数 值,它 是关于总体参数的 函数。例: 一只大口袋里有 红、白 、 黑 3种球,采用 复置 抽 50次,得到红、白、黑 3种 球的个数分别 为 12、 24、 14,根据 多项式的 理论建立 似然 函。(二)最大似然估计所谓最大似然估计就是指使似然函数值为最大以获得总体参数估计的 方法。例:求红 、 白 、 黑球 实例 中 的最大似然估计 值 。第三节 聚类分析、主成分分析与Fisher判别一、聚类分析(一)数据变换(二)亲疏程度测度