1、统计学习方法考试大纲I.考查目标考试目标是测试考生全面和深入地掌握统计学习的基本概念和原理,了解统计学习领域中常用的算法、前沿研究内容、以及统计学习在大数据时代处理各类大数据中的应用。II.考试形式和试卷结构一、试卷总分及考试时间试卷总分为 100 分,考试时间 180 分钟。二、答题方式答题方式为闭卷、笔试。III考查内容第一章 线性回归2.1 一元线性回归2.1.1 估计系数2.1.2 评估参数的准确性2.1.3 评估模型的精度2.2 多元线性回归2.2.1 估计回归系数2.2.2 评估模型的精度与参数的准确性2.2.3 非线性回归第二章 分类方法3.1 Logistic 回归3.1.1
2、Logistic 模型3.1.2 估计回归系数3.1.3 大于两类的 Logistic 回归3.2 判别分析3.2.1 Bayes 定理3.2.2 p=1 时的线性判别分析3.2.3 p1 时的线性判别分析3.2.4 二次判别分析第三章 重抽样方法4.1 交叉验证4.1.1 Leave-one-out 交叉验证4.1.2 K 组交叉验证4.1.3 交叉验证与预测问题4.2 Bootstrap第四章 模型选择及规则化5.1 子集选择5.1.1 最佳子集选择5.1.2 逐步选择5.1.3 选择最优模型5.2 Ridge 回归与 LASSO 5.2.1 Ridge 回归5.2.2 LASSO5.3
3、降维方法5.3.1 主成分回归5.3.2 偏最小二乘第五章 基于树的方法6.1 决策树6.1.1 回归树 6.1.2 分类树6.2 随机森林6.2.1 Bagging 6.2.2 随机森林6.2.3 Boosting第六章 支撑向量机7.1 最大边缘分类7.1.1 超平面 7.1.2 基于分隔超平面的分类7.1.3 最大边缘分类7.2 支撑向量分类7.2.1 支撑向量 7.2.2 基于非线性决策边缘的分类7.3 支撑向量多分类7.3.1 一对一分类 7.3.2 一对多分类第七章 深度学习简介8.1 BP 神经网络8.1.1 神经网络的架构 8.1.2 反向传播算法8.2 卷积神经网络8.2.1
4、 卷积层 8.2.2 ReLU 和 Pooling 处理IV 主要参考书籍1 Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani. An Introduction to Statistical Learning with application in R. NewYork: Springer, 2013.2 Vapnik,V. Statistical Learning Theory. John Wiley and Sons,Inc.,1998.3 Richard J. Roiger, Michael W. Geatz 著, 翁敬农 译,数据挖掘教程. 北京: 清华大学出版社,2003.