机器学习期末复习15页.docx_文客久久网wenke99.com

资源描述

机器学习是怎样的学科：致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。机器学习主要分为两大类：监督学习、非监督学、强化学习（AlphaGo）、半监督学习。机器学习所要研究的主要内容是关于计算机在从数据中产生“模型”的算法，即“学习算法”。（有了学习算法，我们把经验提供给它，他就能基于这些数据产生模型）。学习的特点：数据驱动，以方法为中心，概率统计优化为基础。从数据中学得模型的过程称为“学习”或“训练”，这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”，每一个样本称为“训练样本”，训练样本组成的集合称为“训练集”。三要素：模型、策略、算法。学得模型后，使用其进行预测得过程称为“测试”。被测样本称为“测试样本”。机器学习的目标是使学得的模型能很好地适用于“新样本”。独立同分布学得模型适用于新样本的能力，称为“泛化”能力。具有强泛化能力的模型能很好地适用于整个样本空间。“奥卡姆剃刀”原则，是一种常用地、自然科学研究中最基础地原则，即“诺有多个假设与观察一致，则选最简单地那个”。（采用这

展开阅读全文