机器学习是怎样的学科:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。机器学习主要分为两大类:监督学习、非监督学、强化学习(AlphaGo)、半监督学习。机器学习所要研究的主要内容是关于计算机在从数据中产生“模型”的算法,即“学习算法”。(有了学习算法,我们把经验提供给它,他就能基于这些数据产生模型)。学习的特点:数据驱动,以方法为中心,概率统计优化为基础。从数据中学得模型的过程称为“学习”或“训练”,这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”,每一个样本称为“训练样本”,训练样本组成的集合称为“训练集”。三要素:模型、策略、算法。学得模型后,使用其进行预测得过程称为“测试”。被测样本称为“测试样本”。机器学习的目标是使学得的模型能很好地适用于“新样本”。独立同分布学得模型适用于新样本的能力,称为“泛化”能力。具有强泛化能力的模型能很好地适用于整个样本空间。“奥卡姆剃刀”原则,是一种常用地、自然科学研究中最基础地原则,即“诺有多个假设与观察一致,则选最简单地那个”。(采用这