机器学习入门 蒋龙 2012年6月17日Outline 计算机自动从数据中发现规律,并应用于 解决新问题 给定数据(X 1 ,Y 1 ), (X 2 ,Y 2 ), ,(X n ,Y n ) ,机器自动学 习X 和Y 之间的关系,从而对新的X i ,能够预测Y i 垃圾邮件识别:( 邮件1, 垃圾), ( 邮件2, 正常), ( 邮件3, 垃圾), ( 邮件N, 正常) 邮件X = 垃圾or正常? 从输入规则到 输入数据 从机器执行到机器决策 什么是机器学习基于规则的问题解决框架 测试数 据 发现规律 预测 预测结果 规则 邮件X i Y i :垃圾or 正常 1. 发件人邮件地址 异常; 2. 标题含有“ 低价 促销” 3. 机器学习执行框架 训练数 据 测试数 据 学习 预测 预测结果 模型 训练过程 应用过程 (X 1 ,Y 1 ) (X 2 ,Y 2 ) (X n ,Y n ) X i Y i 1, 8, 27, 64, ? 125 f(n) = n3 1, 3, 6, 10, ? 15 f(n)=f(n-1)+n f(n) = (n2+n)/2 智商测试 1, 3, 6, 1