1、数据挖掘之推荐算法李新卫 10150513232016/4/9 1研究背景推荐算法logistic回归 协同过滤算法关联规则总结2016/4/9 21 推荐系统研究背景随着互联网的发展,人们处于信息爆炸的时代 截止 2011年底,全球 blog数量达到 1.81亿 腾讯 QQ的活跃账户数量达到 3个亿,同时在线数量达到 3000万 中国网站总数达 230万面对现阶段的海量数据信息,对信息的筛选和过滤成为衡量一个系统性能的指标,这时就需要一个用户体验良好的系统 将用户最感兴趣的信息展现在用户面前,推荐系统 应运而生 2016/4/9 3应运而生推荐系统用户购买或浏览的相关记录推荐 推荐系统是 根
2、据用户的兴趣特点和购买行为,向用户推荐其感兴趣的信息和商品。比如今天你想下载一部电影看,但当你打开某个下载网站时面对海量的下载资源可能手足无措,这时推荐系统会根据你的观影记录,为你推荐相关 电影2016/4/9 4豆瓣黑客帝国的推荐亚马逊机器学习 的 推荐应用 : 帮助 电子商务网站 为 顾客 购物提供个性化 的决策支持和信息服务2016/4/9 52 推荐算法逻辑斯 谛 回归( Logistic regression)是当前业界比较常用的学习方法,用于估计某事件的可能性。如某用户购买购商品的可能性、广告被某用户点击的可能性等A. Logistic regression2016/4/9 6 对数几率2016/4/9 7那么判定2016/4/9 8B. 协同过滤( collaborative Filtering)a) 基于用户的协同过滤算法是推荐系统中最古老的算法,又称为 KNN算法。可以毫不夸张地说,这个算法的产生标志着推荐系统的诞生。步骤: 找到与目标用户 A最相邻的 K个邻居,构成集合 将这个集合中用户喜欢的,且目标用户 A没有听说过的物品进行推荐2016/4/9 9b) 基于物品的协同过滤算法,使用目标用户评价过的项目集来预测用户可能感兴趣的的其他项目。比如给喜欢 射雕英雄传 的用户推荐 天龙八部 ,因为它们都是武侠剧,且作者都是金庸2016/4/9 10