1、信息过滤 (Information Filtering,IF)综述中科院计算所软件室 王斌2001.12.10主要内容l IF的基本概念l IF系统的分类l IF系统的组成l IF系统的评估l IF的现状及发展趋势一、基本概念定义l IF定义: 从 动态 的信息流中将满足用户兴趣的信息挑选出来,用户的兴趣一般在较长一段时间内不会改变 (静态 )。 Selective Dissemination of Information(SDI),来自图书馆领域。 Routing,来自 Message Understanding。 Current Awareness, Data MiningIF vs IR
2、/分类 /IEl IF&IR:广义地讲, IF是 IR的一部分 Database动态,需求静态; Database静态,需求静态 User Profile vs Query IF用户要对系统有所了解, IR不需要。 IF要涉及到用户建模 /个人隐私等社会问题l IF&Categorization Categorization中的 Category不会经常改变。相对而言, User Profile会动态变化l IF&IE IF关心相关性, IE只关心抽取的那些部分,不管相关性IF applicationsl Internet Search Results Filterl Personal Ema
3、il Filterl List Server/Newsgroup Filterl Browser Filterl Filter for childrenl Filter for customers: recommendation二、 IF分类体系IF分类示意图Initiative of operation l Active IF systems Collect and send relevant info to users Push to users Info overload, so make accurate user profilel Passive IF systems Not col
4、lect info for users Email or Usenet newsLocation of operationl At the info source Post profiles to info provider Clipping service Usually pay feel At a filtering server Info provider send info to server Serve distributed info to usersl At the user site Local filtering system Such as outlook & Netscape Email & Foxmail