孙 斌北京大学计算机系计算语言所()文本信息提取技术 (概述 )内容( 1)信息提取的含义、目标( 2)信息提取技术中若干相关基础问题( 3) (中文 )信息提取系统的流程与设计( 4) Web信息提取1、 “信息提取 ”的含义举例说明:什么是信息提取 设想有一个用户,他关心人民日报中出现的一类特定的信息,即会议信息。属于 “ 单纯信息 ” :无相互关联、时序条件、因果等。 通常他是一篇一篇地看报,把其中报道会议的所有段落标记出来,然后对每一个会议信息填写如下一个表格(或者称其为 “ 会议信息模板 ” ): 会议信息 (填写预定义语义的表格 )会议时间 Time会议地点 Spot召集人 Convener姓名 /团体名称 Name机构、职位 Org/Post会议名 /标题Conf-Title会议信息一例会议报道(例 1) :人民日报 1998-03-09新华社北京月日电(记者李术峰) : 中国农工民主党第十二届中央常务委员会第一次会议今天在北京召开。会议研究通过了贯彻落实 “两会 ”精神的有关决定,审议通过了中国农工民主党中央年工作要点(草案),并任命了中央副秘书长。农工民主党中央主席蒋