信息抽取及其应用研究信息抽取及其应用研究一、信息抽取概述o信息抽取(信息抽取(Information Extraction:IE)是指)是指从一段文本中抽取指定的一类信息从一段文本中抽取指定的一类信息(例如事件、例如事件、事实事实),井将其形成结构化的表示形式,井将其形成结构化的表示形式(比如数比如数据库等据库等),以供用户查询使用的过程。,以供用户查询使用的过程。o它是把文本里包含的信息进行结构化处理,变它是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的成表格一样的组织形式。输入信息抽取系统的是原始文本,输出的是固定格式的信息点。信是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。统一的形式集成在一起。http:/ Understanding conference,MUC)和自动内容抽取评测会议(Automatic Content Extraction,ACE)对推动信息抽取技术的发展起到重要作用。MUC由美国海军情报部门提出举行,主要目的也是处理大量海军军事情报