1、问答系统综述与评测报告人:王树西2004-5-17提 纲1、问答系统综述2、问答系统评测3、引用的文章问答系统综述1、问答系统历史2、聊天机器人3、基于知识库的问答系统4、问答式检索系统5、基于自由文本的问答系统问答系统历史1、 1950年, A.M.Turing提出 “ 图灵测试 ” 1; 2、 John Searle提出 “ 中国人房子问题( Chinese Room) ” , 质疑图灵测试对测定计算机智能的意义有多大 2 ;3、 Searle否定不了图灵测试。 陆汝钤院士认为,图灵测试永远不可能在图灵定义的层面上真正的实现 368。4、 Jaseph Weizenbaum在 1966年实
2、现的 “ Eliza” , 是第一个问答系统;5、 1969年, ROBERT F.SIMMONS就指出:数据集的规模不同,开发问答系统所用的方法也是不同的。 更加难能可贵的是, ROBERT F.SIMMONS提出模式推理的思想 5。6、 1991年, Hugh Loebner设立 “ Loebner Prize” 39;7、 1999年, TREC QA Track;问答系统综述1、问答系统历史2、聊天机器人3、基于知识库的问答系统4、问答式检索系统5、基于自由文本的问答系统聊天机器人1、典型的聊天机器人 2、聊天机器人相关网站、公司3、 Loebner Prize 4、聊天机器人小结 典
3、型的聊天机器人1、 ELIZA7用的是模式及关键字匹配和置换的方法,没有发展成一套系统的技术。例如,假设有关键字 me和句型模式: (*you*me), 而且还有一个与该模式对应的置换规则:( what makes you think I * you), 那么,当输入句为 “ Yesterday you hurt me.” 时,输出为 “ What makes you think I hurt you?” 。 ELIZA另外一个明显的弱点是:一旦发现用户输入中的一个关键字(词),便马上寻求答案,而不继续寻找用户句子中其它的关键字(词),这样使得一些优先级别比较低的模式几乎永远不会被匹配到 。E
4、LIZA下 载 地址 之一: http:/ FRED系列 78 多个版本: Agent Max Headcold、 Milton Beasley、 Barry DeFacto、 FRED23、 JFRED ;于 1998年和 1999年,两次获得 “ Loebner Prize” 比赛的冠军 ;FRED可以从他人的会话中进行学习,然后把学来的经验用于自身的会话过程中。FRED下载地址: http:/ http:/ http:/atlas.kennesaw.edu/rgarner/robot/ 典型的聊天机器人(续)3、 ALICE741由宾夕法尼亚州 Lehigh大学的 Richard S.W
5、allac开发。获得 2000年度、 2001年度以及 2002年度的 “ Loebner Prize” 比赛冠军。它遵循 GNU通用公共许可协议的开放源代码,有 300多人对其发展做出了自己的贡献。 ALICE背后并没有复杂的算法,事实上, ALICE有 40,000 多个模板,也是采用了模式匹配的方法来检索最合适的回答。但 ALICE采用了一种很好的扩充机制, AIML文件可以进行内联,许多包含特殊领域知识的 AIML文件可以方便的合并成一个更大的知识库。并且, ALICE通过对聊天记录进行分析,可以得到尚且没有明确回答的问题,并给出建议的模式。 Alice所在网址: http:/www.
6、alicebot.org/4、 Eugene716 Eugene是一个非常优秀的聊天机器人,它响应速度快、答案较为确切、对用户问题的理解较为准确、答案与用户问题比较相关、答案 语句流畅且简短扼要,更加难得的是,它不但可以进行常识问答,而且可以进行知识问答,这说明它有一个知识库。Eugene所在网址: http:/ 5、 Jabberwock 717Jabberwock获 得 2003年 “Loebner Prize”冠 军 ,用 户 可以通 过 英 语 或者德 语 ,与 Jabberwock进行交 谈 。 Jabberwock懂得 20,000个 单词 ,并且可以 讲 笑 话 和 谜语 。Ja
7、bberwock所在网址: http:/www.abenteuermedien.de/jabberwock/index.php典型的聊天机器人(续)6、 Talk-Bot 719最初作 为 一个 Internet在 线 聊天系 统 ( Internet Relay Chatting , IRC), Talk-Bot 是 Chris Cowart 于 1998年用 javascript 和 PERL语 言 编 写完成的,并于 2001年和 2002年两次 获 得“Chatterbox Challenge”比 赛 的冠 军 。 Talk-Bot还 有一个名 为 Kylie - TTS BOT 的
8、“孪 生妹妹 ”,可以用 语 音回答用 户 的 问题 。Talk-Bot所在网址: http:/ - TTS BOT所在网址: http:/ 7、 Ultra Hal 728 Ultra Hal是一个聊天机器人系列, 有多个不同版本,包括: Original Web Hal、 Speech-Enabled Web Hal、 Teachable Web Hal、 Dubya Bot、 Hampy the Hamster Expert、 Uncensored Teachable Web Hal、 Create Your Own Chatter Bot。 Ultra Hal是由从事自然语言处理(Na
9、tural-Language Processing, NLP) 的公司 Zabaware Inc开发的。测试结果表明, Ultra Hal 响应速度快,言词贴切,是一个相当不错的聊天机器人。Ultra Hal所在网址: http:/ Hal下载地址: http:/ 典型的聊天机器人(续)8、 Niall 7Niall(The Non-Intelligent Acquired Language Learner)的作者是 Mat Peck。 系统运行之前, Niall的知识库是空的,但随着人机交谈的进行, Niall不断的从用户那里学习知识并存储起来,所以 Niall的知识越来越多。例如,用户输入
10、一条知识 “ Dog is an animal.” , 然后紧接着提问 “ Whats dog?” , 系统回答 “ Dog is an animal.” 。 虽然 Niall还比较粗糙,但它代表了一个重要的研究方向:从会话中学习知识。Niall 下载地址: http:/ 9、 Cyber Ivar 733Cyber Ivar是 Jaczone的产品, Cyber Ivar向人们提供软件工程方面的知识,例如 UML(Unified Modeling Language)。测试结果表明, Cyber Ivar响应速度快,能正确理解用户问题,并且给出的答案准确、全面。在回答 UML、 WayPoin
11、ter和 Jaczone之类的问题时, Cyber Ivar给出的 答案相当准确、全面;对于常识性问题,它给出的答案也比较贴切。令人惊异的是,对于用户的提问 “ who is Maozedong?” , Cyber Ivar竟然回答: “ he was a Chinese communist who reigned from 1949 until his death in 1983.” , 在 Cyber Ivar的知识库中,竟然有这么一条关于“ Maozedong( 毛泽东) ” 的知识(虽然这是一条错误的知识),这实在让人惊异,这说明Cyber Ivar的知识库还是挺大的 。 应该说, Cyber Ivar不但可以进行常识问答,而且可以进行知识问答。 Cyber Ivar是一个相当优秀的聊天机器人。Cyber Ivar 所在网址: http:/