1、(2011届)毕业论文(设计)开题报告题目招生问答系统的设计学院专业信息管理与信息系统班级学号姓名指导教师开题日期教务处制一、选题的背景、意义随着互联网的普及,互联网上的信息越来越多,为人们提供了丰富的信息资源。而另一方面,人们却很难在杂乱无章的网络中快速、准确地获得自己想要的信息。虽然互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎还有很多缺点,并不能满足人们方便、快速、准确地获取信息的需要。自动问答技术正是为了满足人们的这种愿望而发展起来的。2010年6月,参加2010年高考的人数为976万,虽然人数比去年下降,但是由于从2005年以来各个高校的扩招,使得今年的录取
2、人数比往年增加了不少。随着网络和信息技术的快速发展,同时人们想更快地获取信息的愿望越来越强烈。这在招生工作中表现比较突出,每年到高考后填报志愿这段时间,上网查找招生信息和问询招生信息的学生和家长很多,学校通常组织多名工作人员守在计算机前进行问题的解答。在招生工作中,很多问题是一样的,如果将讯问多的问题和答案放入问答库,将常见问题让系统回答,则可以较少工作人员的工作量,同时,也能提高回答问题的时间。常用的问题集(FAQ)可以作为自动问答系统中的一个组成部分。它把用户经常提问的问题和相关答案保存起来,对于用户输入的问题,可以首先在常文问题库中查找答案。如果能够找到相应的问题,就可以直接将问题所对应
3、的答案返回给用户,而不需要经过问题;理解、信息检索、答案抽取等许多复杂的处理过程,提高了效率。国内今年来在该领域作了一些工作国内的这方面研究还很少。在信息检索领域,查询扩展是公认的能够有效提高查全率的技术之一,“其基本思想是利用与查询关键词相关的词语对查询进行修正,以找到更多的相关文档,提高查全率。”问答系统属于信息检索的一个分支,相比传统的基于关键词的检索,它具有更精确的检索结果。“自动问答系统既能用自然语言句子提问,又能为用户直接返回所需的答案,而不是相关的网页。所以我,问答系统能更好的满足用户的检索需求,能更快地找出用户所需的答案。可以说,问答系统就是新一代的搜索引擎。”最近几年,随着网
4、络和信息技术的快速发展,同时人们想更快地获取信息的愿望也重新促进了自动问答技术的发展。有越来越多的公司参与了自动问答技术的研究。最近,大量的问答系统开始出现。这些问答系统可以被分为两类一类是基于构建自己的检索系统和答案抽取系统。另一类是使用WWW作为知识库并且使用通用的搜索引擎(GOOGLE等)来获得与问题相关的信息然后做进一步的处理从而抽取出问题的答案。例如,该要回答的问题是写入一个或多个搜索引擎查询,然后再发送到谷歌搜索引擎。由谷歌返回的摘要进行评分对回答模式也产生的问题。类似的可行的答案,都聚集在一起,重新评分基于频率。QA42提出的三个答案得分最高的。鉴于现在的问答系统对答疑速度方面都
5、有一定的缺陷。现在需要设计的问答系统要把蕴涵丰富答疑材料的的文档库和常文问题库相结合,实现从文档中自动得到答案的策略。该方案会使得系统对常问问题能快速给出解答,提高了系统的效率和准确率;同时还能回答没有存储的大部分问题,大大增强系统的问答能力和实用性。同时,系统还应该提高问答的准确性和智能性。二、研究的基本内容与拟解决的主要问题1研究的基本内容通过研究招生问答系统的应用情况,查找已有的招生问答系统所存在的缺陷,针对存在的缺陷,从而进行改善。问答系统中一般存在大量的信息记录数据,如问答信息记录、注册终端信息记录等。所以要通过建立数据来存储信息内容。数据库是数据库应用程序的核心,通过分析建立管理员
6、、用户等数据表表,然后研究各模块应具备的功能,确定系统的开发工具,对整个系统进行构造。需开发系统包括以下几个模块(1)登录界面实现用户、管理员不同权限的登入。(2)用户管理管理员可以对普通用户进行信息的管理,设置权限。用户可以修改自己的密码。(3)留言版管理管理员对留言版进行管理。(4)问题管理管理员可以查询、删除、回答问题,而普通用户只能查询信息。(5)我的问题管理用户可以创建新的问题,查看问题的答复结果,同时也可以查看与自己类似的问题答复。2拟解决的主要问题(1)研究已有的招生问答系统模块存在的缺陷。(2)通过对用户、问题的管理,提高对问题的自动回答的准确性并对所提问题和知识库问题相似度比
7、较。三、研究的方法与技术路线、研究难点,预期达到的目标1研究的方法与技术路线选用VISUALCNET作为前台开发工具,SQLSERVER作为后台数据库。通过管理信息系统学等理论的学习提出问题(现有招生问答系统手段存在的弊端)分析问题(根据存在的问题和已有系统存在的缺陷提出解决方案)解决问题(招生问答系统的规划及实施)。具体技术路线如下图招生问答现状分析招生问答功能与功能分析系统总体规划系统实施系统开发策略2研究难点如何轻松地实现系统与用户的信息交互和个个功能的实现以及如何设计界面使得整个系统直观、明了,使用户能够容易的操作。最主要的是实现问题库的问题类型分类,关键词的提取和扩展。3预期达到的目
8、标1尽量利用现有的软硬件环境,及先进的管理系统开发方案,从而达提高系统开发水平和应用效果的目的。2高校在招生问答系统上或多或少地存在着一些弊端【10】,系统应满足高校的要求,满足高校相关人员日常管理,维护的需要。3采用模块化程序设计方法,使得每个功能模块一目了然,便于系统功能的各种组合和修改。系统应能方便用户的使用,促进高校人力资源有效利用和学生的方便。四、论文详细工作进度和安排2011011120110301了解招生问答系统的实现技术、软件功能及特点,确定待实现系统要完成的主要功能,进行系统的分析、设计及相应的实现、测试及调试工作。完成论文初稿。完成论文提纲。2011030120110315
9、论文初稿。2011031620110505毕业实习,论文完善。2011050620110520论文交指导老师审阅、评阅老师评阅。准备答辩材料。五、主要参考文献1BURKERD,HAMMONDKJ,KULYUKINV,ETALQUESTIONANSWERINGFROMFREQUENTLYASKEDQUESTIONFILESEXPERIENCESWITHTHEFAQFINDERSYSTEMPJAIMAGAZINE,1997,18;57662田萱,杜小勇,李海华语义查询扩展中词语概念相关度计算J软件学报,2008,19(8)204320533郑实福,刘挺,秦兵等中文自动问答系统综述J中文信息学报,2
10、002,6(16)46524JYOTIKAPRASAD,ANTONER,VOGTRIKUINOUEQA42WEBBASEDQUESTIONANSWERINGSYSTEMCCS224NFINALPROGRAMMINGASSIGNMENT,1115王树西,刘群,白硕问答系统研究综述中文信息学报,2002,16(6)46526陆汝钤世纪之交的知识工程与知识科学北京清华大学出版社,20017况立群,韩燮基于对象的XML知识表示方法期刊论文华北工学院学报,2002,23(6)8陈新中,蔺丽华,王道平面向对象的知识表示方法研究期刊论文西安矿业学院学报1999,19(4)9王树西,刘群,白硕基于动态知识库的
11、问答系统研究M语言计算与基于内容的文本处理,北京清华大学出版社,200358759210武旭,须德基于向量空间模型的文本自动分类系统的研究与实现期刊论文北方交通大学学报,2003,27(2)11EVOORHEESOVERVIEWOFTHETREC9QUESTIONANSWERINGTRACKAINPROCEEDINGSOFTHE9THTEXTRETRIEVALCONFERENCETREC9C,NIST,GAITHERSBURG,MD,2000,718012HOATRANGDANG1,DIANEKELLY2,ANDJIMMYLINOVERVIEWOFTHETREC2007QUESTIONANSWERINGTARCKJACL2003WORKSHOPONMULTILINGUALSUMMARIZATIONANDQUESTIONANSWERINGCMORRISTOWN,USAASSOCIATIONFORCOMPUTATIONALLINGUISTICS,2003,616813CKWORK,OETZIONI,ANDDSWELDSCALINGQUESTIONANSWERINGTOTHEWEBAINPROCEEDINGSOFTHE10THWORLDWIDEWEBCONFERENCEWWW2001C,HONGKONG,2001,150161