基于本体的武器装备定题爬虫设计与实现 ——本体的研究与构造-毕业论文.doc

上传人:滴答 文档编号:1272926 上传时间:2019-01-26 格式:DOC 页数:38 大小:471.50KB
下载 相关 举报
基于本体的武器装备定题爬虫设计与实现 ——本体的研究与构造-毕业论文.doc_第1页
第1页 / 共38页
基于本体的武器装备定题爬虫设计与实现 ——本体的研究与构造-毕业论文.doc_第2页
第2页 / 共38页
基于本体的武器装备定题爬虫设计与实现 ——本体的研究与构造-毕业论文.doc_第3页
第3页 / 共38页
基于本体的武器装备定题爬虫设计与实现 ——本体的研究与构造-毕业论文.doc_第4页
第4页 / 共38页
基于本体的武器装备定题爬虫设计与实现 ——本体的研究与构造-毕业论文.doc_第5页
第5页 / 共38页
点击查看更多>>
资源描述

1、厦门大学本科毕业论文 1 本科毕业论文 题 目: 基于本体的武器装备定题爬虫设计与实现 本体的研究与构造 姓 名: 学 院:软件学院 系:软件工程 专 业:软件工程 年 级: 学 号: 指导教师(校内): 职称: 指导教师(校外): 职称: 年 月 厦门大学本科毕业论文 2 武器装备本体在定题爬虫中的应用 本体的研究与构造 【摘要 】 本文针对武器装备领域信息资源分布、异质、异构,并且缺乏有效描述该领域资 源的武器装备本体及开发方法,导致用户在查询该领域的资源时检索效率低的现状,在分析本体表示领域知识的理论、方法、特征及其形式化语言的基础上,引入软件工程的方法,从工程的角度,探索开发武器装备领

2、域本体的方法,提出了开发武器装备本体的模型。在武器装备专家的指导下,以反击式水轮机供应商的本体开发为例具体分析了创建一个标准的、可扩展、独立于运行环境的武器装备本体过程 ;并编程实现了基于 Jena 的武器装备本体中立存贮及其概念隐含语义的查询,从而使武器装备本体能够成为用户、应用理解武器装备领域资源知识的媒介。从技术层面上分 析了实现武器装备领域知识的共享和重用的条件,以进一步推动武器装备本体在其领域的应用。 本文最后设计了一个基于武器装备本体的智能信息检索原型系统,以验证武器装备本体对检索武器装备领域的信息资源影响。该原型系统向用户提供概念查询和语义查询,其实际上是在武器装备本体表示概念显

3、性和隐性关系的基础上进行精确查找,提高了用户的查准率,实现了对该领域资源的智能化检索,这是传统 Web 检索系统所不能达到的。该系统为进一步研究本体在应用中实现领域知识共享和重用打下良好的基础。 【关键词】 武器装备 查询系统 本体 protg OWL 厦门大学本科毕业论文 3 【 Abstract】 This article in view of weaponry domain information resource distribution, neterogeny, isomerism, and lacks effectively describes this domain resour

4、ces weaponry Ontology and the method of exploitation, causes the user when inquires this domain resources to retrieve the efficiency low present situation, in the analysis Ontology expressed the domain knowledge theory, the method, the characteristic and in the formalized language foundation, introd

5、uces the software engineering the method, from the project angle, the exploratory development weaponry domain Ontology method, proposed the development weaponry Ontology model. In under the weaponry experts instruction, developed take the reaction water turbine suppliers Ontology as the example anal

6、yzes specifically founded one standard, may expand, be independent in the movement environment weaponry Ontology process; And programmed has realized based on the Jena weaponry Ontology eutrality storage and the concept concealment semantics inquiry, thus enabled the weaponry Ontology to become the

7、user, the application understanding weaponry domain resources knowledge medium. Has analyzed the condition from the technical stratification plane which realization weaponry domain knowledge sharing and entrusts with heavy responsibility, by further impels the weaponry Ontology in its domain applica

8、tion. This article finally has designed one based on the weaponry Ontology intelligence information retrieval prototype system, confirms the weaponry Ontology to retrieve the weaponry domain the information resource influence. This prototype system provides the concept inquiry and the semantic inqui

9、ry to the user, it in fact is in the weaponry Ontology expressed the concept dominance and in the recessive relations foundation carries on the precise search, enhanced users accuracy ratio, has realized to this domain resources intellectualized retrieval, this is the traditional Web retrieval syste

10、m cannot achieve.This system for further studies the Ontology to realize the domain knowledge in the application to share and to entrust with heavy responsibility builds the good foundation. 【 Key words】 Weaponry inquiry system Ontology protg OWL 厦门大学本科毕业论文 4 目录 第一章 绪论 8 第二章 本体相关 概念 10 2.1 本体定义 10 2

11、.2 本体知识表示的特点 11 2.3 现有本体分类 12 2.4 本题研究动向 12 第三章 开发工具和语言 13 3.1 Protg 13 3.2 OWL 13 3.3 JENA 14 3.4 MYSQL 14 第四章 本体构造理论 15 4.1 武器装备本体构造的技术路线 15 4.2 武器装备本体的设计原则 15 4.3 武器装备本体的生命周期模型 16 4.4 武器装备本体的开发 16 4.4.1 武器装备领域概念层次的确定 16 4.4.2 非形式化武器装备本体模型创建 17 4.4.3 形式化武器装备本体模型创建 17 第五章 武器装备本体存贮及查询 19 5.1 武器装备本体存

12、贮方式的选择 19 5.2 武器装备本体中存贮的实现 20 5.3 武器装备本体查询分析 20 5.3.1 查询语言 RDQL 21 5.3.2 概念显式关系查询 21 厦门大学本科毕业论文 5 5.3.3 概念隐式关系查询 22 5.4 武器装备本体中查询流程设计 22 5.5 查询系统框架 26 5.5.1 客户端 27 5.5.2 服务器端 28 5.6 查询过程分析 30 5.6.1 简单查询 30 5.6.2 复杂查询 30 5.7 查询系 统实现框架 31 第六章 搜索结果分析 33 6.1 搜索结果分析 33 6.2 改进的搜索结果分析 34 总结 37 厦门大学本科毕业论文 6

13、 CONTENTS chapter 1 Introdoction 8 chapter 2 Ontology related concept 10 2.1 main bodies define 10 2.2 Ontology knowledge expression characteristic 11 2.3 existing main bodies classify 12 2.4 main subjects study the trend 12 chapter 3 development kit and the language 13 3.1 Protg 13 3.2 OWL 13 3.3 J

14、ENA 14 3.4 MYSQL 14 chapter 4 Ontology structure theory 15 4.1 weaponry Ontology structure technical route 15 4.2 weaponry Ontology principle of design 15 4.3 weaponry Ontology life cycle model 16 4.4 weaponry Ontology development 16 4.4.1 weaponry domain concept level determination 16 4.4.2 non-for

15、malization weaponry Ontology model founds 17 4.4.3 formalization weaponry Ontology model to found 17 chapter 5 weaponry Ontology to store and the inquiry 19 5.1 weaponry Ontology stores the realization 19 5.2 weaponry Ontology which the way in the choice 20 5.3 weaponry Ontology stores to inquire th

16、e analysis 20 5.3.1 query language RDQL 21 5.3.2 concept explicit relations inquiry 21 厦门大学本科毕业论文 7 5.3.3 concept implicit expression relations inquires 22 5.4 weaponry Ontology to inquire the flow to design 22 5.5 inquiry system frame 26 5.5.1 client sides 27 5.5.2 server ends 28 5.6 inquiry proces

17、s analysis 30 5.6.1 simple inquiries 30 5.6.2 complex inquiries 30 5.7 inquiry system realization frame 31 chapter 6 search result analyses 33 6.1 search result analysis 33 6.2 improvement search result analyses 34 summaries 37 厦门大学本科毕业论文 8 第一章 绪论 随着互联网的兴起及发展,人们获取信息的途径由传统方式逐渐被网络替代。起初,人们主要通过浏览网页来获取所需

18、信息,但随着 Web 不断庞大,用这种方式来寻找自己所需的信息变得越来越困难。现在,大多数的人很大程度上依赖于搜索引擎来帮助自己获取有用信 息,因此搜索引擎技术作为最典型的 Web信息获取技术,其发展直接影响人们获取信息的质量。 在这种背景下, 搜索引擎 (Search Engine),例如传统的通用搜索引擎AltaVista, Yahoo 和 Google 等,作为一个辅助人们检索信息的工具成为用户访问 互联网 的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性 , 如: (1) 不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的网页。

19、 (2) 通用搜索引擎的目标是尽可能大的网络覆盖率,有限的搜索引擎服务器资源与无限的网络数据资源之间的矛盾将进一步加深。 (3) 互联网上 数据形式的丰富和网络技术的不断发展,图片、数据库、音频/视频多媒体等不同数据大量出现,通用搜索引擎往往对这些信息含量密集且具有一定结构的数据无能为力,不能很好地发现和获取 。 (4) 通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。 为了解决上述问题,定向抓取相关网页资源的 定题 爬虫应运而生 , 定题爬虫会根据特定的抓取目标,有选择地访问网络链接,并迅速获取网络上特定主题的大量信息,因而对专业搜索引擎或需获取某主题信息进行数据 挖掘

20、的应用具有极大的价值,为了实现特定领域信息的获取 ,需要某种主题过滤策略。目前通用的做法是根据网页中的关键词判定 . 但由于存在一词多义及一义多词的现象,这种基于关键词的判定策略已被证实精确度不高。而本体具有良好的概念层次结构和对逻辑推理的支持,特别适合于语义信息模型的建立。从知识共享的角度看,本体可以看作是一种概念化的显式说明,是对客观存在的概念和关系的描述,已能厦门大学本科毕业论文 9 够将隐含在分析者的头脑中的或将实现者的程序中的概念模型表达出来,有助于实现语义查询。将本体技术应用在信息系统中提供语义信息模型的支持,增强系统的 查询能力,已经成为应用的共识。 厦门大学本科毕业论文 10

21、第二章 本体相关概念 2.1 引言 本体来自希腊词汇, onto 表示 being, logos 表示 to reason,最初是哲学上的一个分支,用来表示事物的本质和组织。虽然这个术语在 17 世纪诞生,但是它和亚里斯多德在公元前四世纪所给出的定义 (Metaphysics)同义,哲学家们用它来回答一些基本的问题如 “什么 是本质 ?”,“ 所有事物的一般特征是什么 ?”。 本体在计算机领域研究的应用和人工智能 (AI), 信息技术的发展密切相关。在 AI 领域,为 了建立相关领域的通用知识 库,需要考虑在一个领域中哪些知识是可以复用的或共享的, 以及怎样获取和描述一个领域中的一般性知识等问

22、题 ; 在数据库管理系统领域,虽然数据库技术己经成熟,但是数据库的异构给数据的集成和共享带来很多困难 ;在软件工程领域,应用程序需要具体、统一的领域建模形式化基础而实现软件的复用。这三个领域的发展都需要解决对特定领域的概念进行通用的描述,这正是本体回答的问题。 2.2 本体定义 本体以一种明确的、形式化的方式表示领域概念及其之间的关系,成为人、机器、应用程序对概念语义达到共同理解的 媒介,在应用间实现知识的共享及重用。随着对本体认识和研究的深入,对本体的描述也在不断变化发展中。在 AI领域,最早给出本体定义是 Neches 等人,认为“相关领域词汇的基本术语和关系,以及利用这些术语和关系定义词汇外延的规则”。 1993 年美国 Sanford 大学的知识系统实验室( KSL, Knowledge Systems Laboratory)的学者 Thomas Gruber给出的定义得到了广泛的认可,他认为 :“知识的形象化表达的基础是概念化”,概念化包括研究领域内的对象、概念和其他实体,以及他们之间的关系;因此 ,概念化是我们为了某些目的用来表示世界的一种抽象、简化观点。每一个知识库、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。