手写数字识别技术研究【毕业设计】.doc

上传人:文初 文档编号:61224 上传时间:2018-06-01 格式:DOC 页数:42 大小:524.95KB
下载 相关 举报
手写数字识别技术研究【毕业设计】.doc_第1页
第1页 / 共42页
手写数字识别技术研究【毕业设计】.doc_第2页
第2页 / 共42页
手写数字识别技术研究【毕业设计】.doc_第3页
第3页 / 共42页
手写数字识别技术研究【毕业设计】.doc_第4页
第4页 / 共42页
手写数字识别技术研究【毕业设计】.doc_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、 本科 毕业 设计 (论文 ) (二零 届) 手写数字识别技术研究 所在学院 专业班级 计算机科学与技术 学生姓名 学号 指导教师 职称 完成日期 年 月 摘要 : 手写数字识别是光学字符识别技术的一个分支 ,它研究的对象是 : 如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字 。 手写体数字识别是 自动模式识别中一个非常活跃的研究领域。本文针对原有数字识别处理技术中识别特征向量单一的问题 ,提出了基于 模板匹配 的方法 ,来提高数字识别系统的识别速度和识别率。本文首先对数字识别处理技术及处理流程进行了概述 ,对 模板匹配 及 其他 常规算法进行介绍 ,并对算法的权值、激活函数等进行了改进

2、。 使其能够适应噪声干扰 ,其二值化后的字符图像能够很好地保持本来形态。最后 ,对基于 模板匹配 的数字识别系统进行了实现。在已有的通用评价标准下 ,通过对其识别率的分析 ,证实该系统提高了数字识别的准确率。同时 ,对比于单一识别器 ,经系统集成后测试 ,其 识别速度也有所提高。 关键词 : 手写数字识别;模式识别;样本库 - 2 - Abstract : Handwritten numerals recognition is optical character recognition technology, it is a branch of the object of study is:

3、how to use electronic computer automatically recognized people handwritten on paper Arabic numerals. The handwritten digits identification is automatic recognition of a very active field of research. Based on the original digital identification processing recognition feature vector single problems,

4、and put forward based on template matching method, to improve digital identification system identification speed and recognition rate. In this paper, first digital identification processing technology and process were summarized, and the other for template matching conventional algorithm for algorit

5、hm are introduced, and the weights and activation function etc are also improved. So it can adapt to noise, the second value of a.v. character images can remain well originally form. Finally, based on the template matching digital recognition system is realized. In the existing general evaluation st

6、andard, through the analysis of its recognition rate, confirmed the system improves the accuracy of numeral recognition. Meanwhile, compared with the single identifier, the system integration, the recognition rate after testing also improved. Key words: Handwritten numeral recognition; Pattern recog

7、nition; Sample library - 1 - 目录 1 字符识别概述 . 1 1.1 课题研究背景意义 . 1 1.2 字符识别概述 . 1 1.3 字符识别的分类 . 2 1.4 研究的对象及目标 . 2 1.4.1 研究的对象 . 2 1.4.2 研究的目标 . 2 2 模板匹配算法及改进 . 3 2.1 模板匹配算法的描述 . 3 2.2 图像匹配的数学描述 . 4 2.3 算法的改进及图示 . 5 3 图像的预处理 . 8 3.1 图像的平滑去噪 . 8 3.2 BMP 图像的存储结构 . 9 3.3 图像的颜色处理 . 11 3.4 图像的二值化 . 11 3.5 图像的

8、细化 . 16 3.5.1 细化的定义 . 16 3.5.2 细化的要求 . 16 4 系统的设计与实现 . 15 4.1 Visual C+ 6.0 简介 . 15 4.1.1 运行环境安装 : . 15 4.1.2 MFC 概述 . 15 4.2 系统界面按扭的生成 . 15 4.3 模板计算的过程 . 17 4.3.1 模板计算设计思想 . 17 4.3.2 代码实现 . 17 4.4 样本测试的实现 . 19 4.4.1 样本测试设计思想 . 19 - 2 - 4.4.2 代码实现 . 19 5 系统运行及测试 . 24 5.1 系统的运行 . 24 5.2 系统的测试 . 24 5.

9、3 系统的评价 . 25 致谢 . 25 参考文献: . 28 附 录 . 29 - 1 - 1 字符识别概述 1.1 课题研究背景意 义 手写数字识别 (Handwritten Numeral Recognition)是光学字符识别技术 (Optical Character Recognition,简称 OCR)的一个分支 ,它研究的对象是 : 如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字 。 OCR 是模式识别的一个分支,按字体分类主要分为印刷体识别和手写体识别两大类 .而手写体识别又可分为受限手写体和不受限识别体,按识别方式有课分为在线识别和脱机识别。在整个 OCR领域中, 最为

10、困难的就是脱机手写字符的识别 。 到目前为止 ,尽管人们在脱机手写英文 ,汉字 识别的研究中已取得很多可喜成就 ,但距实用还有一定距离 。 而在手写数字识别这个方向上 ,经过多年研究 ,研究工作者已经开始把它向各种实际应用推广 ,为手写数据的高速自动输入提供了一种解决方案 。 字符识别处理的信息可分为两大类 :一类是文字信息 ,处理的主要是用各国家 ,各民族的文字 (如 :汉字 ,英文等 )书写或印刷的文本信息 , 目前在印刷体和联机手写方面技术已趋向成熟 ,并推出了很多应用系统 ;另一类是数据信息 ,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据 ,如 :邮政编码 ,统计报表 ,财

11、务报表 ,银行票据等等 ,处理这类信息的核 心技术是手写数字识别 。 因此 ,手写数字的识别研究有着重大的现实意义 ,一旦研究成功并投入应用 ,将产生巨大的社会和经济效益 。 1.2 字符识别概述 计算机硬件的迅速发展以及计算机应用领域的不断开拓,急切地需要计算机能够更有效的感知诸如声音、文字、图像等人类赖以发展自身、改造环境所运用的信息资料。但就一般意义来说,目前计算机却无法感知他们,键盘,鼠标等输入设备,对于五花八门的外部世界显得无能为力。虽然电视摄象机、图文扫描仪、话筒等设备已解决了上述非电信号的转换,并与计算机联机,但这并不能使计算机真正知道所接受的究竟 是什么信息。计算机对外部世界感

12、知能力的低下,成为开拓计算机应用的瓶颈,也与其高超的运算能力形成强烈的对比。因此,着眼与提高计算机感知外部信息能力的学科 -模式识别得到了迅速的发展。在模式识别领域中,手写字符的识别是一个非常活跃的研究方向。但这方面的研究工作已有很多,其中不少成果得到了广泛的应用。但是由于手写字符拓扑结构的多样性,目前已有的手写字符识别体统在对无限制手写字符进行分类时,始终存在这样或那样的缺陷。 字符识别是模式识别领域中的一个非常活跃的分支。这一方面是由于问题本身的难度使之成为一个极具挑战 性的课题。另一方面,是因为字符识别不是一项孤立的应用技术,其中包含了模式识别领域中- 2 - 其它分之都会遇到的一些最基

13、本的和共性的问题。也正是由于字符识别技术的飞速发展,才促使识别领域和图像分析发展为一个成熟的科学领域。 字符识别技术的研究主要集中在特征抽取和模式匹配两个方面,这一直是光学字符识别( OCR)技术的两大关键所在。由扫描仪转化后的字符二值图像中各点的值,可以看成是该字符的一组特征。但由于这组特征的数量较大,而每个特征所含的信息量很少,因此有必要通过映射或变换的方法将信息集中到少量的特征中。这个过程就叫特征 抽取。选择稳定的,分类能力强的特征是字符识别系统的核心。 在识别过程中,对待识别的字符进行特征抽取后,就要将这些特征与特征库中的特征进行比较,进行分类,这个过程称为特征匹配。特征匹配方法可分为

14、完全匹配法和近似匹配法。完全匹配法就是将为未知的字符的特征向量 X与特征库中的所有特征向量( Yj, j=1,2, n)逐一进行比较 ,若 X=Yi,则 Yi所对应的字符就是识别结果。否则,就拒识。近似匹配法可进一步分为相关性匹配法,驰豫匹配法和树搜索法。 1.3 字符识别的分类 字符识别按输入方式的不同可分为联机识别(也称为 在线识别)和脱机识别(也称为离线识别)。联机识别是对所书写的字符进行实时识别,即写即识。所以联机识别技术往往结合字符的笔划顺序来进行识别。脱机识别方法中,首先对已经写在纸上的字符通过扫描仪转化为二值图像,然后再对字符的二值图像进行识别。书写与识别可以分开进行。因此,脱机

15、识别技术中不涉及字符的书写顺序。 字符识别技术根据别识别的字符的类型通常可分为印刷体识别和手写体识别两大类,而手写体识别又可分为限制手写体识别和无限制手写体识别(也称为自由手写体识别)。印刷体识别是将印刷刊物上的字符扫描转化为二值图象并进行识 别,是将已有刊物上的数据大量输入计算机的最有效的方法。 1.4 研究的对象及目标 1.4.1 研究的对象 我们的研究对象是无限制手写数字,这方面目前已经有大量的研究成果。但是,由于手写 数字 不同数字之间字形相差不大 ,使得准确区分某些数字相当困难 ;而且 数字虽然只有十种 ,笔划简单 ,但同一数字写法千差万别 ,全世界各个国家各个地区的人都用 ,其书写

16、上带有明显的区域特性 ,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统 。 正因为如此,手写字符识别对于广大研究者来说,是一个充满魅力的领域。 - 3 - 1.4.2 研究的目标 我认为,手写数字识别应用系统性能的关键与瓶颈仍然在于手写数字识别核心算法的性能上,怎么解决手写数字识别系统应用中的难点,以改善核心算法,突破瓶颈是我们要首先考虑的问题,只有解决了难点,在核心算法上有了新的突破,才能研究出零误识率和底拒识率的高速识别算法,达到我们的最终目标。 - 4 - 2 模板匹配算法及改进 2.1 模板匹配算法的描述 在机器识别事物的过程中,常需把不同传感器或同一传感器在不同时间、不

17、同成像条件下对同一景物获取的两幅或多幅图像在空间上对准,或根据己知模式到 另一幅图中寻找相应的模式,这就叫做匹配。若将已知模式的图像称为模板 (如图 2 1),在左侧的待匹配图像中找到对应于右侧模板图像的过程即为模板匹配。因为只有当同一场景的两幅图像在同一坐标系下时,才能进行 待匹配图像 模板 图 2 1 待匹配图像和模板图像的示意图 相似性比较,所以模板匹配的过程实际上也就是把一幅图像 变换到另一幅图像的坐标系过程。图像的模板匹配就是先给定一幅图像,然后到另一幅图像中去查找这幅图像,如果找到了,则匹配成功。这看起来好像很简单,因为我们一眼就能看出一幅图中是否包含另一幅图像,遗憾的是电脑并不具

18、有人眼的强大的视觉的功能,因而需要电脑去判定一幅图片中是否包含另一幅图片是件不容易的事情。对于机器视觉系统而言,实现匹配首先要对图像进行预处理。先计算模板图片的特征值,并存储到计算机中。然后计算待测试样板图片的特征值,与计算机中模板进行比较,运用匹配算法实现匹配。整个过程如图 2 2所示。 - 5 - 图 2 2 图像匹配系统示意图 从上述图像匹配系统结构图中可以看出实现匹配要考虑以下几方面内容: (1)图像的数据结构类型:即描述像素灰度值和像素光学特征值之间的信息。 (2)图像的特征空间:由特征数据组成,这些特征数据可以是原始像素数据,也可以是经过处理后提取的图像特征数据。 (3)存储 :将

19、图像处理的一些相关信息资料存储在计算机中,了解其在计算机中存储的结构。 (4)匹配算法:是实现匹配的基本思想和方法,是解决匹配问题的关键所在 。算法的实现涉及到相似性度量函数的正确选择,相似性度量函数是两幅图像相比较的相似性度量,直接影响着匹配的速度和精度。 (5)搜索方法:即遍历图像时的查找策略,正确的选择搜索方法直接影响到匹配的速度。 在基于图像处理的应用领域中,对于图像匹配的研究可以说一直都是数字图像处理技术和计算机视觉理解的重要研究内容。图像匹配在机器视觉、工业自动模式识别、医学图像的定位等方面都有着重要意义。 2.2 图像匹配的数学描述 以传统的相关算法为例对图像匹配进行数学描述。如图 2 3所示,搜索图即待匹配图像 S为一方形区域,边长为 N,模板图像 T也是一个方形区域,边长为 M 。设模板 T叠放在搜索图 S上平移,模板覆盖下的那块搜索图 (即图中的阴影部分 )叫做子图 Sji, , (i,j)为子图 Sji, 的左下角在搜索图 S中的坐标为: 1 i,j N-M+1 模板图片 预处理 计 算 特征值 存储 搜 索 策略 待测试图片 预处理 计 算 特征值 匹配算法 匹配结果 显示结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。