1、本科毕业设计 ( 20 届) 基于 OPENCV的手写数字识别系统开发 所在学院 专业班级 电子信息工程 学生姓名 学号  
2、; 指导教师 职称 完成日期 年 月 - 1 - 摘 要 数字识别作为现在计算机视觉技术的一个重要研究课题,有着它自己独特的功能
3、。特别是在大规模数据的统计、金融领域、 邮件的自动分拣以及手写文稿自动输入等诸多方面发挥巨大作用。但是手写数字识别由于其字形信息量小、字形相差不大、笔划顺序信息难于获取、数字变形大等特点又成为这一领域的一个具有挑战性的课题。 这篇文章所要讲述的主要是处理手写数字并加以识别的一种一般办法。在实现识别的时候使用的是 Visual C+ 6.0 作为软件平台,结合现在图像处理领域比较流行的 OPENCV 函数库来对一系列的手写数字图像进行加工处理。 在识别算法的选择上,我们采用了最简单,也是最基本的识别算法 模板匹配法,来设计用来识别的分类器。之所以不使用 现在比较流行的 B
4、P 神经网络误差反馈算法。一个是因为没有完全的理解这个算法的作用机理,另一个是第一次使用 VC 这款软件来进行比较繁琐的程序设计。在技术实现上表现的有点无力。 软件的主要设计流程,和普遍的图像识别的算法一样。首先获取图像,对图像进行必要的预处理,之后对图像进行分割,并提取特征。最后把特征导入到分类器中进行识别并输出结果。 经过测试。软件能够正常运转,并能够实现手写数字的识别这一基本功能。但是识别率不是尽如人意。如果以后还有机会开发这一类识别程序的话,会尽量考虑使用 BP 算法来实现,来体会一下这种算法 的强大。 关键字 :模式识别;模板匹配;数字图像处理 &
5、nbsp;- 2 - Abstract Digital recognition as computer vision technology is now an important research topic has its own unique features. Especially in the large-scale data, statistics, finance, mail sorting and automatic handwriting input, and many other aspects of presentation automatically play a sig
6、nificant role. But the handwritten numeral recognition because of its small amount of information shape, font or less, the stroke order information difficult to access, digital distortion and other characteristics of this area has become a challenging issue. This article is mainly to be about
7、dealing with handwritten numbers and to identify a general approach. When used in achieving the recognition that Visual C + + 6.0 as the software platform is now more popular in image processing library OPENCV to a series of handwritten digital image processing. The choice of the recognition a
8、lgorithm, we use the most simple, is the most basic recognition algorithm - the template matching method to design the classifier to identify. The reason why not to use more popular now BP neural network error feedback algorithm. One is because there is no complete understanding of the mechanism of
9、this algorithm, the other is the first time you use this software to compare VC complicated programming. On the performance of the technology a bit weak. The main software design process, and universal, like image recognition algorithm. First get the image, the image pre-processing necessary,
10、after the image segmentation and feature extraction. Finally, the feature into the classifier to identify and output. Tested. Software to operate normally, and to achieve recognition of the handwritten digits basic function. But the recognition rate is not satisfactory. If you later have the o
11、pportunity to develop this type of recognition program, we will try to consider using the BP algorithm to realize, to understand what the power of the algorithm. - 3 - Key Words: Pattern Recognition; Template Matching; Digital Image Processing - 4 - 目 录 1 引言 .1 2 计算机视觉
12、、工具介绍 .3 2.1 计算机视觉简介 .3 2.2 手写数字识别系统的应用前景 .3 2.3 VISUAL C+6.0 简介 .5 2.4 OPENCV 简介 .6 3 识别算法分析 .7 3.1 BAYES决策 .7 3.2 句法方法 .7 3.3 BP 神经网络 .8 3.4 模板匹配法 .10 4 总体设计 . 11 4.1 识别系统设计思路 . 11 4.2 识别系统设计流程 .13 5 分步设计 .15
13、 5.1 底层操作 .15 5.1.1 操作界面设计 .15 5.1.2 鼠标接口程序 .16 5.1.3 键盘接口函数 .17 5.2 图像输入处理 .18 5.2.1 创建手写输入框 .18 5.2.2 生成图像 .19 5.3 图像特征提取 .19 5.3.1 边界提取 .19 5.3.2 图像分割 .20 5.3.3 统计特征 .21 5.4 分类器 .22 5.4.1 训练分类器 .22 5.4.2 特征库载入 &nb
14、sp;.23 5.4.3 调用分类器 .25 5.5 结果输出 .25 5.6 拒识处理 .26 6 测试 .28 6.1 程序移植 .28 6.2 功能测试 .29 6.3 识别率测试 .29 7 结论 .31 - 5 - 致 谢 . 错误 !未定义书签。 参考文献 .32 附录 1 毕业设计作品说明书 .1 浙江万里学院本科毕业论文 &n
15、bsp; - 1 - 1 引言 在计算机技术飞速发展的今天。计算机的功能越来越 强大,使用的方法也是越来越复杂。计算机的使用者也越来越向着低操作水平的人群发展。以前在使用计算机的时候,操作人员要有相当强的专业知识,要严格按照各种计算机语言程序来使计算机运行。为了让更多的人能够自由,轻松的操作计算机,就要让计算机了解人的习
16、惯和要求,这样才能让更多的人来使用复杂的计算机。让计算机拥有逻辑判断能力,就是现在人工智能所要研究的主要方向。 模式识别是人工智能中人机交互的一个非常重要的研究课题。其在人工智能研究中的作用,就好像眼睛对于人的作用一样。现在研究的手写数字识别系统,在模式识别研究中,有着 重要的理论价值。 现阶段的手写数字识别系统的研究,以理论研究为主,并没有大量的投入到商业应用之中。虽然现在识别的精度可以达到 98%以上,但是对于金融,邮政这种失之丝毫,差之千里的行业来说,这样的精度还是不够理想。目前的识别算法有很多,人工神经网络、模糊算法、小波变换算法、遗传算法、傅里叶变换法等等都可
17、以用来解决手写数字的识别,但它们当然有不同的优缺点。现在使用的最多的是人工神经网络算法中的 BP 神经网络算法。它有很强的非线性映射能力、泛化能力和容错能力。在处理手写数字这种没有特定规范的事物时,有着非常好的效果 。 本文所设计的手写数字识别系统,主要的研究对象是 0到 9 这十个阿拉伯数字,它们是唯一的被世界各国通用的代表数字大小的字符。这样就使得研究的应用扩展到了世界范围。而且识别的类别比较少,笔画也不是非常的复杂。作为一个研究用的对象来说是比较合适的。在它的研究基础上,可以进一步的做深入的研究和开发一些新的理论。最直接的拓展就是在它的基础上研究英文 26 个字母,之后就可以
18、再进一步的应用到英文的文章,乃至于中国汉字的识别了。 目前,在脱机手写字符识别研究中使用最广泛的是光学字符识别,即 OGR 方法。其统计模式识别方法注重数 量特征,便于特征提取、分析和计算。但是,它将字符看成一种随机的二维点阵,没有考虑字符的结构特征和结构信息。因此,这种方法对单一字符比较有效,而对不同字体的字符识别效果则较差。 结构模式识别的方法是把待识别的模式看成由若干个比较简单的子模式构成的集合,任何模式都可以用一组基元及一定的组合关系来描述。由于字符含有丰富的结构信息,可以设法提取含有这种信息的结构特征,作为字符识别的依据。但是,由于字符结构比较复杂,实际应用中
19、仍有较大困难。近年来,出现了将统计和结构识别结合起来的途径,既吸取了统计识别的优点,又利用了 字符的结构信息。手写数字识别是字符识别的一个特定方向。由于问题本身的特殊性,传统的 OCR 方法不能有效地解决这一问题。因此,手写数字的识别方法应该是一种具有自适应、抗干扰、能够有效地解决手写数字分割、统计模式识别与结构模式识别相结合的方法。 2 计算机视觉、工具介绍 2.1 计算机视觉简介 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究
20、列为对经济和科学有广泛影响的科学和工程中的重大基本问 题,即所谓的重大挑战( grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在 80 年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。为此我们将先介绍人类视觉。 人类正在进入信息时代,计算机将越来越广泛地进 入几乎所有领域
21、。一方面是更多未经计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越来越复杂。这就使人在进行交谈和通讯时的灵活性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而目前的计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决
22、策的能力。具有上述能力的计算机就是智能计算机。智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主做出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务 123 。 2.2 手写数字识别系统的应用前景 手写识别系统具有极大的市场潜力和应用前景。 1 市场应 用范围 目前,手写输入识别系统的主要市场应用有: ( 1) 与手写板配套作为 PC的输入手段之一; &nb
23、sp;( 2) PDA 掌上电脑的必需输入手段; ( 3) PDA 的必需输入手段; ( 4) 手机的一种输入方案; ( 5) 机顶盒可选择的一种输入方案; 而随着未来计算、无线通讯、任务处理等多种功能逐渐趋于融合,以及家庭数字化产品的更高发展,手写输入识别系统将成为未来小巧、轻便的数字化产品最为重要的通用输入系统。 2 在 PC 领域的市场分析 中文手写识别系统最早应用于 PC 行业,作为 PC 的一种可选输入方式:手写板,在台湾、香港首先 使用。目前,在台湾以及港澳地区,
24、手写输入已经被普遍采用,台湾的手写板年销量约为电脑销量的四分之一,在香港手写板已成为电脑的标准配置之一,而且这个比例正在呈上升趋势。 近年随着国内计算机市场的逐步扩大,手写识别系统在 PC 领域的应用也逐年成倍增长。据统计, 19951996 年不到 1 万套,而 1999 年手写板市场突破了50万套, 2000 年更达到 70 万套。但按 2000 年国内 PC 销量已公布数字 800 万套算,手写板的销量尚不足电脑销量的十分之一,因此手写板在 PC 领域还有很大的市场容量。 1999 年全国 PC 销量达到 600 万 台, PC保有量为 1700 万台,而这个速度正以 30%的速度增长,而到 2002 年底,全国的 PC 保有量将达到 3000 万台,如果手写产品占有率能达到 20%,即有 600 万台电脑会配上手写系统。以一套手写笔200 元计算,总销售额可达 12 亿元,由于手写笔软件不断升级改进,硬件使用寿命一般为 3年,因此这个市场将持续扩大。 目前市场销售中,以软件计,汉王以超过 40%的市场占有率遥遥领先,精品25%次之,蒙恬约 20%,清华文通约 8%,手写之星 5%,其余还有一些不成熟的手写产品,没有什么市场影响。