1、1 毕业论文文献综述 电子信息工程 基于 OPENCV 的手写数字识别系统开发的综述 摘要: 本文简单的描述了手写数字识别系统研究的过程中所涉及到的一些领域和使用的工具。这些知识都是现阶段比较热门的研究方法,可行度相对比较的高。而且就这些方法发表了一些自己总结的观点。 关键字: OPENCV;模式识别;计算机视觉; 前言 根据相关数据,人类在接收信息的来源, 20%来自听觉, 60%来自视觉。还有其他的味觉、嗅觉、触觉加起来只占了剩下的 20%。所以视觉在人们的日常生活中的作用非常的大。作为现在研究视觉的重要手段 图像处理
2、 技术,其重要性可想而知。 模式识别是图像处理技术的一门分支,但是其重要性已经使其发展为了一门独立的新学科。在现在很多先进的科学项目中都可以看到模式识别技术的身影,如人工智能、系统控制、遥感数据分析、军事目标识别、生物医学工程等等领域。 手写数字识别,作为模式识别领域的一个重要问题,也有着重要的理论意义。在整个 OCR(Optical Character Recognition)领域中,难度最高的就是手写字符的识别。虽然人们在手写字符识别的研究中,已经有了很大的成就。但是距离实际应用,还有着一定的距离 1。 1.OpenCV 简述 1 2 OpenCV( O
3、pen Computer Vision)既开源计算机视觉库,采用 C/C+语言编写,能够运行在Windows/Linux/Mac 等操作系统上,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 是计算机视觉、模式识别、图像处理、信号处理、视频监控等相关从业人员的好工具。它包含了 300 多个 C 函数的跨平台的中、高层 API。在这些已经完成的函数的基础上,相关人员可以迅速的开展自己的工作,而不需要从最原始的函数一点一点的开始。而且它为 IPP( Intel Integrated Performance Primitives)提供了透明的接口。这表明 OpenCV 将在
4、运行时自动加载这些库。 整个 OpenCV 函数库主要包含以下几个模块: ( 1) CxCore:提供各种数据类型的基本功能,包含一些基本结构和算法函数。 ( 2) HighGUI:提供用户交互部分( GUI、图像视频 I/O、系统调用函数)的函数。 ( 3) Cv:这个是 OpenCV 的主要函数,包含图像处理、运动分析、结构分析、模式识别、摄像机标定和物体跟踪等功能。 2 ( 4) CvAux:是 OpenCV 的附加函数库,包含 View Morphing,三维跟踪, PCA, HMM 等实验性的函数。 2.模式识别
5、的基本概念 什么是模式识别?模式识别说白了,就是计算机在“看”。对于我们人类来说,“看”是一件非常简单的事情,平时的读书、看报是我们在识别文字,让我们好知道上面表达的是什么意思。日常的走路是我们在识别路程障碍,防止我们碰到东西,并顺利到达目的地。在路上碰到人,是我们在识别人脸,让我们知道哪些是熟人,哪些是陌生人。当我们睁开眼的时候,光线带着大量周围环境的信息,进入到我们的眼睛当中,转换成微弱的电信 号,通过神经末梢传递到大脑之中,然后大脑对这些信息进行分类、识别然后做出相应的判断,让我们知道在我们眼前有些什么东西。可是这个简简单单的“看”,对计算机来说,却是很有难度的一件事情。因为
6、对于计算机来说,一幅图像,就只是一堆数字而已。我们要做的,就是让计算机分析这一堆数字,然后找到隐藏在其中的信息,提取其中对我们有用的,再加以利用。这个就是所谓的计算机的“看”,我们所说的模式识别,也就是现在的计算机视觉技术。 3.模式识别系统的组成 3 一般的模式识别系统,由数据获取、预处理、特征提取、分类决策及分类器设计 五部分组成。这些又可以分成两部分:一部分用来训练分类器,得到分类器需要的具体参数;另一部分用来完成未知类别识别的分类。 数据获取:现实生活中的信号一般都是一模拟量的形式存在的,计算机不能直接处理这些信号,它需要先把这些模拟量转换成为计算机能够识别处理
7、的数字量才可以。一般的数据有以下几种:一维波形:振动波形、脑电图;二维图像:照片、指纹、文字。 预处理:从自然界的模拟量转换过来的数字量通常都含有大量的噪声、变形等。在送到计算机的识别模块识别之前,要尽量的对这些数据信号进行处理,使它们符合识别模块的输入要求。 特征提取:转换过来的信号量含有很多没有用的信号,我们要从中提取出对我们有用的信号来加以识别,而那些没有用的信号是可以忽略的。也就是从中提取出能够反应事物本质的特征。 分类决策:分类决策是整个识别系统的核心,在特征空间中用模式识别方法把被识别对象归为某一类别。 分类器设计:分类器的参数是收集
8、样品训练出来的,通过不断地训练,改进判别函数和误差检测。 4.手写数字研究的难度 4 虽然 09 个阿拉伯数字只有 10 个字符,而且笔画十分的简单,看起来好像不是很难识别。但是实际上,在实际的测试中,数字的识别正确率,反而比 印刷体汉字的识别率底。这是为什么呢?原3 来,自然数字的结构简单、笔画少,但也就是因为这几个原因,使得数字之间的字形相差不大,使得准确区分某些数字的难度十分的大。而且,手写数字,因为个人的写法习惯的问题,使得它的写法千差万别,进一步提高了识别的难度。 在对于数字识别的精度方面,要求十分的高。如果是一般的字符,比如一般的文本,由于有上下文的信息,精
9、度只要有 98% 99%就可以满足要求了。但是对于数字来说,它们之间没有什么必然的联系。你可以想象一下,如果在识别支票上的数字时(比如 60000 误识成了 90000)出现错 误,虽然只是一个地方错了,可是这个错误时绝对不可原谅的。所以这样的精度,就至少要达到 99.9%。这是很难达到的。 5.手写数字识别的基本方法 5 6 7 数字的识别,可以归类到字符的识别。目前的方法主要可以分为两大类:全局分析和结构分析。对于全局分析来说,最主要的方法是模板匹配法,这类方法通常是和统计分类法一起使用的。其特点是,分析简单,但是计算量大,而且错误率高。对于结构分析来说,法主要分析的是字符的轮
10、廓或骨架上提取字符形状的基本特征。和结构特征匹配使用的,通常是一些句法的分类方法。 但是知道目 前为止,还没有一个简单的方法能够对完全没有限制的手写数字的识别,做到很高的识别率和识别精度。所以,只能向着更加成熟、复杂、综合的方向发展。充分的利用现在比较热门的理论技术,比如:神经网络、模糊识别、 Bayes 决策等。是解决这一难题的很好的途径。 总结 随着人工智能和机器视觉的快速发展,各种图像开发工具的相继完善,手写数字识别系统的功能也会随着越来越强大,开发出零错误率的算法指日可待。 参考文献 1 杨淑莹,李兰友 .图像模式识别 VC+
11、技术实现 M.北京:清华大学出版社, 2005. 2 Kenneth.R.Castleman.数字图像处理 M.北京:电子工业出版社, 1998. 3 陈胜勇,刘盛 .基于 OpenCV 的计算机视觉技术实现 M.北京 :科学出版社, 2008. 4 中国人工智能网 EB/OL.http:/www.chinaai.org 5 Gary Bradski,Adrian Kaehler.Learning OpenCVM.O'Reilly Media. 2008.6 OpenCV 中文网站 EB/OL.http:/ 7 阮秋琦 .数字图像处理学 M.北京:电子工业出版社, 2007. 8 吕兵,曲宝军,王玮 .Visual C+从初学到精通 M.北京:电子工业出版社, 2010. 9 刘妍,苏喜友 .遗传程序设计理论与应用 J. 微计算机信息 , 2010 年 , 第 26 卷第 9-3 期:115 页 . 10 张媛 . 模式分类的可视化算法设计 J.信息时代, 2010 年,第 4 期: 93 页。 4
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。