模式识别课论文.doc

上传人:sk****8 文档编号:3103390 上传时间:2019-05-21 格式:DOC 页数:6 大小:141KB
下载 相关 举报
模式识别课论文.doc_第1页
第1页 / 共6页
模式识别课论文.doc_第2页
第2页 / 共6页
模式识别课论文.doc_第3页
第3页 / 共6页
模式识别课论文.doc_第4页
第4页 / 共6页
模式识别课论文.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

1、模式识别在手写数字识别中研究摘要:手写体数字识别是文字识别中的一个研究课题,是多年来的研究热点,也是模式识别领域中最成功的应用之一。由于识别类型较少,在实际生活中有深远的应用需求,一直得到广泛的重视,通过对数据采集的预处理,特征提取与选择,建立相应的知识库,应用模式识别的方法来进行研究。关键字:模式识别 手写数字识别 特征提取 预处理Abstract: Handwritten numeral recognition of character recognition is a research topic, is the hot research topic for many years, bu

2、t also is one of the most successful application in the field of pattern recognition. Due to the identification type less,it has a profound application requirement in real life, has been widely attention, and through the data acquisition preprocessing, feature extraction and selection, the establish

3、ment of the corresponding knowledge base, the application of pattern recognition method for researchKeyword: pattern recognition hand-written numeral recognition feature extraction preprocessing1. 引言手写数字识别(H andw ritten N um eral R ecognition)是光学字符识别技术(O ptical C haracter R ecognition, 简称O C R )的一个分

4、支, 它研究的对象是, 如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个O C R 领域中, 最为困难的就是脱机手写字符的识别, 到目前为止, 尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就, 但距实用还有一定距离。而在手写数字识别这个方向上, 经过多年研究, 研究工作者已经开始把它向各种实际应用推广。字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政

5、编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。在整个 OCR领域中,最为困难的就是脱机自由手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距离实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。本文首先介绍了自由手写体数字识别的基本原理,包括数字图像预处理、特征提取和模式识别的基本原理和方法;其次介绍了;最后通过基于 MATLAB的实

6、验结果,对本系统的性能进行了分析。2. 手写数字识别的原理手写数字的写法带有明显的地区性和民族性, 因而选择一个可供系统训练和测试使用的样本库是手写数字识别研究的重要基础之一, 对识别系统的性能也有重要的影响。研究者对所需的样本库有两种选择: 一是自己根据需要建立专门的样本库, 二是选用其它机构做好的现成的样本库。本系统主要由手写体数字识别的训练过程和识别过程组成,训练过程和识别过程均包括预处理、特征提取和模式识别三部分,流程图如图2.1图 2.1总之,从手写体数字识别原理可见,手写体数字识别技术主要包括以下几点:(1) 数据采集预处理,包括彩色图像转成灰度图像、二值化,归一化,滤除干扰噪声等

7、,如下图;识别过程训练过程数据采集,预处理特征提取与选择 分类识别数据采集,预处理 分类识别改进数据采集,预处理 改进分类识别待识对象训练样本人工干预特征提取与选择改进特征提取与选择正确率测试图 2.2 原始图像 图 2.3 预处理后图像 (2). 特征提取与选择,特征提取是字符识别中的一个重要组成部分,是模式识别的核心之一。经过预处理后,根据识别方法的要求抽取图像特征,作为识别的依据。一般而言,选择的特征一方面要求能够足够代表这个图像模式,另一方面要求它们的数量尽可能少,这样能有效地进行分类和较小的计算量。特征提取的好坏会直接影响其识别的分类效果,进而影响识别率,因此特征选择是模式识别的关键

8、。但是,目前还没有一个有效的、一般的抽取、选择特征的方法。抽取、选择特征的方法都是面对问题的,因此针对不同的识别问题往往有不止一种的抽取、选择特征的方法。本文特征提取的首要任务是要确定细化后图像的那些特征点作为图像的特征,这里只提取图像的结构特征作为网络输入值。其中结构特征有九个,包括竖直中线交点数、竖直 1/3 处交点数、竖直 2/3 处交点数、水平 1/5 处交点数、水平 4/5 处交点数、右拐点数、左拐点数、上端点数、下端点数。结构特征的选择与提取算法如下述。对经过预处理的图像进行分割,分别在图像的水平区域 1/3、1/2 、2/3 处设置 3 条竖线,在图像的竖直区域 1/3、2/3

9、处设置 2 条水平线,分别计算直线与图像数字笔段的交点数,求得前五个特征值。如下左图 2.4 所示:图 2.4再分别提取图像的左拐点数与右拐点数,如上右图 2.4 所示。以 1/3 竖交点数为例,提取交点数特征的算法如下:1) 按从上到下,从左到右的顺序扫描预处理后图像并选择第一个像素点P;2) 如果 P 点为黑像素点则选择下一个像素点,若该像素点为白色则对交点数加 1,若还是黑像素点则继续选择下一个像素点,如此循环直到该行(列)像素点被遍历完。其他交点数的提取与上述算法类似。以提取左拐点数为例,提取拐点数特征的算法如下:1) 按从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点 P;2)

10、 查看它右下点是否为黑像素点,如果不是则转 1),否则查看右下点其正下的点,直到新点不是黑像素点,再查看此新点的正左点是否为黑像素点,如果是黑像素点,则这就是一个左拐点。当然由于细化工作的不太确定性,也有可能是此新点的左上角点是黑像素点,那么这也可以看成一个非严格意义上的左拐点。再以图像的上 1/3 处的水平分割线为界,计算图像的上端点数,以图像的下 1/3 处的水平分割线为界,计算图像的下端点数。提取端点数特征的算法如下:1) 从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点 P;2) 计算像素 P 的 8 邻域之和 N;3) 若 N=1,则像素 P 为端点,如果端点位于图像的上 1/

11、3 内,则上端点计数器加一;如果端点位于图像的下 1/3 内,则下端点计数器加一;4) 重复步骤 1-3,直到遍历整个图像。通过以上方法对数字图像的结构特征进行提取,得到 9 个数字特征,这 9个特征组成一个特征向量,这个特征向量将作为神经网络的输入值。该向量的排列如下:DATA= 竖直中线交点数,竖直 1/3 处交点数,竖直 2/3 处交点数,水平1/5 处交点数,水平 4/5 处交点数,左拐点数,右拐点数,上端点数,下端点数3.知识库的建立由于本文采用的是基于模式知识库的识别方法,所以对字符的结构特征的分析以及字符模型的构造是一个十分重要的环节,图 2.5 就是对识别数字的标准形态进行具体

12、分析而构造的模板。图 2.5DATA012,2,2,2,2,2,2,2,0;DATA111,0,0,1,1,1,1,1,2;DATA213,3,3,1,1,1,1,1,3;DATA313,2,3,1,1,1,2,2,3;DATA411,1,1,2,2,1,3,2,4;DATA513,3,3,1,1,1,2,2,4;DATA613,3,2,1,1,2,3,2,1;DATA712,2,2,1,1,1,1,1,2;DATA814,4,4,2,2,2,2,2,0;DATA913,3,3,1,2,1,3,1,1。由于本系统是对自由手写体进行识别, 因而要考虑数字书写体的多变性。通过对图 2.6 所示数字

13、变体的分析来对知识库进行补充。图 2.6DATA021,1,2,2,2,2,1,2,2;DATA223,2,2,1,1,1,1,3,2;DATA323,1,4,2,1,1,2,2,3;DATA421,2,2,3,3,1,2,2,2;DATA523,3,3,1,1,1,2,2,4;DATA623,1,3,1,1,2,2,2,2;DATA824,4,4,2,1,2,1,2,2;DATA923,2,3,2,1,1,3,1,3。最后得到知识库由上述两套模板所组成。4.模式识别的方法在本次设计过程中,我们选择了模板匹配的识别方法。通过计算欧氏距离来衡量匹配程度。本系统中的特征矢量有 9 个分量,其计算距

14、离公式如下:公式(2.1) 但在本次设计中我们计算距离时对上述1291idxy公式进行了改进,对于可靠性较高的端点数即最后一维特征值加大了权重,改进后的距离计算公式如下:公式(2.2)18 22913idxyxy在识别过程,分别计算待识别图像的特征值与知识库中两个模板的距离,与 10个数字逐个比较,距离最小的对应的数字就是最后识别结果。该算法具有特征提取和模板建立都比较直观,时间复杂度低,易于实现等优点。其缺点是在建立知识库时需要进行大量的训练,当知识库中的模板增多时,特征矢量间的距离会减小。5.结论本文对自由手写体数字识别的基本原理及方法作了介绍,分析表明,基于所用结构模型和知识库的识别方法对规范手写体数字是可行的,具有较高的识别率及较好的抗噪性能,也可以识别一定条件下的自由手写体数字。为了提高识别率和可靠性,除了要增强对噪声的滤除能力外,还要增大知识库,以解决细化中出现的结构畸变问题,这些都有待我们进一步的研究。6.参考文献1边肇祺 张学工等编著 模式识别第二版2 计算机时代 2007 年第 3 期3 章毓晋.图象处理和分析.北京:清华大学出版社M, 2003.4 武汉科技大学学报 吴谨 自由手写体数字识别系统的设计与实现

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育教学资料库 > 精品笔记

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。