精选优质文档-倾情为你奉上基于Python的图片文字识别 【摘要】在有些工程中,有时候我们需要对图片文字识别。本文利用Python,调用OpenCV库,先对图片进行预处理,然后借助Google开源的pytesser对图片文字进行了识别。【关键词】:OpenCV,pytesser,文字识别一 关于OCR光学字符识别(英语:OpticalCharacterRecognition,OCR)是指对文本的进行分析识别处理,获取及版面的过程。一般包括以下几个过程:图像输入、图像前处理、预识别:1 图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式,目前有、等开源项目。2 预处理:主要包括二值化,噪声去除,倾斜较正等。2.1二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地识别文字,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是。2.2噪声去除:对于