1、图像缩放的双线性内插值算法的原理解析 图像的缩放很好理解,就是图像的放大和缩小。传统的绘画工具中 ,有一种叫做“放大尺” 的绘画工具,画家常用它来放大图画。当然,在计算机上,我们不再需要用放大尺去放大或缩小图像了,把这个工作交给程序来完成就可以了。下面就来讲讲计算机怎么来放大缩小图象;在本文中,我们所说的图像都是指点阵图,也就是用一个像素矩阵来描述图像的方法,对于另一种图像:用函数来描述图像的矢量图,不在本文讨论之列。越是简单的模型越适合用来举例子,我们就举个简单的图像:3X3 的 256 级灰度图,也就是高为 3 个象素,宽也是 3 个象素的图像,每个象素的取值可以是 0255,代表该像素的
2、亮度,255 代表最亮,也就是白色,0 代表最暗,即黑色 。假如图像的象素矩阵如下图所示(这个原始图把它叫做源图,Source):234 38 2267 44 1289 65 63这个矩阵中,元素坐标(x,y)是这样确定的,x 从左到右,从 0 开始,y 从上到下,也是从零开始,这是图象处理中最常用的坐标系,就是这样一个坐标:-X|Y如果想把这副图放大为 4X4 大小的图像,那么该怎么做呢?那么第一步肯定想到的是先把 4X4 的矩阵先画出来再说,好了矩阵画出来了,如下所示,当然,矩阵的每个像素都是未知数,等待着我们去填充(这个将要被填充的图的叫做目标图,Destination):? ? ? ?
3、 ? ? ? ? ? ? ? ? ? 然后要往这个空的矩阵里面填值了,要填的值从哪里来来呢?是从源图中来,好,先填写目标图最左上角的象素,坐标为(0,0 ),那么该坐标对应源图中的坐标可以由如下公式得出: srcX=dstX* (srcWidth/dstWidth) , srcY = dstY * (srcHeight/dstHeight)好了,套用公式,就可以找到对应的原图的坐标了(0*(3/4),0*(3/4)=(0*0.75,0*0.75)=(0,0),找到了源图的对应坐标,就可以把源图中坐标为(0,0)处的 234 象素值填进去目标图的(0,0)这个位置了。接下来,如法炮制,寻找目标图
4、中坐标为(1,0)的象素对应源图中的坐标 ,套用公式:(1*0.75,0*0.75)=(0.75,0)结果发现,得到的坐标里面竟然有小数,这可怎么办?计算机里的图像可是数字图像,象素就是最小单位了,象素的坐标都是整数,从来没有小数坐标。这时候采用的一种策略就是采用四舍五入的方法(也可以采用直接舍掉小数位的方法),把非整数坐标转换成整数,好,那么按照四舍五入的方法就得到坐标(1,0 ),完整的运算过程就是这样的:(1*0.75,0*0.75)=(0.75,0)=(1,0)那么就可以再填一个象素到目标矩阵中了,同样是把源图中坐标为(1,0)处的像素值 38 填入目标图中的坐标。依次填完每个象素,一
5、幅放大后的图像就诞生了,像素矩阵如下所示:234 38 22 22 67 44 12 12 89 65 63 63 89 65 63 63 这种放大图像的方法叫做最临近插值算法,这是一种最基本、最简单的图像缩放算法,效果也是最不好的,放大后的图像有很严重的马赛克,缩小后的图像有很严重的失真;效果不好的根源就是其简单的最临近插值方法引入了严重的图像失真,比如,当由目标图的坐标反推得到的源图的的坐标是一个浮点数的时候,采用了四舍五入的方法,直接采用了和这个浮点数最接近的象素的值,这种方法是很不科学的,当推得坐标值为 0.75 的时候,不应该就简单的取为1,既然是 0.75,比 1 要小 0.25
6、,比 0 要大 0.75 ,那么目标象素值其实应该根据这个源图中虚拟的点四周的四个真实的点来按照一定的规律计算出来的,这样才能达到更好的缩放效果。双线型内插值算法就是一种比较好的图像缩放算法,它充分的利用了源图中虚拟点四周的四个真实存在的像素值来共同决定目标图中的一个像素值,因此缩放效果比简单的最邻近插值要好很多。双线性内插值算法描述如下:对于一个目的像素,设置坐标通过反向变换得到的浮点坐标为(i+u,j+v) (其中 i、j 均为浮点坐标的整数部分,u、v 为浮点坐标的小数部分,是取值 0,1)区间的浮点数),则这个像素得值 f(i+u,j+v) 可由原图像中坐标为 (i,j)、(i+1,j
7、)、(i,j+1)、(i+1,j+1)所对应的周围四个像素的值决定,即:f(i+u,j+v) = (1-u)(1-v)f(i,j) + (1-u)vf(i,j+1) + u(1-v)f(i+1,j) + uvf(i+1,j+1) 公式 1其中 f(i,j)表示源图像 (i,j)处的的像素值,以此类推。比如,象刚才的例子,现在假如目标图的象素坐标为(1,1 ),那么反推得到的对应于源图的坐标是(0.75 , 0.75), 这其实只是一个概念上的虚拟象素 ,实际在源图中并不存在这样一个象素,那么目标图的象素( 1,1)的取值不能够由这个虚拟象素来决定,而只能由源图的这四个象素共同决定:(0,0 )
8、(0,1)(1,0)(1 ,1 ),而由于(0.75,0.75)离(1,1)要更近一些,那么(1,1)所起的决定作用更大一些,这从公式 1 中的系数 uv=0.750.75 就可以体现出来,而(0.75,0.75)离(0,0 )最远,所以(0 ,0)所起的决定作用就要小一些,公式中系数为(1-u)(1-v)=0.250.25 也体现出了这一特点;最邻近插值和双向性内插值缩放图片的效果对比:原始图片最邻近插值放大图片双线型内插值放大图片插值算法对于缩放比例较小的情况是完全可以接受的,令人信服的。一般的,缩小 0.5 倍以上或放大 3.0 倍以下,对任何图像都是可以接受的。最邻近插值(近邻取样法)
9、:最 临近插值的的思想很简单。对于通过反向变换得到的的一个浮点坐标,对其进行简单的取整,得到一个整数型坐标,这个整数型坐标对应的像素值就是目的像素的像 素值,也就是说,取浮点坐标最邻近的左上角点(对于 DIB 是右上角,因为它的扫描行是逆序存储的)对应的像素值。可见,最邻近插值简单且直观,但得到的图 像质量不高双线性内插值:对于一个目的像素,设置坐标通过反向变换得到的浮点坐标为(i+u,j+v),其中i、j 均为非 负整数,u、v 为0,1) 区间的浮点数,则这个像素得值 f(i+u,j+v) 可由原图像中坐标为 (i,j)、 (i+1,j)、(i,j+1)、(i+1,j+1)所对应的周围四个
10、像素的值决定,即:f(i+u,j+v) = (1-u)(1-v)f(i,j) + (1-u)vf(i,j+1) + u(1-v)f(i+1,j) + uvf(i+1,j+1)其中 f(i,j)表示源图像 (i,j)处的的像素值,以此类推这就是双线性内插值法。双线性内插值法计算量大,但缩放后图像质量高,不会出现像素值不连续的的情况。由于双线性插值具有低通滤波器的性质,使高频分量受损,所以可能会使图像轮廓在一定程度上变得模糊三次卷积法能够克服以上两种算法的不足,计算精度高,但计算亮大,他考虑一个浮点坐标(i+u,j+v)周围的 16 个邻点,目的像素值 f(i+u,j+v)可由如下插值公式得到:f
11、(i+u,j+v) = A * B * CA= S(u + 1) S(u + 0) S(u - 1) S(u - 2) f(i-1, j-1) f(i-1, j+0) f(i-1, j+1) f(i-1, j+2) B= f(i+0, j-1) f(i+0, j+0) f(i+0, j+1) f(i+0, j+2) f(i+1, j-1) f(i+1, j+0) f(i+1, j+1) f(i+1, j+2) f(i+2, j-1) f(i+2, j+0) f(i+2, j+1) f(i+2, j+2) S(v + 1) C= S(v + 0) S(v - 1) S(v - 2) 1-2*Abs(x)2+Abs(x)3 , 0=2S(x)是对 Sin(x*Pi)/x 的逼近(Pi 是圆周率)最邻近插值(近邻取样法)、双线性内插值、三次卷积法 等插值算法对于旋转变换、错切变换、一般线性变换 和 非线性变换 都适用。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。