金字塔(图像处理)
目录
简介
金字塔,或称金字塔表示,是由计算机视觉、图像处理和信号处理界开发的一种多尺度信号表示,在这种表示中,信号或图像要经过反复的平滑和子取样。金字塔表示是尺度空间表示和多分辨率分析的前身。
金字塔的生成
有两种主要的金字塔类型:低通和带通。低通金字塔是通过用适当的平滑滤波器对图像进行平滑,然后对平滑后的图像进行子采样,通常沿每个坐标方向进行2倍的采样。
然后对得到的图像进行同样的处理,并多次重复这一循环。
这个过程的每个周期都会产生一个更小的图像,增加平滑度,但降低空间采样密度(即降低图像分辨率)。
如果用图形来说明,整个多尺度表示法看起来就像一个金字塔,原始图像在底部,每个周期产生的较小图像堆叠在另一个上面。
带通金字塔是通过形成金字塔中相邻级别的图像之间的差异,并在相邻级别的分辨率之间进行图像插值,以实现对像素差异的计算。
金字塔生成核
已提出各种不同的平滑核用于生成金字塔。在已经给出的建议中,由二项式系数产生的二项式核子作为一个特别有用的、理论上有充分依据的类别脱颖而出。
因此,给定一个二维图像,我们可以沿着每个空间维度应用(归一化)二项式滤波器(1/4,1/2,1/4)通常两次或更多,然后对图像进行二分之一的子采样。
这个操作可以根据需要进行多次,从而得到一个紧凑而有效的多尺度表示。
如果有具体的要求,也可以生成中间的尺度层次,其中的子采样阶段有时会被省略,从而导致一个过采样或混合金字塔。
随着当今CPU计算效率的提高,在某些情况下,在金字塔生成步骤中使用更广泛支持的高斯滤波器作为平滑内核也是可行的。
高斯金字塔
在高斯金字塔中,后续图像使用高斯平均数(高斯模糊)加权,并按比例缩小。每个包含局部平均数的像素都对应于金字塔较低层次上的一个邻域像素。这种技术特别是在纹理合成中使用。
拉普拉斯金字塔
拉普拉斯金字塔与高斯金字塔非常相似,但在每个级别之间保存了模糊版本的差异图像。只有最小的一级不是差分图像,以便能够使用较高一级的差分图像重建高分辨率的图像。这种技术可用于图像压缩。
可转向金字塔
由Simoncelli和其他人开发的可转向金字塔,是一个多尺度、多方向的带通滤波器组的实现,用于包括图像压缩、纹理合成和物体识别在内的应用。
它可以被认为是拉普拉斯金字塔的方向选择性版本,其中在金字塔的每一层都使用可转向滤波器组,而不是单一的拉普拉斯或高斯滤波器。
金字塔的应用
细节处理
拉普拉斯金字塔的层次可以被添加到原始图像中或从原始图像中移除,以放大或缩小不同尺度上的细节。然而,已知这种形式的细节处理在许多情况下会产生光晕伪影,从而导致了替代方案的开发,如双边滤波器。
一些图像压缩文件格式使用Adam7算法或其他一些交错技术。这些可以被视为一种图像金字塔。
由于这些文件格式首先存储大尺度特征,而细粒度的细节则在文件的后面,一个显示小缩略图或小屏幕的特定查看器可以快速下载足够的图像,以显示它的可用像素–因此一个文件可以支持许多查看器的分辨率。