哈尔特征
目录
哈尔特征
哈尔特征是用于对象识别的数字图像特征。 它们得名于它们与 Haar 小波的直观相似性,并被用于xxx个实时人脸检测器中。
从历史上看,仅使用图像强度(即图像每个像素的 RGB 像素值)会使特征计算任务的计算成本很高。哈尔特征考虑检测窗口中特定位置的相邻矩形区域,对每个区域中的像素强度求和并计算这些和之间的差值。 然后使用这种差异对图像的子部分进行分类。例如,对于人脸,常见的观察结果是在所有面部中,眼睛区域比脸颊区域更暗。 因此,用于人脸检测的一个常见 Haar 特征是一组位于眼睛和脸颊区域上方的两个相邻矩形。 这些矩形的位置是相对于检测窗口定义的,检测窗口充当目标对象的边界框。
在 Viola–Jones 对象检测框架的检测阶段,目标大小的窗口在输入图像上移动,并为图像的每个子部分计算哈尔特征。 然后将这种差异与将非对象与对象分开的学习阈值进行比较。 因为这样的哈尔特征只是一个弱学习器或分类器(其检测质量略好于随机猜测),需要大量的哈尔特征才能足够准确地描述一个对象。 因此,在 Viola–Jones 对象检测框架中,哈尔特征被组织在称为分类器级联的东西中,以形成强大的学习器或分类器。
哈尔特征相对于大多数其他特征的主要优势是它的计算速度。 由于使用了积分图像,任何大小的哈尔特征都可以在常数时间内计算出来(一个 2 矩形特征大约需要 60 条微处理器指令)。
矩形哈尔特征
一个简单的矩形哈尔特征可以定义为矩形内部区域像素之和的差值,它可以在原图像中的任意位置和比例。 这种修改后的特征集称为 2-矩形特征。 这些值表示图像特定区域的某些特征。 每种特征类型都可以指示图像中某些特征的存在(或不存在),例如边缘或纹理变化。 例如,一个 2 矩形特征可以指示边界位于黑暗区域和明亮区域之间的位置。
哈尔特征的快速计算
积分图像可以定义为与原始图像大小相同的矩阵形式的二维查找表。 积分图像的每个元素包含位于原始图像左上区域(相对于元素的位置)的所有像素的总和
每个哈尔特征可能需要四次以上的查找,这取决于它是如何定义的。
Tilted 哈尔特征
这用于增加特征集的维度,以试图改进图像中对象的检测。 这是成功的,因为其中一些特征能够以更好的方式描述对象。 例如,一个 2 长方形倾斜的哈尔特征可以表示存在 45° 的边。
![哈尔特征](http://map.s-jl.com/wp-content/uploads/sites/14/2024/09/20240928013027-66f75c33b9678.png)
虽然这个想法在数学上是合理的,但实际问题阻止了哈尔特征在任何角度的使用。 为了快速,检测算法使用引入舍入误差的低分辨率图像。 由于这个原因,旋转的哈尔特征不常用。