文件打马赛克

文件打马赛克是一个将文件的多个重叠的快照图像缝合在一起以产生一个大的、高分辨率合成物的过程。用手将文件滑到一个固定的桌面上的照相机下,直到文件的所有部分都被照相机的视场拍到。当文件在相机下滑动时,视觉系统会粗略地跟踪文件的所有运动。文件被周期性地拍下,使连续的快照重叠了大约50%。然后,系统找到重叠的一对,并反复缝合它们,直到所有的对都被缝合成一块文件。文件的拼接可以分为四个主要过程。

文件打马赛克的追踪

用于有效匹配的特征检测

特征检测是寻找使一个图像与另一个图像对齐的转换过程。有两种主要的特征检测方法。基于特征的方法:运动参数是由点的对应关系来估计的。这种方法适用于有大量稳定和可检测特征的情况。无特征方法:当两幅图像之间的运动较小时,使用光流估计运动参数。另一方面,当两幅图像之间的运动量较大时,使用广义的交叉相关来估计运动参数。然而,这种方法需要昂贵的计算资源。每幅图像被分割成列、线和字的层次结构,以匹配跨图像的有组织的特征集。斜角估计和列、线和字的查找是特征检测操作的例子。

倾斜角估计

首先,估计文本行与图像光栅线的角度(倾斜角)。它被认为是在±20°的范围内。在图像中随机选择一小块文字,然后在±20°的范围内旋转,直到沿栅格线加起来的这块文字的像强度的方差达到xxx。为了确保找到的倾斜角度是准确的,文件镶嵌系统在许多图像斑块上进行计算,并通过找到单个角度的平均值,再加上每个斑块的像素强度的方差,得出最终的估计值。寻找列、行和字在这个操作中,去斜的文件被直观地分割成列、行和字的层次。通过对去偏析图像应用索贝尔算子并对输出进行阈值处理,得到二元梯度的去偏析图像,可以消除去偏析文件对光照和页面颜色的敏感性。

文件打马赛克

该操作可以大致分为3个步骤:列分割、行分割和词分割。如图4所示,通过垂直加总像素,可以很容易地从二元梯度、去倾斜的图像中分割出列。每行的基线以与列分割过程相同的方式进行分割,但在水平方向上进行分割。

最后,通过在每个分割的行上应用垂直过程,对单个词进行分割。这些分割很重要,因为文档马赛克是通过匹配重叠图像对中的词的右下角而创建的。

此外,分割操作可以在行和列的层次结构中可靠地组织图像列表。分割操作涉及到对二元梯度、去偏的图像进行大量的求和。

0

点评

点赞

相关文章