视觉描述符
目录
视觉描述符
在计算机视觉中,视觉描述符或图像描述符是对图像、视频中内容的视觉特征的描述,或产生这种描述的算法或应用。它们描述基本特征,如形状、颜色、纹理或运动等等。
视觉描述符的引言
由于新的通信技术和互联网在我们社会中的大量使用,以数字格式提供的视听信息量正在xxx增加。因此,有必要设计一些系统,使我们能够描述几种类型的多媒体信息的内容,以便对它们进行搜索和分类。视听描述符负责内容描述。这些描述符对视频、图像或音频中的对象和事件有很好的了解,它们允许对视听内容进行快速和有效的搜索。这个系统可以与文本内容的搜索引擎相比较。虽然可以肯定的是,用计算机寻找文本相对容易,但要找到具体的音频和视频部分则要困难得多。例如,想象一下有人搜索一个快乐的人的场景。幸福是一种感觉,它在图像中的形状、颜色和纹理描述并不明显。对视听内容的描述不是一项肤浅的任务,它对有效利用这种类型的档案至关重要。类型描述符是找出数字图像中所包含的像素与人类在观察了一幅或一组图像几分钟后所回忆的内容之间的联系的xxx个步骤。视觉描述符被分为两大类。
视觉描述符的颜色
它是视觉内容的最基本的质量。有五个工具被定义为描述颜色。前面的三个工具代表了颜色的分布,最后一个工具则描述了序列或图像组之间的颜色关系。主导色彩描述符(DCD)可扩展色彩描述符(SCD)色彩结构描述符(CSD)色彩布局描述符(CLD)帧组(GoF)或图片组(GoP)纹理这是描述图像的一个重要质量。纹理描述符描述了图像纹理或区域的特征。它们观察区域的同质性和这些区域边界的直方图。描述符的集合由以下部分组成。均质纹理描述符(HTD)纹理浏览描述符(TBD)边缘直方图描述符(EHD)形状由于人类有能力通过物体的形状来识别物体,因此它包含重要的语义信息。然而,这种信息只能通过类似于人类视觉系统实施的分割来提取。如今,这样的分割系统还没有出现,但是有一系列的算法被认为是很好的近似算法。这些描述符描述了二维图像和三维体积的区域、轮廓和形状。形状描述符有以下几种。基于区域的形状描述符(RSD)基于轮廓的形状描述符(CSD)三维形状描述符(3-DSD)运动它由四个不同的描述符定义,描述视频序列中的运动。运动与序列中的物体运动和摄像机运动有关。

最后一个信息是由采集设备提供的,而其他信息则是通过图像处理实现的。描述符集是以下一个。运动活动描述符(MAD)相机运动描述符(CMD)运动轨迹描述符(MTD)翘曲和参数运动描述符(WMD和PMD)位置元素在图像中的位置被用来描述空间域中的元素。此外,元素也可以在时域中定位。区域定位描述符(RLD)时空定位描述符(STLD)特定领域信息描述符这些描述符提供了关于场景中的物体和事件的信息,但不容易提取,甚至当提取要自动完成时更难。然而,它们可以被手动处理。
描述符的应用
在所有的应用中,最重要的是描述符。