数字兰台
基于内容的图像检索
□ 辽宁石油化工大学图书馆卢红杰
摘要本文详细分析了基于内容的图像检索的特征提取方法、相似性度量方法以及语义检索方法, 在此基础上, 探讨了当前的一些主要的图像检索技术及其发展方向。
关键词图像检索特征提取
图像作为一种描述和存储信息的媒体, 不同于常规的字符数字。图像数据包含了复杂的难以用常规关键字描述的语义、视觉特性、时间和空间信息线索。因此, 我们需要研究一种新的结构化描述机制, 这些描述能够充分反映出图像和数据的内在特性和语义, 并且是结构化的, 便于进行大规模信息库的内容管理。所谓基于内容的多媒体检索, 是指利用计算机对多媒体的内容进行自动分析, 制成索引, 用户可以针对自己所需要的内容提出各种各样的查询要求。基于内容的图像检索技术实际上是一种模糊查询技术, 通过对图像提取一定的特征, 在特征空间进行相似性分析, 从而找出符合用户要求的图像集合。它主要包括图像特征提取、相似性度量、相关反馈等内容。
。图像特征的提取与表达是图像检索技术的基础。从广义上讲, 图像的特征包括基于文本的特征(如关键字、注释等) 和视觉特征(如色彩、纹理、形状等)两类。由于基于文本的图像特征的提取在数据库系统和信息检索领域已有深入研究, 本文主要介绍图像视觉特征的提取。如何从图像中提取有效的特征向量是影响图像检索系统性能的重要方面。它主要包括颜色特征、纹理特征、图像形状特征等。( 1) 颜色特征检索。颜色特征是图像检索中应用最为广泛的视觉特征, 与其他特征相比, 颜色特征非常稳定, 对图像本身的尺寸、方向、视角的依赖性较小。颜色直方图在许多图像检索系统中得到广泛应用, 其主要思想是根据颜色直方图统计颜色空间中每种颜色出现的概率, 然后对颜色之间的距离采用直方图相交来度量每个颜色直方图之间的相似性。( 2) 纹理特征检索。纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征, 它是所有物体表面共有的内在特性, 纹理特征包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系。( 3) 图像形状特征检索。不同于颜色和纹理特征, 图像形状特征的表达必须以对图像中物体或区域的分割为基础。形状特征表示的一个重要准则是要求对位移、旋转、缩放的不变性, 通常形状的表示可以分为全局特征和局部特征。全局特征包括纵横比, 环状度等
特征。局部特征包括对连续边界的分割点集。描述这两类形状特征的最典型方法分别是傅立叶描述符, 它和形状无关。
。从特征提取的分析可以看出, 图像视觉特征大多可以表示成向量的形式, 所以, 常用的相似度度量方法都是向量空间模型, 即将视觉特征看做向量空间中的点, 通过计算两个点之间的接近程度来衡量图像间的相似程度。目前, 在相似性度量方面, 常用的有 L1 距离、LZ 距离、直方图相交以及二次式距离等一些方法。这些方法将图像的视觉特征视为向量空间中的点, 以各种不同的方式度量了两个点之间的距离, 并以此来评价不同图像间的相似程度。
。为了使基于内容的图像检索技术能够应用于大规模的图像库, 必须提供一种有效的多维索引技术。虽然图像特征向量的维数非常高, 但是, 表征内在本质特征所需的维数并不高。所以, 在使用索引技术之前, 最好先进行维数缩减。目前, 常用的
基于内容的图像检索 来自淘豆网m.daumloan.com转载请标明出处.