基于新的相似度量和相关反馈算法的图象检索系统

基于新的相似度量和相关反馈算法的图象检索系统

戴声扬[1]2004年在《基于新的相似度量和相关反馈算法的图象检索系统》文中研究说明基于内容的图象检索是近年来非常活跃的研究领域。它有着极其广阔的应用前景,但是在相似度量和捕捉语义信息方面仍然存在大量问题。图象空间信息的获取需要分割结果的辅助,传统的基于图象域的分水岭算法无法捕捉全局的颜色信息,而基于特征域的方法又缺乏恰当的模型描述。本文采用了两步分割的框架。在预分割过程中,采用基于L*a*b*叁维颜色直方图的分水岭算法对颜色空间进行聚类,然后利用基于最高置信度优先算法的马尔可夫随机场模型得到最终的结果,从而避免过高的计算复杂度。对经典图象的分割结果证明了这一算法的有效性。本文将这一算法应用于图象检索和医学图象处理领域,取得了良好的效果。图象描述和相似度量是图象检索系统的中心环节,如何消除分割不精确对相似度量结果带来的不利影响是基于区域的检索系统的一个关键问题。本文提出了图象的两层描述方案,以避免过分割带来的空间信息过多和欠分割带来的区域之间难于匹配的问题。在这一描述框架下,进而提出非对称区域匹配的方法来建立区域之间多对一的映射,进而计算图象之间的相似度。这样可以避免解决复杂线性规划问题,同时使区域之间的比较更为合理。针对检索问题的特殊需要,本文采用了新的空间信息描述方法,可以结合多方面的空间信息。多方面的实验结果表明,本文提出的算法可以取得很好的效果并具有相当的鲁棒性。相关反馈是弥补图象低层特征和高层语义信息之间差别,获取用户主观意图的重要途径。本文提出基于区域的AdaBoost算法进行机器学习。统计实验证明了此算法的有效性,同时对具体结果的分析表明此算法可以合理捕捉用户意图。另外,本文工作还涉及了图象库基于相似度的可视化这一问题。在上述研究工作的基础上搭建的实用的图象检索系统取得了令人满意的效果。

万华林[2]2002年在《图象检索中高层语义和低层可视特征的提取研究》文中认为基于内容的图象检索(CBIR)是一个复杂而又富有挑战性的问题。当前通常的研究思路是,通过提取图象的低级可视特征(例如,颜色、纹理、形状等)来表示图象的内容,但是这些所谓“内容”反映的只是图象的一些客观统计特性,并不能真正被人类视觉理解。我们发现,CBIR的本质是在自动提取图象低层可视特征的基础上,从图象库中找出与查询图象相关或相似的图象。这实际上蕴涵着一个基本前提——语义相关的图象具有相似的可视特征。这就使得图象语义分类成为可能。图象分类是一种受限的图象理解,目的是根据图象的可视特征将图象归并到某一语义类,从而实现图象语义特征的提取,这不仅有助于图象库的语义组织,而且能实现图象的自动标注,从而极大地改善图象检索的性能,使CBIR真正成为一种实用的技术。 基于以上动机,本文着重研究了如何从计算机自动提取的图象可视特征得到图象的高层语义特征,并以此为中心对图象检索相关问题进行了深入地探讨。下面简要介绍作者在论文研究期间所从事的主要工作以及取得的进展: (1)一种新的图象纹理谱描述子 本文提出的纹理谱描述子通过比较邻域内象素点灰度的变化来刻画象素点的纹理,而不是常用的绝对灰度值,使得提取图象的纹理谱特征成为可能;注重邻域内像素灰度的显着变化,能有效地刻画图象的粗糙度,这些特点都说明本文的纹理谱描述子和人类视觉对图象纹理的感知是一致的。 (2)用最大权二部图匹配度量图象的相似性 本文提出了一种基于最大权二部图匹配的多区域图象相似性度量算法,它考虑图象的局部特征和图象的空间分布信息,在度量图象的相似性时,综合考虑图象各区域的内容,这种方法不但降低了由于分割不精确带来的影响,而且降低了用户操作的难度。 (3)非线性图象相似性度量 本文先用非线性映射Φ将特征向量从输入空间映射到高维特征空间,在不真正实现非线性映射Φ的情况下,用核函数代替点积,计算图象的相似度。其优点是在不增加计算复杂性的情况下显著提高了图象相似性度量函数的判别能力,图象检索实验证明了我们的观点。 (4)用支持向量机进行图象语义分类 本文利用支持向量机(SVM)在统计学习方面表现出的优越性能,结合图象的颜色、纹理特征谱,将图象归并到具有一定语义特征的类,取得了较好的效果。 (5)用基于核函数的判别式分析(KDA)解决多类问题 虽然支持向量机在图象分类中表现出了较好的性能,但是它解决的是两类问题,而现实中的图象类别是多种多样的,如果用两两分类的方法,结果所得到的是多个分类器,这对真实图象分类将会产生较大的干扰。本文提出了一种称为KDA(Kernel-based Discriminant Analysis)的图象分类算法,并给出了详细理论推导。它不但能解决多类问题,避免了贝叶斯判决后验概率的估计,而且用核函数的思想将判别式分析从线性情况

韩军伟[3]2003年在《基于内容的图象检索技术研究》文中研究表明计算机技术、多媒体技术以及Internet技术的长足发展导致大量图象的出现,如何有效地、快速地从大规模的图象数据库中检索出需要的图象是目前一个相当重要而又富有挑战性的研究课题。基于内容的图象检索技术的研究正是为了解决利用自动获取的图象特征,从图象数据库中检索出相关图象的问题。近年来,此项技术的研究非常活跃,在许多领域都有应用。 本论文围绕基于内容图象检索中的一些关键技术,包括提取图象低层特征、图象间相似度的度量及相关反馈等技术,进行了一些探索性的研究,研究的内容属于目前图象处理和信息检索领域的研究重点,具有相当的理论意义和实际应用价值。 本文的主要贡献总结如下: 1. 深入分析和研究了基于内容图象检索领域的一些关键技术,如:相关反馈、颜色、形状、纹理等低层图象特征的描述以及图象间的相似性度量准则等。并且,通过在同一测试环境下的实验,对一些经典的方法进行了比较; 2. 提出了一个基于显着边缘的图象检索方法。它利用独立边界自增强算法来连结边缘和增强显着边缘,依靠增强后的结果,就能够较容易地提取图象中的显着边缘,使用显着边缘的特征代表图象的形状特征。然后,采用一种“多对多”的匹配策略来度量图象间的相似性,而这种策略允许图象中的一条显着边缘与另一幅图象中的多条显着边缘进行匹配,图象间的相似性由所有的有效匹配共同决定,它对边缘提取不准确具有一定的鲁棒性; 3. 提出了一个基于显着兴趣点的图象检索算法。此算法首先使用自适应滤波器对图象进行平滑,然后使用经典的兴趣点检测算法发现兴趣点。由于自适应滤波器具有平滑细节,增强显着边缘的功能,因此,这种方法能够保证兴趣点大都存在于图象的显着边缘上。接下来利用兴趣点周围区域的颜色特征来代表图象的特征,这样,兴趣点的形状特征就和其周围区域的颜色特征有机的结合起来,图象间相似度的计算就基于这种特征。实验证明,这个算法简单、有效; 4. 提出了一个基于图象中用户感兴趣物体的图象检索算法。这个算法的一个突出特点是:十分符合用户在检索时的主观思路。它首先对图象进行分析,提取出其中用户感兴趣的物体,再利用感兴趣物体的颜色和纹理特征来表征图象的特征,进行图象匹配和相似性度量计算。在这个算法中,核心技术——感兴趣物体的自动提取,结合视觉感兴趣模型和图象分割中的区域增长技术来实现。大量的实验结果表明,此检索方法相当有效。而且,图象中感兴趣物体的自动提取技术还可以应用到其它领域,如基于内容的图象压缩,目标识别等; 5. 提出了一个基于Variogram函数的纹理图象分析和检索方法。此方法将两种不同类型的纹理——规则纹理和不规则纹理的分析和检索统一到一个框架摘要下。在检索之前,利用物riogram函数,根据图象的特征,自动预测查询图象的纹理类型,然后,对于不同类型的纹理,采用不同的策略去分析。对于规则纹理,使用较大的尺度提取其周期性和方向性;对于不规则纹理,则使用较小的尺度以观察其随机性。根据提取的纹理特征,计算纹理谱和自带纹理表,最终形成特征矢量,来进行相似度度量和图象检索。实验证明,此方法相当适合于实际的图象检索系统;6.提出一个记忆学习的图象检索模型。此模型将长期学习与短期学习结合起来 以提高检索效率:首先,通过搜集用户相关反馈的信息组成一个图象语义连 结网络,此网络能够纪录图象间符合用户主观的语义层相似度;其次,根据 语义连结网络,进行图象在语义层的分类,进而估计图象之间潜在的语义相 似度;最后,图象间的相似度由叁个因素来决定,视觉特征、语义连结网络 和潜在语义。在此模型中,长期学习是指从记忆的大量用户日志中学习语义 信息的过程,而短期学习是指常规的相关反馈过程。长期学习与短期学习的 关系是:长期学习依靠短期学习的积累,而短期学习需要长期学习来指导。 大量的实验证明,此图象检索模型的检索准确率相当高,且能够满足用户的 多种查询请求。

程小梅[4]2008年在《基于图像的昆虫识别研究与设计》文中指出昆虫是动物界中一个十分庞大的类群,种类超过一千万种,从事昆虫鉴定的人员仅限于数量极有限的昆虫分类学专家。随着计算机图像处理技术的发展,人们希望通过计算机技术来识别昆虫、研究昆虫。应用模式识别技术建立昆虫的识别系统,不仅科学研究意义重大,而且经济效益可观。本文通过基于图像的模式识别技术对昆虫图像进行处理,实现昆虫图像的自动识别。针对昆虫图像的特点,采用了适合昆虫图像的特征提取方法,然后应用相似性匹配算法和相关反馈技术对昆虫图像进行了分析和处理。论文的主要工作如下:1)图像预处理。主要应用图像分割技术对昆虫图像预处理,采用了基于多特征的EM算法对昆虫图像进行分割,提取出昆虫对象本身。实现了昆虫对象与背景的区域分割。2)基于视觉特征的昆虫识别。针对10种昆虫图像,给出了结合灰值游程和边缘特征提取昆虫图像特征的方法,实验表明这种综合特征抽取能较好的对10种昆虫图像识别;研究了尺度不变特征算子SIFT,将其应用到昆虫图像识别中,实现了基于SIFT的昆虫图像识别。3)多特征融合相关反馈技术。研究了多特征融合检索中的相似性度量及特征归一化等技术,并将其应用于昆虫图像的识别中。给出了基于KNN的权系数调整的相关反馈方法,实现了基于游程长度,灰度共生矩阵,颜色直方图,矩融合的多特征相关反馈方法。将基于SVM的相关反馈方法应用到昆虫图像识别中,实验表明,这两种方法具有较高的反馈效率和准确率,有效提高了系统的识别性能。4)系统设计与实现。采用VS.net和SQL2000实现了基于图像的昆虫识别系统。系统实现了对昆虫图像的在线监测、彩色图像读取,图像特征自动入库,相似匹配,多特征融合查询,多特征相关反馈及自动统计识别结果等功能。

张明[5]2003年在《基于内容的图象相似性度量技术研究及其在水利中的应用》文中研究指明随着图象数据的大量涌现,基于内容的图象检索技术已成为研究热点,其目的是为了对大容量图象库提供有效的检索手段。本文将信息论和模糊集理论运用于基于内容图象检索方法的研究,重点研究了基于信息熵的图象检索技术、图象相似性度量方法、模糊检索和动态相关反馈机制。以防汛决策信息查询为背景,探讨了基于内容工情图象检索系统的设计与实现中的关键技术。本文的主要研究工作如下:1.从人类色彩感知的角度出发,研究了用于图象检索的色彩空间,特征提取和相似性度量等问题,将HSL色彩空间进行了划分,对每两种色彩之间的相似度进行了重新定义,便其更好地符合人对图象色彩的辨别能力。并将色彩直方图进行了扩充,解决了两幅图象所含色彩数目不同时如何进行匹配的问题。2.将信息论中的信息熵概念引入图象检索,定义了图象墒空间、熵差的概念,研究了图象熵的性质,探讨了基于图象熵的相似性度量方法和实现算法,该方法可将n维直方图空间变为1维,提高了图象检索的效率,改善了图象检索系统的性能。3.提出了基于信息熵的多精度相似匹配和多维散列索引技术。多精度色彩匹配将图象划分成了许多子图块,每一子图都具有其相应的色彩直方图与图象墒,作为细粒度匹配的基础。同时证明了在熵空间采用多精度分级检索的正确性,并能更好地支持子图象的查询。4.研究了模糊检索方法和相关反馈机制在图象检索中的应用,提出了一种模糊图象数据模型和模糊空间的概念,该模型将可视特征、空间特征、语义特征看作超属性,既充分利用了传统关系数据库的优点,同时又考虑了图象数据以及模糊查询的特点,文中提出的模糊空间和模糊相似性度量方法能支持基于模糊特征的图象查询,较好地体现用户图象查询的应用需求,文中定义的语义模板和相关反馈机制能在一定程度上表达用户的查询语义,提高图象检索的准确率和易用性。5.研究了图象检索技术在水利行业中的应用,提出了关系—层次—面向对象的混合数据模型,并扩展数据模型以满足多媒体数据与空间数据的特殊情况,摘要研究了系统实现的具体技术方案,设计并实现了一个用于工情图象检索模型系统。

王雪飞[6]2002年在《基于内容的图象检索技术研究》文中指出随着多媒体、网络技术的飞速发展,图象的应用日益广泛,基于内容的图象检索技术已经成为国内外研究的热点。它结合了图象处理、模式识别、图象理解、数据库等技术,是一项在理论研究和实际应用中都极有前途的新技术。 本文全面地论述了基于内容的图象检索技术的发展概况,设计了一个图象检索系统的框架,并且提出了系统的数据结构模型。 基于形状特征的图象检索是基于内容的图象检索技术中一项关键技术。本文着重从形状特征的提取、相似度量准则的定义和匹配策略的运用叁方面对基于形状特征的图象检索技术进行了全面的分析和评述。 本文实现了形状特征提取模块,具体实现的过程是:通过图象的滤波、边缘检测、二值化处理得到图象的边界轮廓,最后将轮廓边界简化表示为近似多边形。 提出一种基于形状的图象匹配算法:互为模板的匹配算法。 (1) 经实验证明此匹配算法不受平移、旋转、缩放等因素的影响。 (2)此算法的优点还在于:对于那些局部有较小差异的多边形,可以准确地实现匹配定位。采用了优化方法,一定程度上避免了利用边和角等局部特征定位不准确的缺点,可应用于局部缺损的图形与原图之间的检索和相似性度量。 (3)同时,由于此算法能够实现不同边数多边形之间的匹配,为确定外观形状差别较大的多边形之间的相似程度提供了一种度量手段。 通过考察人的视觉特征可发现:人对形状的识别是一个分层识别过程。本文正是基于这种分层的思想,定义了凹多边形的模式分解方法和分层加权测度模型。综合考虑了形状、位置、方向、大小因素的影响,实现了凹多边形的匹配。

施智平[7]2005年在《大规模视频库的组织与检索》文中研究说明Internet的普及和多媒体技术的发展使人们面临呈爆炸性增长的视觉信息,基于内容的视频检索有着广阔的应用前景,成为非常活跃的研究领域。本文主要针对大规模视频库的组织与检索技术进行研究,目的是实现对海量视频数据的存储、有效组织、快速精确的检索。本文研究内容涉及特征索引方法、视频语义分类方法、相关反馈方法、视频片段的相似度量以及视觉内容特征的表示等问题。取得的主要成果包括:1.基于关键帧序列融合的视频片段检索方法:相似视频片段之间至少有一对关键帧相似,所以首先查找至少有一个相似关键帧的片段作为候选视频片段,然后再计算候选视频片段与范例视频片段的相似度,可以避免无关的视频片段相似度的计算。本文提出用融合多种特征的联合分布直方图来表示视频内容的方法,并使用颜色、纹理联合分布直方图进行视频子镜头分割,子镜头用关键帧表示。检索时,对范例视频片段的每个关键帧检索到相似的关键帧,所有的相似关键帧按照时间连续性融合为视频片段,它们与范例视频片段的关键帧之间形成多对多的匹配关系。删除冗余的关键帧匹配对,形成优化的关键帧匹配序列,然后综合考虑视觉相似性和时间顺序相似性计算整个视频片段的相似性。实验表明本文的方法符合人的视觉特性并有较低的时间复杂度。2.基于语义监督的特征聚类索引方法和基于Bayes的视频语义分类方法:理想的视频库组织方法应该把语义相关并且特征相似的视频的特征向量相邻存储。针对大规模视频库的特点,在语义监督下作视频库低层特征的层次聚类划分,当一个聚类中只包含一个语义类别的视频时,为这个聚类建立索引项,这个聚类称为索引聚类。统计低层特征和高层特征的概率联系,构造Bayes分类器。用分类器可以对其它视频数据作语义分类。查询时对用户的查询范例,用Bayes分类器对查询范例作语义分类,在该语义范围内查询相似视频片段。本文的方法不仅提高了检索速度而且提高了检索的语义敏感度。3.集成低层特征和语义信息的相关反馈方法:提出了一种基于Bayes理论的低层特征和语义信息相结合的相关反馈方法,只用很少的反馈次数就可达到很好的效果。本文认为正反馈和负反馈的低层特征空间都是多个分量的混合高斯分布,以便更准确的估计查询空间的复杂分布,并且把正负反馈样本扩展到样本所在的索引聚类,以这些聚类形成的分类器修正相似距离。同时根据正负反馈样本的语义信息用Bayes方法推测正反馈语义空间和负反馈语义空间,计算数据库样本属于正反馈语义空间和负反馈语义空间的概率,修正视觉相似性,得到语义相近的查询结果。4.一种快速高效的纹理谱描述子:依据纹理视觉特性提出了纹理模式等价类

葛晓菁[8]2005年在《图象检索中纹理特征提取的研究》文中进行了进一步梳理多媒体技术和数字图书馆的发展和应用,使基于内容的检索技术成为图象处理和计算机视觉的前沿问题。基于内容的检索技术就是直接根据描述媒体对象内容的各种特征进行检索,它的研究目标是提供在没有人参与的情况下能自动识别或理解图像重要特征的算法。本文主要针对基于内容的图象检索技术中纹理特征展开研究,其所谓的内容包括图象纹理特征的分析和图象纹理特征的提取。首先介绍了国内外基于内容的图象检索系统的研究现状,基本原理,查询方式以及应用领域。其次,详尽地描述了纹理和纹理特征的定义,介绍了几种常用的纹理分析方法,有灰度直方图、边缘方向直方图、空间灰度共生矩阵、灰度-梯度共生矩阵和基于结构的纹理分析方法;重点介绍了Gabor滤波器和Gabor小波等特征提取方法以及高斯归一化的原理和方法,并对Gabor小波进行了高斯归一化处理。另外,本文还介绍了相似性度量方法的特点和分类,以及在基于内容的图象检索技术中相关性反馈技术。最后,本文设计了一个图象检索系统,并对系统的各个模块及其功能进行了介绍,实验结果表明归一化后的Gabor小波特征比未归一化的Gabor小波的检索效率提高了5-6个百分点, 对于大部分图象,亮度变化比较明显,尤其是背景单一,层次分明的图象,检索效果更好。总结了本文的工作,对研究热点进行了展望。

刘亘轶[9]2006年在《基于内容的图像检索关键技术研究与系统设计》文中进行了进一步梳理基于内容的图像检索(CBIR)是当前计算机视觉、图像数据库与数据挖掘等领域研究的热点之一。本论文主要围绕目前国内外基于内容图像检索领域的现状和发展趋势,对图像检索的关键技术和方法进行了研究,并对图像检索的基础也就是图像特征的提取作了详细的分析和实现。针对具体的图像数据库,设计了一个基于相关反馈的图像检索实验系统,在此系统的研究基础上做了如下的研究工作:本文主要对模糊理论在图像检索中的应用进行了细致的研究,具体实现了一种综合颜色模糊直方图特征和纹理谱模糊直方图特征的检索方法及相应的相似性度量算法,并针对实验结果进行了研究和分析;本文详细研究了用于图像数据库的索引技术,并针对实验系统引入了一种改进的模糊索引方法;此外,本文还研究了相关反馈技术在图像检索系统中的应用,实现了一种基于相关反馈的交互式图像检索模型,并设计了系统框架。从实验结果看,本文采用的算法折中考虑了计算量和检索效率,使该系统很大程度的提高了图像检索的效率和准确率,具有较好的检索性能。

刘智云[10]2007年在《基于内容的图像检索研究》文中认为随着多媒体技术因特网络的迅速发展,图像来源不断扩大,大容量高速存储系统为图像的海量存储提供了基本保障,各行各业对图像的使用越来越广泛,图像信息资源的组织、管理和检索显得日益重要。为提高图像资源的利用率,如何有效地、快速地从大规模的图像数据库中检索出需要的图像是目前一个急需解决的重要问题,基于内容的图像检索技术和基于语义的图像检索技术正是解决这一问题的有效途径。本文介绍了基于内容的图像检索的背景、应用、研究的现状和发展趋势以及现有的图像检索系统;详细阐述了基于内容的图像检索研究的各个关键技术。并在深入研究相关反馈技术的基础上,主要围绕图像内容的多义性展开详细的研究。图像的可能性隶属度可以表示出图像的多义性。在分析图像可能性隶属度的基础上设计了一种基于可能性聚类的自适应相关反馈的图像检索方法。该方法首先利用可能性聚类算法将图像库中的图像分类,这样查询仅在已分好的类中进行,然后通过相关反馈技术在线理解用户的查询意图,自动调整相似度测量准则以符合用户需求。基于对象的图像检索就是根据图像中是否包含某个(或某些)对象来决定其是否为用户所需。基于人脸对象的图像检索具有极大实用价值,它的关键技术之一是人脸识别。人脸识别可以描述为:在已知的人脸样本库中,利用图像处理和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。对此本文也研究了人脸检测与人脸识别的方法、分类器的设计以及多分类器融合的识别方法。并且根据粗糙神经网络可以缩短训练时间和优化网络拓扑结构的特性,提出了一种基于粗糙神经网络的多特征领域多分类器融合的人脸识别方法。

参考文献:

[1]. 基于新的相似度量和相关反馈算法的图象检索系统[D]. 戴声扬. 清华大学. 2004

[2]. 图象检索中高层语义和低层可视特征的提取研究[D]. 万华林. 中国科学院研究生院(计算技术研究所). 2002

[3]. 基于内容的图象检索技术研究[D]. 韩军伟. 西北工业大学. 2003

[4]. 基于图像的昆虫识别研究与设计[D]. 程小梅. 西北大学. 2008

[5]. 基于内容的图象相似性度量技术研究及其在水利中的应用[D]. 张明. 河海大学. 2003

[6]. 基于内容的图象检索技术研究[D]. 王雪飞. 大连理工大学. 2002

[7]. 大规模视频库的组织与检索[D]. 施智平. 中国科学院研究生院(计算技术研究所). 2005

[8]. 图象检索中纹理特征提取的研究[D]. 葛晓菁. 哈尔滨理工大学. 2005

[9]. 基于内容的图像检索关键技术研究与系统设计[D]. 刘亘轶. 西安电子科技大学. 2006

[10]. 基于内容的图像检索研究[D]. 刘智云. 兰州理工大学. 2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

基于新的相似度量和相关反馈算法的图象检索系统
下载Doc文档

猜你喜欢