基于形状边缘方向直方图的图像检索算法研究

更新时间:2023-08-16 01:41:01 阅读量: 教学研究 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

基于形状边缘方向直方图的图像检索算法研究

 2009年第8期

文章编号:100622475(2009)0820144203

计算机与现代化

JISUANJIYUXIANDAIHUA

总第168期

基于形状边缘方向直方图的图像检索算法研究

陈泽滨,黄晓华

(东南大学儿童发展与学习科学教育部重点实验室,南京摘要:描述了一种基于边缘方向直方图(EdgeDirectionHistograE,算法提取的特征向量同时满足尺度、平移和旋转不变性。。关键词:边缘方向直方图;边缘检测;中图分类号:TP391.i:3969/j.issn.100622475.2009.08.040

IRetrievalArithmeticBasedonEdgeDirectionHistogram

CHENZe2bin,HUANGXiao2hua

(KeyLaboratoryofChildDevelopmentandLearningScience,MinistryofEducation,SoutheastUniversity,

Nanjing210096,China)

Abstract:Thispaperdescribesanextractionmethodofshapefeatureofimagesbasedonedgedirectionhistogram.Theshapefea2tureextractedisinvarianttoscale,translationandrotation.Theexperimentresultilluminatesthatthemethodhasagoodretrievalperformanceforimagesthatcontainasinglebackgroundandobviousshape.Keywords:edgedirectionhistogram;edgedetection;imageshape;imageretrieval

0 引 言

图像检索技术始于上个世纪70年代,当时主要

是基于文本(Text2Based)的检索,即使用关键词和描述性文本进行检索,要求用户对文本特征的描述具有一定的准确性和规范性。但是随着大规模数字图像库的出现,基于文本的检索技术暴露出了自身的缺点:(1)大量的注释性文字的手工输入需要花费大量的人力物力;(2)不同人对图像的理解存在主观性;(3)文本描述难以表达完整的图像信息。因此严重降低了图像检索的效率和准确性。

进入90年代,基于内容的图像检索(Content2BasedImageRetrieval,CBIR)技术应运而生,其思路是:利用图像自身的视觉特征,如:颜色、纹理结构、形状、空间关系作为图像的内容进行匹配、查找。它通过利用已有的算法,使得特征提取和匹配完全可以由机器自动完成,检索过程不需要太多的人为干预和解

释,这就克服了手工注释的低效和二义性。

在图像的视觉特征中,人们采用的多数是基于颜色、纹理特征的图像检索。其实,在图像的视觉特征中,形状作为物体的本质特征之一,它不随周围如亮度等环境的变化而变化,是物体稳定的特征,相对于颜色、纹理等,显得更为直观,并且携带了一定的语义

[3]

信息,形状特征本身的优点使得它可以将不同的图像目标区分开。

1 边缘方向直方图

边缘方向直方图(EdgeDirectionHistogram,EDH)是描述图像形状的一种方法。图像中目标的形状是由边缘勾勒出来的。边缘是图像灰度变化的地方,对应目标或目标和背景的边界,所以对边缘方向进行统计得到的直方图的形状将在一定程度上反映图像中的形状信息。如果图像中有比较规则的目标,则边缘方向直方图会有明显的周期性;否则,边缘方向直方图会显得比较随机。

收稿日期:2008212208

作者简介:陈泽滨(19832),男,广东普宁人,东南大学硕士研究生,研究方向:图像检索,模式识别;黄晓华(19832),男,博士研究生,研究方向:图像处理,模式识别。

基于形状边缘方向直方图的图像检索算法研究

 2009年第8期陈泽滨等:基于形状边缘方向直方图的图像检索算法研究

e(i,j)255  if  |M(i,j)|ΕMthreshold0   otherwise

145 (5)

1.1图像边缘方向直方图的提取

为了求取边缘方向直方图,需要提取图像中目标的边缘。基于形状的图像检索技术对于边缘的定位要求很高,这将会直接影响到最终的检索效果。图像边缘检测的方法很多,主要有Robert算子、Sobel算

子、Prewitt算子和LOG(LaplaceOfGauss)算子等,而Canny算子是目前图像边缘检测方法中最好的,它是Canny于1986年提出的,这样在e(i,j)=255处的梯度方向为

θ=arctan)  for  e(i,j)=255

P(i,j)

(6)

θ≤360,为了计算方便,θ量化为72份,每0≤

Histogram[i]/5],:

Histogram[i]/nEdge

精度。

Canny:

假设I是n,器(GaussianS滤波,消除图像中的噪声:

22

H(i,j)=δe

)δ22

其中nEdge为所有边缘方向的个数。

但是,边缘方向会受到图像旋转的影响,进而影响到其直方图,采用下面的平滑公式对直方图进行平滑:

G(i,j)=f(i,j)3H(i,j)(卷积)

(1)

Histogram[j]s=

j+k

其中δ是高斯函数的散步参数,用于控制平滑程度(本文中取值为1);f(i,j)为待平滑的图像数据,即图像I中的像素,G(i,j)为平滑后的图像数据,H(i,j)是高斯滤波函数。

Histogram[i]2k+1

(7)

Histogram[j]s为平滑后的直方图,参数K在本

文中取1。

通过以上步骤求出了灰度图像I的满足平移、尺度和旋转不变性的边缘方向直方图,最后只需用欧拉距离来计算两幅图像的边缘方向直方图距离即可得出它们之间的相似性。

接着对滤波后的图像求梯度,沿着x方向的梯度(水平梯度)为:

P(i,j)={G(i,j+1)2G(i,j)+G(i+1,j+1)2G(i+1,j)}/2,0<i,j<n

(2)

2 算法函数介绍

算法的准确性需要通过实验结果来验证,在Windows环境下开发一个基于上述算法的图像检索系统,下面是主要的算法函数介绍:

kernel=FilterGaussianMask(sigma,masksize);//构造高斯滤波器/高斯核sigma=1、masksize=9。ImageConvolution(3img,m-x,m-y,masksize,ker2nel);

//图像卷积,返回平滑去噪后的图像,kernel为高斯核函

表1 x方向梯度模板

j21i21ii+1

000

j0

j+1011

2121

沿着y方向的梯度(垂直梯度)为:

Q(i,j)={G(i,j)-G(i+1,j)+G(i,j+1)2G(i+1,j+1)}/2,0<i,j<n

(3)

数,masksize=9。

ImageGradient(pimgbuf0,m-x,m-y,masksize,kernel);//求取图像梯度,此时的kernel为梯度模板,masksize=3,x、y方向梯度分别为p、q。

MyMathFunctionAtan(p[i],q[i]);//梯度方向(角度),θ=atan(q[i]/p[i])。

ImageEdgeDirectionHistogram(pimgbuf0,x,y,thr,BIN-NUM).//二值化图像,提取出边缘:幅值magnitude>thr,像素点edge=255,否则edge=0;计算edge=255的点的梯度方向,并

表2 y方向梯度模板

j21i21ii+1

000

j01

j+101

2121

(i,j)=|P(i,j)|+|Q(i,j)|,  求取梯度后的图像,I′

通过下面两个式子求取幅值并勾勒出图像的边缘(即e(i,j)=255的像素点):

M(i,j)=

22

P(i,j)+Q(i,j)

进行统计,最后归一化,以数组形式返回图像的归一化边缘方向直方图。其中,thr为门限值(用于提取边缘取100),BIN-NUM为量化份数,等于72。

(4)

基于形状边缘方向直方图的图像检索算法研究

146 计 算 机 与 现 代 化2009年第8期

3 实验结果

笔者用此算法在VisualStdio2003平台下开发了一个基于形状的图像检索系统,对于具有单一背景、形状明显的图片具有较好的检索效果。图像检索系统一般采用查全率和查准率进行衡量:查全率指系统返回的查询结果中的相关图像的数目占图像库中所有相关图像数目(包括返回的和没返回的)的比例;查准率指在一次查询过程中,的相关图像的数目,和不相关的图像)以Microsoft图特征值的数据库,,点击检索按钮后,系统提取待查询图片的边缘方向直方图,并计算其与数据库中的特征值的距离,然后进行归一化,根据值的大小从数据库中按顺序返回一定数量的图片。实验中选取的待查询图片与库中的图片不一样,并以相似度值0.5作为界限,即相似度值大于0.5的为合格的结果。经计算,系统的查全率和查准率均能达到95%以上。图1是算法的检索示例:图1(a)是待检索图片,图1(b)是检索结果

性的问题。本文采用的方法很好地达到了这一要求,经实验表明,该方法具有较好的检索效果。但是对于形状的描述是一个非常复杂的问题,至今还有找到形状的确切定义。另外,由于图片内容比较丰富,例如包含颜色信息等,这时采用综合多特征的方法,会比。随着图像检索技术的发展,:

[1] DengshengZhang,GuojunLu.Reviewofshaperepresenta2

tionanddescriptiontechniques[J].PatternRecognition,2004,37(1):1219.

[2] 章豫晋.基于内容的视觉信息检索[M].北京:科学出版

社,2003:1022106.

[3] 陈栋梁,周晓君.基于内容的图像检索技术研究[J].计

算机与数学工程,2007,35(5):1402142.

[4] 黄晶.基于形状的图像检索研究[D].合肥:中国科学

技术大学,2007.

[5] CannyJ.Acomputationalapproachtoedgedetection[J].

IEEETransactionsonPatternAnalysisandMachineIntelli2gence,1986,8(6):6792698.

[6] AlbarezL,LionsPL,MoreJM.Imageselectivesmoothing

andedgedetectionbynon2lineardiffusion[J].SIAMJ.Nu2mericalAnalysis,1992,29(1):1822193.

[7] AmoidWM,MarcelW,SimoneS,etal.Content2based

imageretrievalattheendoftheearlyyears[J].IEEETransactiononPatternAnalysisandMachineIntelligence,2000,22(12):134921380.

[8] 章毓晋.图像处理和分析基础[M].北京:高等教育出版

(a

)

社,2002.

[9] 黄学军,邢爱凤,解培中.综合利用边缘和颜色特征的图

像检索[J].南京邮电学院学报,2004,24(1):27230.

[10]OtsuN.Athresholdselectionmethodfromgray2levelhisto2

grams[J].IEEETransactionsonSystems,ManandCyber2

(b)

netics,1979,9(1):62266.

[11]JainAK,VailayaA.Imageretrievalusingcolorandshape

[J].PatternRecognition,1996,29(8):123321244.[12]MahmoudiF,ShanbehzadehJ,etal.Imageretrievalbased

onshapesimilaritybyedgeorientationautocorrelogram[J].PatternRecognition,2003,36(8):172521736.[13]徐建华.图像处理与分析[M].北京:科学出版社,1992.[14]NalwaVS.Ondetectingedges[J].IEEETransonPattern

AnalysisandMachineIntelligence,1986,8(6):6992714.

图1 检索示例

4 结束语

形状是图像底层特征中最直观的特征,常常被用作图像检索的依据,但是从不同角度获取的目标形状可能会有很大差别,需要解决平移、尺度和旋转不变

本文来源:https://www.bwwdw.com/article/0xoj.html

Top