基于卷积神经网络的正则化方法

更新时间:2023-06-11 08:10:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

计算机研究与发展DOI:10.7544/issnl000

JournalofComputerResearchandDevelopment

1239.2014.20140266

1900,2014

51(9):1891

基于卷积神经网络的正则化方法

吕国豪

罗四维

黄雅平蒋欣兰

北京

100044)

(北京交通大学交通数据分析与挖掘北京市重点实验室(1vguohao@bjtu.edu.cn)

ANovelRegularization

Method

Based

on

ConvolutionNeuralNetwork

LnGuohao,LuoSiwei。HuangY耐

X.¨dam

诧g

(BeijingKey

Laboratory

ofTraffic

D以

嗜m,以≯|Ⅲn㈨盯d曙M

is

●Be

∞_宝

University,Beijing100044)

inverse

Abstract

Regularization

method

widely

usedin

solving

the

problem.An

accurate

regularizationmodel

playsthemost

importantpartinsolvingtheinverse

problem.Theenergy

constraintsshouldbedifferentforthedifferenttypesofimagesanddifferentpartsofthesameimage,

butthetraditionalL1andL2modelsusedinthefieldofimagerestoration

priorassumption.Inthispaper,accordingtothedefectsofthesingle

are

bothbased

on

sin91e

prioriassumptionintraditional

regularizationmodel,anovelregularizationmethodbasedandapplied

to

on

convolutionneuralnetworkisproposed

can

imagerestoration,therefore,theimagerestorationberegarded

asa

classification

issue.Inthismethod,theimageispartitionedintoseveralblocks,andtheconvolutionneuralnetworkisusedto

extract

andclassifythefeaturesofsubblockimages;thenthedifferentformsofthepriori

are

regularizationconstraints

adoptedconsideringthedifferentfeaturesof

no

thesubblockimages,

thereforetheregularizationmethodisshowthattheimagerestorationnetwork

are

longerlimited

toa

singleprioriassumption.Experiments

on

resultsbytheregularizationmethodbased

convolutionneural

superiorto

thosebythetraditionalregularizationmodelwith

on

singleprioriassumption.

can

ThereforetheregularizationmethodbasedmaintaintheedgeKeywords

L1

texture

convolutionneuralnetworkbetter

restore

cost.

image,

characteristicoftheimagenicely,andhaslowercomputational

normconstraint;regularization

normconstraint;L2

method:convolutionneural

network;imagerestoration

摘要正则化方法是逆问题求解中经常使用的方法.准确的正则化模型在逆问题求解中具有重要作用.对于不同类型的图像和图像的不同区域,正则化方法的能量约束形式应当不同,但传统的L、,L,正则化方法均基于单一先验假设,对所有图像使用同一能量约束形式.针对传统正则化模型q-单一先验假设的缺陷,提出了基于卷积神经网络的正则化方法,并将其应用于图像复原问题.该方法的创新之处在于将图像复原看作一个分类问题,利用卷积神经网络对图像子块的特征进行提取和分类,然后针对不同特征区域采用不同的先验形式进行正则化约束,使正则化方法不再局限于单一的先验假设.实验表明基于卷积神经网络的正则化方法的图像复原结果优于传统的单一先验假设模型.关键词L-范数约束;L。范数约束;正则化方法;卷积神经网络;图像复原

中图法分类号TPl8

收稿日期基金项目

201403

26;修回日期:2014

06

04

国家自然科学基金项目(61273364,61272354,61105119,61300176);北京市自然科学基金项目(4142043);中央高校基本科研业务费专项资金项目(2011JBM027,2012JBM027,2013JBM019,2014JBM037);教育部科技发展中心网络时代科技论文快速共享专项研究资助课题项目(2013113)

通信作者

黄雅平(yphuang@bjtu.edu.cn)

计算机研究与发展2014,51(9)

由于逆问题的病态特性,对逆问题的直接求解一般被认为是不适定的,正则化方法是处理逆问题中经常使用的一种方法.在图像复原中,由于图像在成像、传输等过程中都存在着退化(模糊、噪声等),因此,如何从接收到的退化图像中尽可能恢复出原始的清晰图像具有重要的实用价值和研究意义.

对于图像复原,即使是最简单的图像退化模型,其复原过程仍然是一个病态问题.一种解决办法是通过对解空问加以约束,寻求满足一定先验条件的适定解,这一过程称为正则化方法.通过加入约束条件以实现稳定求解的方法最早是由Ivanov_10在1962年提出的,其基本思想是约束复原图像的能量.同年Phillips。20提出了类似的方法以及最平滑解的模型.1963年,Tikhonov_。o提出了求解病态问题的理论并应用于图像复原,即正则化方法,其基本思想是将对复原图像的能量进行约束改为对复原图像中高频成分的能量进行约束,例如,可以选用最简单

的一阶高通滤波器——梯度算子(Tikhonov方法),

也可使用多阶高通滤波器的滤波结果的组合(Phillips方法)[2].此后,人们不断对正则化方法进行改进,以提高复原图像的质量,例如,自适应正则化方法。4。5J、使用L。范数约束的方法TV(totalvariation)模型。6J、TV模型的改进算法。7J、进一步的超稀疏约束(采用0.5~o.8范数)。8J、统计特性的约束凹。1“、L。范数和L。范数的组合口21等等.此外,一些用于图像复原的滤波器,例如,Wiener滤波器[1…、Tikhonov滤波器[。1等,可以看作是不同正则化方法所对应的能量泛函优化问题的解析解.

上述正则化方法对整幅图像往往采用同一种能量泛函形式.在图1中,图1(a)采用L。范数得到较好的复原效果(即图1(d)优于图1(c)),而图1(e)采用L。范数得到结果却较差(即图1(g)优于图1(h)),这说明能量泛函的合理形式因图像类型的不同而不同.进一步考虑,对于一个复杂图像中的不同部分也需要使用不同的能量泛函形式,以取得理想的结果.

基于这种想法,本文希望通过对图像内部不同子块的特征进行提取,进而利用提取的特征判断图像子块为纹理区域或平坦区域.针对不同特征区域采用不同的先验形式进行正则化约束,正则化方法不再局限于单一的先验假设.然而,目前广泛使用的特征提取算法(例如Harris角点检测E14]、SIFT特征[1印)很难完成上述工作,这是因为:

阿罔—◆

II

LI

T‘mcm'ⅢITlllm:

IhI

r目cmcDfH橱】ntZ

Fig.1

Resultsoftwotypeofimagesusingdifferent

horn]constraints.

图12类图像使用不同能量泛函形式的复原结果

1)上述特征提取方法所指定的特征点是人为按照一定的规则指定的,所以在图像子块中是否存在满足要求的特征点具有不确定性;

2)即便在图像子块内存在满足要求的特征点,但这些特征点是否能够准确地反映出图像纹理区域和平坦区域的区别还存在不确定性,即根据人为指定的规则提取的特征点是否具有区分图像纹理区域和平坦区域的能力还需要进一步研究.

近年来卷积神经网络(conv01utional

neural

net—

work,CNN)在计算机视觉、图像处理领域得到了广泛的应用.卷积神经网络模型是一种多层神经网络,它起源于共享权值网络(sharing

network)El

sl

weightsneural

r],该模型由于最初主要应用在语音识

delayneural

别中,因此也称时延神经网络(time

吕国豪等:基于卷积神经网络的正则化方法

networks,TDNNs)。1….在图像分析方面,由于时序关系不明显,因此称共享权值网络更为确切.卷积神经网络由两种类型层次组成:卷积层和子采样层,主要特点是位于同一层的所有单元共享相同的权值,检测的特征也相同.这样,这些检测到的特征送人高层时就能够实现平移不变性的特征检测,同时,通过子采样策略保证对畸变不敏感.

卷积神经网络已经成功地应用在人脸检测口”2…、手写体识别‘”1、语音检测‘2“、文本分析‘2…、视频分析‘2。I、车牌识别‘241等领域.另外,Lecun等人‘251加入稀疏编码约束改进模型,在多个视觉任务中取得了很好的结果.

基于上述讨论,本文提出了基于卷积神经网络的正则化方法,其基本思想是更改传统正则化方法中对于图像中各个部分服从统一分布的简单假设,寻找出依据图像局部先验的更精确的描述方法.

Jr

arg

Jr—arg

』t0

min{¨_』g

k*Jr

0。2,

(3)

其中,砂表示某一函数空问,即人们根据先验知识对求解结果进行约束,从而使得复原图像Jr具有某些特殊的性质,例如Jr中不可以含有剧烈的大幅度的震荡等.

式(3)是一个有约束(Jr∈砂)的优化问题,在求解过程中,通过Lagrange乘子法,将其转化为一个无约束的优化问题,即

rain{{;||g

【_

k*Jr

0。2+告{Jr∈妒)},(4)

_

其中,A称为正则化参数,其作用是在解的先验约束和解经过退化后与模糊图像的相似程度之问寻求一种平衡.对于式(4)这样的无约束的优化问题,一般采用Lz范数约束和L。范数约束两种方法,也就是本文所称的传统正则化方法.

1.1

L:范数约束

Lz范数约束下的正则化方法是基于核空问的

图像模糊与复原

图像退化的因素有很多,最简单的退化模型(即

元素(尼是低通滤波器)以高频分量的假设,将对复原图像的能量进行约束改为对复原图像中高频成分的能量进行约束,即

Jr—arg

线性移不变模型)可以描述为一个卷积过程,即

g(z,y)一(尼*Jr)(z,y)+8(z,y),

(1)

rain{会09

【_

k*Jr牦+÷ll町….(5)

_

其中,Jr表示原始的清晰图像;g表示退化后的图像;卷积核尼也称为点扩散函数,描述图像的模糊过程;8(z,y)表示噪声.

对于式(1)描述的最简单的退化模型(假设8(z,y)一8为独立同分布的高斯加性噪声),图像复原(即由g求得Jr或Jr的近似解Jr)的基本思想是寻找一个复原图像Jr,使得Jr经过退化后最接近Jr,即

式(5)可以转化为求解极小化能量泛函的变分问题,进一步利用变分法求解,得到相应的Eular—Larange方程为

F(W)+A(g尼*Jr)一0,

(6)

其中,F( )一导+芸表示散度算子.L。范数约束模。上U)

型是一种各向同性的扩散模型,且其扩散系数均为1.这种扩散模型没有反映出沿边缘方向和梯度方向

Jr—arg

min{}09

_

k*Jr

0i.

(2)

扩散的差别,因此在图像复原的同时也使得图像的边缘发生了模糊,但也正是由于L。范数约束的扩散系数相同,对于图像内部的平坦区域往往能取得较好的复原效果.

1.2

在式(2)中采用了L。范数的平方(即常用的能量定义方式)来度量Jr经过退化后与Jr的接近程度.

但是,如果存在函数L经过卷积核尼作用后变为0(即(尼*L)(z,y)一o),那么Jr与Jr+c L经过退化后与Jr的接近程度相同,即式(2)无法对Jr与卜卜c L进行区分,即解的不唯一,从而难以得到理想的图像复原结果.为了解决解不唯一的问题,需要对解Jr加以(先验的)约束,从而对Jr与Jr+c L进行区分,即正则化方法.例如,从式(2)的解空问中除去L所在空间,然后进行求解,即

L,范数约束

采用L。范数约束的形式对图像进行复原即

TV模型[…:

Jr—arg

rain{会0gk*Jr牦+÷0订忆}.(7)

【_

_

L。范数约束对复原图像中高频成分能量的约束采用L。范数的形式.式(7)也可以转化为求解极小化能量泛函的变分问题,进一步利用变分法求解,得到相应的EularLarange方程为

计算机研究与发展2014,51(9)

F (T;三■vI)q-A(g/\lFI

k*Jr)一0.~

f8)~。

积神经网络正则化方法通过对不同区域图像块特征的分类,将图像中彼此相邻部分之问的位置关系打破,利用图像块内部的特征进行分类和重组.卷积神经网络正则化方法实质上是对于一副图像中的图像子块寻找有效的特征并对其进行分类,进而根据图像块的有效特征采用不同的正则化约束方式.图2描述了传统正则化方法和卷积神经网络正则化方法的区别:

L-范数约束仅沿图像梯度FJr的正交方向扩散,而朝梯度方向无扩散.对于图像中的每一个像素点L。范数约束始终存在一个边缘方向和一个梯度方向,这在图像的纹理、边缘区域可以取得很好的复原结果,但在图像的平坦区域得到的边缘方向并不真实存在,此时仍沿边缘方向扩散会导致在平坦区域的噪声抑制不充分,甚至出现虚假边缘,产生阶梯

效应.

2D

2卷积神经网络正则化方法

(a)Traditionalregularizedview

011

images

图像复原正则化的本质是人们对于图像性质的一种先验认识.各种不同正则化方法的提出可以看作人们不断地修改或提高先验认识,从而使得其更加逼近图像真实特性的过程.为了寻求对图像先验的更好描述,提高图像复原结果,对于传统的正则化方法,可以从以下2个方面进一步分析和思考:

1)优化传统正则化方法中高通滤波器,更好地区分复原图像中的纹理区域和平坦区域;

2)改进对传统正则化方法中能量泛函形式,使得由该能量泛函形式约束形成的子空问和复原图像所在的子空问尽可能匹配.

已有许多文献对于滤波器的设计进行了研究,提出了多种基于统计或学习的改进滤波器口。1….本文主要针对2)进行研究,将传统的图像复原问题转化为一个分类问题,利用卷积神经网络对图像的不同子块的特征进行提取和分类,进而针对不同特征区域采用不同的先验形式进行正则化约束.本文采用梯度算子作为滤波器进行分析和实验,理论和实验结果可以方便地推广到其他高阶或复杂的滤波器.

2.1

L-盼

h●-’一

(b)ConvolutionneuralneBvorkregularized

vlev,on

Images

Fig.2

Differentviews

on

images.

图2不同正则化方法对图像空间的看法

在图2中,传统的正则化方法对图像中的任何图像子块并不加以区分,因此对整张图像使用同一个先验假设,即某一种能量泛函定义方式.而基于卷积神经网络正则化方法认为图像中不同的区域具有不同的特征,同一张图像中相邻的部分可能在卷积神经网络正则化方法上属于不同的范数优化集合,而图像中相距较远的部分也可能在卷积神经网络正则化方法上属于相同的范数优化集合.因此基于卷积神经网络正则化方法根据图像中不同部分的不同特征采用不同的正则约束方法.2.2基于卷积神经网络的正则化模型

基于卷积神经网络正则化的基本思想是将一幅图像视为由若干子块组成,根据子块的局部特征对其采用不同的先验约束形式进行正则化.因此,该方法需要解决2个问题:

1)寻找一种度量方式对图像中不同部分的特征进行度量,进而准确反映图像的纹理和平坦区域

的区别;

卷积神经网络正则化方法的基本思想

传统的正则化方法基于图像各部分服从同一分

布的简单假设,利用式f5)、式(8)将图像各部分不加区别地加以处理限制了图像复原效果.本文提出的基于卷积神经网络正则化方法就是尝试着突破这一假设.卷积神经网络正则化方法不再拘泥于单一的范数约束形式,而是寻求如何更加准确地描述图像中不同区域的特征,并对其采用不同的范数约束形式.在将一幅图像划分成若干子块之后,传统的正则化方法所处理的图像块可以看作被嵌入到根据真实物体的形态结构、位置关系决定的二维平面中,而卷

2)寻找与图像块特征相对应的正则化约束方式进行约束求解,得到复原图像.

吕国豪等:基于卷积神经网络的正则化方法

对于问题1),本文采用卷积神经网络作为特征提取方法,通过使用样本图像对卷积神经网络进行训练,寻找合适的滤波器组合对图像中的不同子块图像特征进行提取并分类.对于问题2),本文采用L1范数、L。范数及其线性组合作为正则化约束的泛函定义形式,则卷积神经网络正则化模型可以表示为

本文将卷积神经网络分为特征提取与表达以及特征分类两部分.特征提取与表达部分用来提取适合的特征以助于图像块的分类;特征分类部分对特征提取与表达部分给出的特征进行准确分类.两者相互配合完成对图像内部不同子块的特征分类,指导正则化方法选取适合的先验假设约束形式,具体

介绍如下:

I—arg,m、in{告∑lIg。豇*I。ll。2+

、J『

i)特征的提取与表达

我们将卷积神经网络中输入层,c1,s2,c3,s4,

(9)

、。

∑d。可10vI。ll。2+f1

d:)0

vI。…},

c5层合称为图像子块的特征提取部分,共有5层结构(不包含输入层).

对于特征提取阶段的卷积神经网络可以看作是由卷积层和子采样层2种结构交替组成的.

卷积和子采样过程如图4所示,包括用一个可训练的滤波器厂。(权值系数叫。的组合)去卷积一个输入的图像(第1阶段为输入的图像,其他阶段为特征图),然后加一个偏置b。,得到卷积层C。.子采样过程包括将邻域4个像素通过权值系数叫。+-求加权和变为1个像素,再加上偏置6。+-,然后通过一个sigmoid激活函数,产生特征图s。的1/4大小的特征图S。+。.C层可看作是模糊滤波器,用于提取特征,s层的空间分辨率逐层递减,而每层所含的平面数递增,用于压缩数据并产生更多的信息.

厂。

其中,I。,g。分别表示图像I,g的子块,参数d。由图像块g:确定,即d。一瞰(受)(在本文中,d:根据图像块g:的特征(纹理或平坦区域)选取0或i).2.2.i卷积神经网络

本文采用卷积神经网络对图像复原进行约束,即对于图像中的纹理区域和平坦区域进行分类.图3给出具体的例子:

Fig.3

Di{{erent{eatureso{di{{erentimageblocks.

图3同一图像中不同区域的图像特征

在图3中,Surf.工对应的图像块包含大量平坦区域,利用L。范数作为先验约束有助于消除图像的模糊和噪声;而Surf.Ⅱ对应的图像块振荡特性明显,使用L1范数作为先验约束较为合适.因此如何准确地对图像内部不同子块的特征进行分类成为必须解决的问题.

Cl:8×28×28FeatureMaps

S2:8×14x14FeatureMaps

InputImageFig.4

№赫

卜》文自分,

Convolutionandsubsamplingprocessing

图4卷积和子采样过程

对于一幅图像中的每一个子块图像(32×32像素),其处理方式如图5所示:

C3:29×lO×10FeatureMaps

S4:29x5×5

矗螭≯难

Fig.5

Featureextraction

ofconvolutionneuralnetworkregularization.

图5卷积神经网络正则化的特征提取

计算机研究与发展2014,51(9)

我们将子块图像中的每一个像素看作神经元,C1层是一个卷积层,由8个特征图构成,每个特征图是通过一种卷积滤波器提取输入图像的一种特征(8个特征图分别对应8个卷积滤波器).特征图中每个神经元与输入图像的5×5的区域相连,如图5的C1部分.这8个5×5的卷积滤波器的权值由训练样本训练得到,且对于一个特征图权值共享.由于不考虑子图的边缘点的滤波结果,特征图的大小为

28X28.

上一个可训练偏置参数,最后通过sigmoid函数计算得到,如图5的s2部分.每个神经元的2×2区域互不重叠,因此,S2中每个特征图为C1中特征图大小的1/4.

C3层也是卷积层,它同样通过5×5的卷积核卷积s2层,只是在这里为了简化实验我们使用了一

种5x5的卷积核,得到的特征图只有10×10个神经

元,共计由30个10x10大小的特征图构成.值得注意的是,C3层中的每个特征图连接S2层中的所有8个或者部分特征图组合,即表示本层的特征图是由上一层提取到的特征图的不同组合通过卷积得到,其组合原则如图6所示.采用组合的原因是为了模拟人眼视觉中底层结构构成的上层更抽象的结构.…一~…‘~……~‘…一‘r~

l7

2IH

X^置X

置^

^_

I一’’

S2层是子采样层,有8个14x14的特征图.特征图中的每个神经元与C1中相对应特征图的2x

区域相连.S2层每个神经元的结果由C1层相邻的4个神经元相加后乘以一个可训练权值参数,再加

u…r,一

』一1.H1}l‘!。3。

~’‘JY●

_

Ju4●

土1

lI'一1

~‘nj●一

11

l王

-』l

l,

土2I冀

—冀

ZS

I-

f一

2■

xt

Lru‘L,。’_

童■

i,

XI

4x重

,X

IX

XI

●量DH

Ol】丑

●,

xt

置X置

_H冀

葺一

舅★t

置xtX

■lX置一

tX譬X

X置x

t_H

舅^

IX

II

,【

II

XI

譬X

-X

XIX

X*

6,

曩HH

_x虬

——

1——-——

一■I

皇I

—H爿HHH

Fig.6

Featurecombinationorder

OFt

layerC3

图6C3层特征组合方式

S4层是一个子采样层,与S2层类似由30个

5x

5大小的特征图构成.特征图中的每个单元与

C3层中相应特征图的2x2区域相连接.

C5层是一个卷积层,有200个特征图.在这里我们使用了全连接,每个单元与s4层的全部30个单元的5x5区域相连.C5层特征图的大小为1×1.

至此原始的32×32的图像子块转变为200维的特征向量,即32x32的图像子块用一个200维的特征向量表示.这样我们就完成了图像的特征提取阶段,应当指出的是特征提取阶段所需的卷积矩阵权值、偏置值均通过训练得到,其依据的算法为扩展的反向传导算法口…,保证了特征提取的客观性.

2)特征的分类

我们将卷积神经网络中隐含层和输出层合称为图像子块的特征分类部分,共有两层结构,如图7所示.

卷积神经网路的特征分类部分使用了成熟的3层结构神经网络模型(这部分很容易用其他分类算法替换).输出层设计为一个神经元,以完成对L:范数约束和L。范数约束的选取.对于这部分权值的学习算法直接利用了经典的BP学习算法口….

2.2.2变分梯度流模型

根据卷积神经网络确定图像块g。对应的参数d。后,即可对卷积神经网络正则化模型f如式f9)所示)进行求解,利用变分法可以得到卷积神经网络正则化模型对应的变分梯度下降流:

…‘。i+掣一芸{冬∑II(g。觅*Jr。)IIu…

af

a疗【2

吕国豪等:基于卷积神经网络的正则化方法

∑卜圳W。㈣(1~)II%II-])一

军杀{钏(g。尼乩)㈣

『d。引守L牦+(卜d。)IIW。II。¨

(10)

可得到相应的数值算法,从而通过迭代对卷积神经网络正则化模型进行近似求解.

3实验及结果分析

在本文的实验中,我们在常用的测试图像(Boat,Lena等)和实验室手工拍摄的自然图像中选取400张基本图像,将图像按32×32大小分块,构成7万张原始的清晰图像库;使用上述400张清晰图像加入模糊核为5×5的高斯模糊和标准差为0.05的高

(11)

由于一幅图像被划分为相互独立的图像子块,因此式(10)可以转化为在彼此孤立的图像块上的扩散过程,即

瓦3L一杀{鲁ll(g。尼*Jr。)雌+

『%钏F圳+(卜d。)II对。II。¨

由变分法可得到式(11)对应的偏微分方程形式:

斯白噪声构成模糊加噪图像,利用上述分块方法,获得模糊加噪图像库.采用峰值信噪比(PSNR)作为评价标准,对模糊加噪图像库中的每一个图像块分别使用L。范数约束和L。范数约束进行图像复原,进而与原始标准图像库中的图像块进行比较,计算其PSNR值,选择使得复原图像结果PSNR值较大的复原方法,作为分类的结果.实验样本库由模糊加噪图像库和对应的L。,L。范数分类结果两部分组成.使用L。范数约束的样本和L。范数约束的样本比例约为1:1.

在样本库中选择高斯模糊作为模糊形式的主要原因是高斯模糊是一类常见的图像模糊,常用于描

筹一[”州汁c,劫F (羔)]+旭,

(12)

其中,A一尼++g。尼+*尼*Jr。表示扩散讨程中扩散

源的分布,函数尼+(z,y)一尼(z,y)称为扩散核尼(z,y)的对偶;尼(z,y)表示函数尼(z,y)的共轭,如果函数尼(z,y)为实函数,那么尼(z,y)一尼(z,y),在本文中,d。根据图像块g。的特征(纹理或平坦区域)选取1或0.采用有限差分法求解偏微分方程(12),

II●:啊卫IIlIII用丑■

5I№而l疆_叩

ClI

t叫『In

Lnn‘TT口Inl

Ce》Cumbin衄DrLI置Ll

Fig.8

If

I‘."r4N证譬由哪l啪

Boat

Comparisonofexperimentalresults

Oil

andLena.

图8测试图像Boat和Lena上的实验结果比较

计算机研究与发展2014,51(9)

述光学成像仪器设备所产生的模糊,也是视觉成像中金字塔模型的基础.高斯模糊具有指数阶频率衰减速度,相比其他模糊类型,例如运动模糊、聚焦不准等,高斯模糊更难进行复原.

选取PSNR的原因是PsNR计算简便,且可根据需要变更为信噪比(SNR)、均方根误差(MSE)或其组合形式.

从样本库中抽取6万张图像作为训练样本库,1万张图像作为测试样本库.为了简化泛函形式以便于计算,d。只取0或1,即在不同的图像子块中只选择L1范数和L。范数约束之一.

3.1

对训练样本的拟合程度为97.64%.我们在常用的测试图像上进行实验,并同Lz范数约束。。o、L-范数约束。6。和L-范数和Lz范数的组合。12。进行了对比,结果如图8所示.

对测试图像库中的常用图像进行数值比较,采用MSE,SNR,PSNR评价图像复原的结果,如表1所示.

对于MSE值越小表示复原图像和原始清晰图像差别越小;SNR,PSNR刚好相反,即值越大越好.从图8和表1可以看出,卷积神经网络正则化方法取得了理想的复原结果.可见,相对于滤波器的优化,能量泛函形式的优化更为重要.

针对实验室采集的自然图像,卷积神经网络正则化和L-范数约束以及L。范数约束方法进行对比实验的实验结果如图9所示.

实验结果比较与分析

本文选取高斯模糊进行实验,即点扩散函数选

5,卷积神经网络步

为高斯函数,卷积核大小为5

长为1,重复迭代100次,经过训练后卷积神经网络

Table1

ComparisonofDifferentRestorationResults

表1不同复原方法的复原结果数值比较

【—Jj盛宣d

_,I'j_In一哪掣

BI州nIInr--_

l銮蚕

jI衄二j■

ComparisonofCNNregularizationandtraditionalsinglefunctionalconstraint

Fig.9

图9卷积神经网络正则化方法和传统单一泛函约束方法的比较

吕国豪等:基于卷积神经网络的正则化方法

1899

从图9可以明显看出卷积神经网络正则化方法的优势,图中不同特征的图像块都得到了有效的复原,使得复原图像更加自然,从而克服了传统正则化方法“顾此失彼”的缺陷.3.2计算代价分析

使用L1约束或L。约束进行图像复原时时间复

杂度为O(n3),其中咒表示图像子块像素数大小.本

[5]

Liu

Peng,Zhang

images

Yan,Mao

Zhigang.by

Arestoration

algorithmforJournalof

contaminated

impulse

noise口].

ComputerResearchandDevelopment,2006,43

(11):19391946(inChinese)

(刘鹏,张岩,毛志刚.一种脉冲噪声图像复原算法[J].计算机研究与发展,2006,43(11):1939

F6]

1946)

RudinL,OsherS,FatemiE.Nonlineartotalvariationbasednoise

removal

algorithms[J].Physica

D:

Nonlinear

Phenomena,1992,60(1):25

268

文提出的方法可以对独立的图像块分别进行操作,且图像子块像素数远小于一幅图像的像素数,为此,其计算复杂度和迭代稳定性均远优于不分块图像的时问复杂度.另外,考虑到在图像分块后,图像子块的复原可以并行处理,其计算代价可进一步降低.不足之处主要表现在卷积神经网络需要预先学习,学习是需要消耗时问的,但是这些学习过程可以离线训练,对于真正在线的复原过程没有影响.

[7]

MarquinaA,OsherS.Explicitalgorithmsfor

dependentmodelbaseddeblurringandnoise

on

newtimenonlinear

level

set

motionfor

removal口].SIAMJournalofScientific

405

Computing,2000,2(22):387

Is]

LevinA,FergusR,DurandF,eta1.hnageanddepthfromconventionalcamerawith

on

coded

aperture[J].ACMTrans

Graphics,2007,26(3):701

709

usingimagestatistics

on

[9]LevinA.BlindmotiondeblurringLCJ

//Proc

ofthe20thAnnualConf

Neural

Information

Processing

Systems.Cambridge,CM:MIT,2006:841848

结论

[10]ShanQ,]iaJ,AgarwalaA.Highqualitymotiondeblurringfrom

single83

image口].ACMTtans

on

Graphics,2008,27

(3):73

本文通过应用卷积神经网络对自然图像中不同区域(一般为图像子块)特征进行有效标识,并建立该特征与(合理的)能量泛函形式之问的一种对应关系,以构建一种以图像局部特征为基础的正则化方法.

寻找能合理标识图像块特征的方法是卷积神经网络正则化方法取得好的复原效果的关键.除了使用卷积神经网络方法之外,我们将尝试一些以图像分割为特征的指标,例如分形维数等.如何寻找更加有效的特征,标识不同图像区域的类型,建立特征与能量泛函形式之问的合理关系,从而改进和提高已有方法,这些是我们继续研究的目标.

[11]

ZhuS

C,Mumford

D.Prior

on

learning

andgibbsreaction

and

diffusion[J].1EEETransPatternAnalysisMachine

Intelligence,1997,19(11):12361250

[12]LuChengwu,HuangHua.TV+TV2regularizationwith

nonconvex

sparseness

inducingpenaltyforimagerestoration

口].MathematicalProblemsinEngineering,2014,3(11):

』』0

[13]Honig

L,

Goldstein

S.

on

Adaptive

reducedrank

interferencesuppressionbased

themuhistage

Wienerfilter

_J].1EEETrans

994

on

Communications,2002,50(6):986

[14]

MikolajczykK,SchmidC.Scale&affineinvariantinterest

point

detectors口].International

Journal

of

Computer

Vision,2004,60(1):6386

[15]LoweDG.Distinctiveimagefeatures

fromscaleinvariant

Vision,

参考文献

[16]

keypoints[J].InternationalJournalof

2004,60(2):91110LeCun

Y,Bottou

to

Computer

L,Bengiodocument

Y,et

a1.Gradientbased

[1]

lvanovVK.Onlinear

illposed

problems[J].Dokl

272the

nmnerical

Akad

learningapplied

recognition口].Proceedingsof

2324S,

et

NaukSSSR,1962,14(145):270

the1EEE,1998,86(11):2278

solution

of

[2]

Phillips

DL.A

technique

for

[17]

LeCunY,applied

to

Boser

B,DenkerJ

zip

a1.

Backpropagation

certainintegralequationsofthefirstkind[J].Journalofthe

handwritten

code

551

recognition[J].Neural

ACM,1962,9(1):8497

[3]

TikhonovAN.OntheSolutionof111posedProblemsandthe

Computation,1989,1(4):541

[18]

SejnowskiT,RosenbergCR.Parallelnetworksthatlearn

pronounce

to

Methodof

Regularization[M].Providence:American

English

text[J].ComplexSystems,1987,1(1):

MathematicalSocietyPress,1963:10351038

[4]

Pace

D,AylwardS,Niethammer

on

145

adaptive

i68

M.A

locally[19]

TiviveFHC,BouzerdoumA.Anewclassofconv01utionalneuralnetworks(SICoNNets)andtheirapplicationof

face

regularizationbasedimageregistration

of

anisotropic

diffusionfordeformable

Trans

on

slidingorgans[J].1EEEdetection[c]//Proc

oftheInt

Joint

Conf

on

Neural

MedicalImaging,2013,32(11):21142126

Networks.Piscataway,NJ:1EEE,2003:2157

2162

1900

E20]ChenYingning,HanChinchuan,WangChengtzu,eta1.The

applicationofa

convolutionneural

networkon

faceand

licenseplate

detection[c]//Procof

the18th

IntConf

on

PatternRecognition.Piscataway,NJ:IEEE,2006:552

555

E21]

SukittanonS,SurendranAC,PlattJC,eta1.Conv01utionalnetworksforspeech

detection[c]//Procofthe8thIntConf

on

SpokenLanguage.Piscataway,NJ:IEEE,2004:1077

1080

[22]

Simard

P,SteinkrausD,PlattJ

C.Best

practices

for

convolutionalneural

networks

applied

to

visualdocument

analysis[c]//Procofthe7thIntConfon

DocumentAnalysis

andRecognition.Piscataway,NJ:1EEE,2003:958

962

[23]

MobahiHH,CollobertR,WestonJ.Deeplearningfrom

temporalcoherencein

video[c]//Procofthe26thAnnual

IntConfon

MachineLearning.New"York:ACM,2009:

737744

[24]ZhaoZhihong,YangShaopu,MaZengqiang.Licenseplate

characterrecognitionbasedon

convolutionalneuralnetwork

LeNet5口].JournalofSystemSimulation,2010,22(3):

638

641(inChinese)

(赵志宏,杨绍普,马增强.基于卷积神经网络LeNet_5的车牌字符识别研究[J].系统仿真学报,2010,22(3):638

641)

[25]

RanzatoY

M,BoureauL,LeCunY.Sparsefeaturelearning

fordeepbelief

networks[J].AdvancesinNeuralInformation

ProcessingSystems,2007,20:1185

1192

[26]jiShuiwang,XuWei,YangMing,eta1.3Dconvolutional

neuralnetworks

for

human

actionrecognition

LJJ.IEEE

Trans

on

PatternAnalysisand

MachineIntelligence,2013,

35(1):221

231

[27]SadeghiBHM.ABPneuralnetworkpredictormodelfor

plastic

injectionmoldingprocess[J].Journal

of

Materials

ProcessingTechnology,2000,103(3):411416

计算机研究与发展2014,51(9)

基于卷积神经网络的正则化方法

作者:作者单位:刊名:英文刊名:年,卷(期):

吕国豪, 罗四维, 黄雅平, 蒋欣兰, Lü Guohao, Luo Siwei, Huang Yaping, Jiang Xinlan北京交通大学交通数据分析与挖掘北京市重点实验室 北京 100044计算机研究与发展

Journal of Computer Research and Development2014,51(9)

引用本文格式:吕国豪.罗四维.黄雅平.蒋欣兰.Lü Guohao.Luo Siwei.Huang Yaping.Jiang Xinlan 基于卷积神经网络的正则化方法[期刊论文]-计算机研究与发展 2014(9)

本文来源:https://www.bwwdw.com/article/11o1.html

Top