多规格描述至关主要,1.1 SIFT 算子的特点

 

Paper: Object Recognition from Scale-Invariant Features

虎扑上观望一个话题——
如今火热的 Deep Learning 会灭绝传统的 SIFT / SURF 特征提取方法呢?

 

Sorce: http://www.cs.ubc.ca/~lowe/papers/iccv99.pdf


Atitit 图像金字塔原理与几率 attilax的敞亮统计qb23

SIFT 即Scale Invariant Feature Transfrom, 尺度不变更换,由DavidLowe提议。是CV最闻名也最常用的特点。在图像目的识其他施用中,日常要求图像的特性有很好的roboust即不易于遭逢移动,旋转,尺度缩放,光照,仿射的大胆。SIFT算子具有规则,旋转不变性,并且有所部分光照,视角不变性。

出于事先商讨过SIFT和HOG那三种观念的特征提取方法,故本篇文章先对SIFT和HOG作一归咎,并比较二者优缺点。之后,将SIFT和HOG同神经网络特征提取做一相比较,浅谈对上述难点的观点。假如能写得快一些,再不难介绍其余二种传统的特征提取的不二法门——SURF、ORB、LBP、HAAR等等。

 

一、SIFT算子概述


1.1.
高斯金字塔  (  Gaussianpyramid): 拉普Ruskin字塔 (Laplacianpyramid):1

1.1 SIFT 算子的表征

目录

[1] SIFT(尺度不变特征变换)
[2] HOG(方向梯度直方图)
[3] SIFT和HOG的比较
[4] SIFT/HOG与神经网络特征提取的相比较
[5] 其余传统特征提取的点子(SURF、ORB、LBP、HAAR)


先对多少个概念和难点做一个诠释:

  • 图像为啥要灰度化?
  1. 辨认物体,最根本的因素是梯度(SIFT/HOG),梯度意味着边缘,这是最本色的一些,而计量梯度,自然就用到灰度图像了,可以把灰度了解为图像的强度。
  2. 颜色,易受光照影响,难以提供至关首要音讯,故将图像进行灰度化,同时也可以加快特征提取的速度。
  • 仿射不变性

平面上恣意两条线,经过仿射变换后,仍维持原来的情景(比如平行的线照旧平行,相交的线夹角不变等)

  • 什么样是局地特征?局地特征应该有所的表征?

有些特征从总体上说是图像或在视觉领域中部分分别其周围的地点;局地特征平日是描述一块区域,使其能有所高可区分度;局地特征的上下直接会决定着后边分类、识别是或不是会取得一个好的结果。

有些特征应该享有的特性:
可重复性、可区分性、准确性、有效性(特征的多寡、特征提取的频率)、鲁棒性(稳定性、不变性)。


1.2.
图像金字塔 高斯金字塔 采样金字塔1

  1. 区域性:对occlusion 和 clutter 有较好的鲁棒性

  2. 独特性:使用SIFT特征可以将单身的性状匹配到大方物体

  3. 多量性:即便是小物体可以生成很多SIFT特征

  4. 高效性:有很好的实时性

  5. 可伸张性:可以和其他差其他性状结合,增强鲁棒性

[1] SIFT(尺度不变特征变换)

1.1 SIFT特征提取的精神

在不一致的尺度空间上追寻关键点(特征点),并盘算出关键点的大势。SIFT所查找到的关键点是部分相当鼓起、不会因光照、仿射变换和噪声等元素而变化的点,如角点、边缘点、暗区的助益及亮区的暗点等。

1.2 SIFT特征提取的艺术

1. 创设DOG尺度空间:

依傍图像数据的多规格特征,大原则抓住概貌特征,小尺码重视细节特征。通过打造高斯金字塔(每一层用不一致的参数σ做高斯模糊(加权)),保险图像在其余条件都能有相应的特征点,即确保规格不变性

2. 关键点搜索和永恒:

确定是还是不是为关键点,须求将该点与同尺度空间差异σ值的图像中的相邻点相比,假使该点为max或min,则为一个特征点。找到所有特征点后,要刨除低比较度和不安宁的边缘效应的点,留下所有代表性的关键点(比如,正方形旋转后成为菱形,即使用边缘做识别,4条边就完全不平等,就会错误;即使用角点识别,则平安一些)。去除那个点的益处是增加匹配的抗噪能力和安乐。最终,对离散的点做曲线拟合,获得可相信的关键点的义务和原则音信。

3. 倾向赋值:

为了贯彻旋转不变性,需求按照检测到的关键点的局地图像结构为特征点赋值。具体做法是用梯度方向直方图。在统计直方图时,每个参加直方图的采样点都选拔圆形高斯函数进行加权处理,也就是展开高斯平滑。这至关重若是因为SIFT算法只考虑了原则和旋转不变形,没有设想仿射不变性。通过高斯平滑,可以使关键点附近的梯度幅值有较大权重,从而部分弥补没考虑仿射不变形发生的特征点不安定。注意,一个关键点可能具有多个第一方向,那有利夯实图像匹配的鲁棒性

4. 要害点描述子的转移:

关键点描述子不但包涵关键点,还包含关键点周围对其有进献的像素点。那样可使关键点有越来越多的不变特性,提升目的匹配成效。在描述子采样区域时,要求考虑旋转后开展双线性插值,幸免因旋转图像出现白点。同时,为了确保旋转不变性,要以特征点为中央,在紧邻领域内转悠θ角,然后总计采样区域的梯度直方图,形成n维SIFT特征矢量(如128-SIFT)。最后,为了剔除光照变化的震慑,要求对特色矢量进行归一化处理。

1.3 SIFT特征提取的助益

  1. SIFT特征是图像的片段特征,其对旋转、尺度缩放、亮度变化保持不变性,对意见变化、仿射变换、噪声也保险自然程度的安澜;
  2. 独特性(Distinctiveness)好,新闻量丰裕,适用于在海量特征数据库中开展高效、准确的合营;
  3. 大量性,固然少数的多少个物体也得以生出大批量的SIFT特征向量;
  4. 高速性,经优化的SIFT匹配算法甚至能够达成实时的渴求;
  5. 可扩大性,可以很有益于的与任何花样的特征向量举办联合;
  6. 急需较少的经验主义知识,易于开发。

1.4 SIFT特征提取的败笔

  1. 实时性不高,因为要不断地要开展下采样和插值等操作;
  2. 奇迹特征点较少(比如混淆图像);
  3. 对边缘光滑的对象不可以精确提取特征(比如边缘平滑的图像,检测出的特征点过少,对圆更是力不从心)。

1.5 SIFT特征提取可以化解的难点:

对象的自我状态、场景所处的条件和成像器材的成像特性等因素影响图像配准/目的识别跟踪的特性。而SIFT算法在大势所趋程度上可一蹴而就:

  1. 目标的团团转、缩放、平移(RST)
  2. 图像仿射/投影变换(视点viewpoint)
  3. 光照影响(illumination)
  4. 目的遮挡(occlusion)
  5. 生财现象(clutter)
  6. 噪声

1.3.
尺度空间的目标是『见森林又能见树木』,墨迹一点的分解就是,在低标准下得以看明白很多细节,在高规格下得以看出轮廓2

1.2 SIFT算子检测步骤

新近持续有人革新,其中最盛名的有 SURF(统计量小,运算速度快,提取的特征点大概与SIFT相同)和 CSIFT(彩色尺度特征不变更换,顾名思义,可以解决基于彩色图像的SIFT难点)。

1.4.
在一幅图像中,要想描述真实世界的布局与音讯,多规格描述至关首要。2

1.
尺度空间和高斯金字塔的创设:尺度空间的创设是为着模仿图像的多规格特征,就像是人眼对分裂远近的物体,有不相同的深浅。

[2] HOG(方向梯度直方图)

2.1 HOG特征提取的原形

经过测算和计算图像局地区域的梯度方向直方图来组成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在乘客检测中收获了石破惊天的打响。

2.2 HOG特征提取的法子

  1. 灰度化;
  2. 利用Gamma改良法对输入图像进行颜色空间的原则(归一化),目标是调剂图像的比较度,下降图像局地的影子和光照变化所造成的熏陶,同时可以压制噪音的搅和
  3. 算算图像每个像素的梯度(包括大小和样子),紧倘使为了抓获概况音信,同时进而弱化光照的纷扰
  4. 将图像划分成小cells(例如6*6像素/cell);
  5. 总结每个cell的梯度直方图(分歧梯度的个数),即可形成每个cell的descriptor;
  6. 将每多少个cell组成一个block(例如3*3个cell/block),一个block内具备cell的特点descriptor串联起来便获得该block的HOG特征descriptor。
  7. 将图像image内的具有block的HOG特征descriptor串联起来就能够取得该image(你要检测的靶子)的HOG特征descriptor了。那些就是最终的可供分类使用的特征向量了。

2.3 HOG特征提取特点

  1. 鉴于HOG是在图像的一部分方格单元上操作,所以它对图像几何的和光学的形变都能维持很好的不变性,那三种形变只会现出在更大的上空领域上。
  2. 在粗的空域抽样、精细的样子抽样以及较强的一对光学归一化等原则下,只要客人大体上可见保持挺立的姿势,可以容许行人有部分微小的肉身动作,那几个一线的动作可以被忽视而不影响检测效果。因而HOG特征是专门契合于做图像中的人体检测的。

1.5.
图像金字塔那种结构在图像处理中有普遍的用途。最有名的风味匹配算子SIFT就是透过结构图像金字塔来形成的。
3

2.
尺度空间的极值检测,确定关键点的任务:检索图像所有的空中,通过高斯微分函数的最大值或者最小值点来规定关键点的地方。

[3] SIFT和HOG的比较

共同点:都是基于图像中梯度方向直方图的特征提取方法

不同点:

SIFT
特征平常与运用SIFT检测器得到的兴趣点一起利用。那几个兴趣点与一个特定的势头和规则相关联。经常是在对一个图像中的方形区域通过相应的大势和条件变换后,再计算该区域的SIFT特征。

HOG特征的单元大小较小,故可以保存一定的上空分辨率,同时归一化操作使该特征对一部分相比度变化不敏感。

结缘SIFT和HOG方法,可以发现SIFT对于复杂环境下实体的特征提取具有突出的性状;而HOG对于刚性物体的特征提取具有杰出的特征。

1.6.
在目标检测领域,图像中的物体经常很可能是远近不同,大小不一的
3

3.
删减不好的关键点:边缘和第相比较度的区域都是倒霉的关键点,去除倒霉的描述子可以使得算法尤其efficient和roboust。
可以利用哈里斯 Corner Detector

小编曾做过一个本来现象分类的尝试,发现SIFT的准确率比HOG高,而只要检测像人那种刚性的object,HOG的显现要比SIFT好。

1.7.
图像金字塔最初用于机器视觉和图像压缩,4

4.
根据关键点领域内的梯度音讯确定关键点的主方向,后续的估量都是指向这么些主旋律进行的,确定关键点的趋势,使得key
points 具有 rotataion invariant特性。

[4] SIFT/HOG与神经互连网特征提取的相比

明显,随着深度学习的升高,通过神经网络提取特征获得了宽广的使用,那么,神经互联网提取的表征与价值观的SIFT/HOG等特征提取方法有哪些分裂呢?

4.1 神经互联网提取到的特点

大家知道,对于一副图像,像素级的性状没有其它价值,而一旦特征是一个有所结构性(或者说有含义)的时候,比如摩托车是或不是具有车把手,是不是享有车轮,就很简单把摩托车和非摩托车区分,学习算法才能发挥作用。

最初,五个数学家布鲁诺 Olshausen和 DavidField通过试验商量了这么些题材,发现一个长短不一图像往往由一些着力社团重组。比如下图:一个图可透过用64种正交的edges(可以知晓成正交的主题构造)来线性表示。比如样例的x可以用1-64个edges中的多少个按照0.8,0.3,0.5的权重调和而成。而别的基本edges没有进献,均为0

图片 1

切实实验能够参照小说:
Deep
Learning(深度学习)关于特征

小块的图纸可以由基本edge构成,更结构化,更复杂的,就需求更高层次的性状表示,高层表达由低层表达的组合而成。如图所示:

图片 2

那就是神经互联网每层提取到的性状。由于是通过神经互联网自动学习到了,因此也是无监控的特征学习进度(Unsupervised
Feature Learning) 。直观上说,就是找到make
sense的小patch再将其展开combine,就赢得了上一层的feature,递归地向上learning
feature。在差别object上做training是,所得的edge basis
是越发相似的,但object parts和models 就会completely different了。

4.2 传统特征提取方法与神经互连网特征提取的可比

观点1:传统特征提取方法的钻研进度和笔触是充裕有效的,因为那几个艺术具有较强的可解释性,它们对规划机器学习方式解决此类题材提供启发和类比。有一对人觉着(也有一些人不予)现有的卷积神经互连网与那么些特征提取方法有必然类似性,因为各样滤波权重实际是一个线性的识别方式,与那么些特征提取进程的境界与梯度检测类似。同时,池化(Pooling)的功力是统筹一个区域的音讯,那与这个特征提取后开展的性状结合(如直方图等)类似。通过实验发现卷积互连网早先几层实际上确实是在做边缘和梯度检测。但是事实上卷积网络发明的时候,还尚未这一个特征提取方法。

观点2:
深度学习的数额要求量大对于视觉来说是个伪命题。许多切磋成果已经表明深度学习操练取得的模子具有很强的迁徙能力,由此在大数额集上练习达成的模子若是拿过来在小数码集上用就能够,不要求完全重复陶冶。这种办法在小数码集上的结果往往也比传统艺术好。

观点3:要么需求重新陶冶的,只好说大数目集磨炼好的模子提供了一个相比好的参数初阶化。而且卷积前几层提取特征仅仅是对分类难题是对的,可是对于一些dense
prediction照旧不等同,毕竟提取特征不必然有用,依然task dependent。

观点4:纵深学习是一种自学习的风味表明方法,比SIFT/HOG那几个依靠先验知识设计的feature的表明效果高。早在13年我们都发现神经网络的结尾一层的local特征和SIFT性质几乎,不过表明能力强太多。SIFT能做的作业CNN都能做,表明效果也强,这深度学习取代SIFT是一定的事务(或者说已经发出的事务)。深度神经互联网识别率的增加不要求树立在急需多量陶冶样本的基本功上,拿pre-train好的模型直接用就足以了。在一些平素不陶冶样本的利用(图像分割(image
stithing)/ 立体匹配(stereo mathing))
,可以把卷积层的activation提取出来做stitching的local
feature(感觉是一个能够追究的矛头)。以后还有SIFT/SURF那种稳定特征提取算法的生存空间吗?除非是嵌入式那种总括资源格外受限的情状,可是现在大家都在试着implement
CNN FPGA甚至ASIC了。

观点5:二〇一六年ECCV上开设的一个local
feature的工作会,发现在主题匹配难题上,CNN并不曾什么样突破性的展开。在Oxford大学的VGG组提供的Hpatch数据集上,发现rootsiftpca效果最好,如图:

图片 3

那就是说提议多个难题:(1)现在流行的特点学习方法siamese或triplet等协会是还是不是缺失了何等?
(2)纵然CNN可以挖掘patch里面包涵的音讯并确立对于复杂几何和光照变化的不变性,然而那种学习到的不变性是还是不是过于信赖于数据而不可能有效泛化到实在匹配场景中所碰着的形象之间的复杂性变化吧?


 

  1. 生成SIFT描述子:前面的的尺度空间的关键点方向使得keypoints 具有 scale
    and rotation invariant接下去就足以一向生成SIFT算子了。

[5] 其余传统特征提取的法门(SURF、ORB、LBP、HAAR)

SURF、ORB、LBP可以参见小说:
图像特点检测描述(一):SIFT、SURF、ORB、HOG、LBP特征的法则概述及OpenCV代码完毕

5.1 SURF

前边提到SITF的毛病是如若不依赖硬件加快或特其他图像处理器很难达到完结,所以人们就要想艺术对SITF算子进行校订,SURF算子便是对SIFT的创新,然而立异之后在算法的运行时刻上或者尚未质的迅猛。前面要介绍的ORB特征描述算子在运转时刻上才是一种质的全速。

SURF首要是把SIFT中的某些运算作了简化。SURF把SIFT中的高斯二阶微分的沙盘进行了简化,使得卷积平滑操作仅须要转换成加减运算,那样使得SURF算法的鲁棒性好且时间复杂度低。SURF最毕生成的特征点的特征向量维度为64维。

5.2 ORB

ORB特征描述算法的运作时刻远优于SIFT与SURF,可用于实时性特征检测。ORB特征基于FAST角点的特征点检测与叙述技术,具有规则与旋转不变性,同时对噪声及透视仿射也装有不变性,突出的习性使得用ORB在进展特征描述时的采纳场景非凡宽广。

ORB特征检测紧要分为以下多个步骤:

①方向FAST特征点检测:
FAST角点检测是一种基于机器学习的迅猛角点特征检测算法,具有可行性的FAST特征点检测是对兴趣点所在圆周上的16个像素点举办判定,若判断后的当下基本像素点为暗或亮,将候定其是或不是为角点。FAST角点检测统计的时光复杂度小,检测效果非凡。FAST角点检测为加速算法完结,平日先对回周上的点集举行排序,排序使得其计算进度大大得到了优化。FAST对多规格特性的叙说是要么经过创制图像金字塔落成的,而对于旋转不变性即方向的特色则引入灰度质心法用于描述特征点的势头。

②BRIEF特征描述:
BRIEF描述子重如若经过任意挑选兴趣点周围区域的若干点来组成小兴趣区域,将那个小兴趣区域的灰度二值化并分析成二进制码串,将串特征作为该特征点的描述子,BRIEF描述子拔取关键点附近的区域并对每一位比较其强度大小,然后依据图像块中三个二进制点来判定当前重点点编码是0仍旧1.因为BRIEF描述子的享有编码都是二进制数的,那样就省去了微机存储空间。

5.3 LBP

LBP(Local Binary
Pattern),局地二值方式是一种描述图像局地纹理的风味算子,具有旋转不变性与灰度不变性等明确优点。LBP特征描述的是一种灰度范围内的图像处理操作技能,针对的是输入源为8位或16位的灰度图像。LBP特征是很快的图像特征分析方法,经过修正与发展已经采纳于八个世界里面,越发是人脸识别、表情识别、行人检测领域已经获取了中标。LBP特征将窗口大旨点与邻域点的涉及举行比较,重新编码形成新特点以解除对外围场景对图像的熏陶,由此一定程度上缓解了复杂场景下(光照变换)特征描述难题。

LBP算法按照窗口领域的差异分为经曲LBP和圆形LBP二种。上边分别介绍:

①经典LBP:
经典LBP算子窗口为3×3的正方形窗口,以窗口焦点像素为阈值,将其相邻8领域像素灰度与基本像素值比较,若要旨像素值小于周围像素值,则该中央像素位置被标记为1,否则为0(显著那种规则下,对于基本点领先或等于那三种状态,算法不可以区分,后续经过立异引入LBP+与LBP-因子用来不一样那二种处境)。图像经过那种遍历操作后,图像就被二值化了,每一个窗口焦点的8邻域点都得以由8位二进制数来代表,即可暴发256种LBP码,那几个LBP码值可以用来反映窗口的区域纹理信息。LBP具体在转移的进度中,先将图像划分为多少个子区域,子区域窗口可按照原图像的尺寸举办调整,而不自然非得为3×3的正方形窗口。一般对于512×640的图像,子区域窗口区域选用大小为16×16。

②圆形LBP:
经典LBP用正方形来叙述图像的纹理特征,其症结是为难知足不一样尺寸和频率的必要。Ojala等人对经典LBP进行了创新,提议了将3×3的正方形窗口领域伸张到任意圆形领域。由于圆形LBP采样点在圆形边界上,那么必然会促成有的总结出来的采样点坐标不是整数,因而那里就要求对取得的坐标像素点值进行处理,常用的处理办法是近些年邻插值或双线性插值。

放一张SIFT/HOG/LBP优缺点、适用范围比较图:

图片 4

5.4 HAAR

人脸检测最为经典的算法Haar-like特征+Adaboost。那是然而常用的实体检测的主意(最初用于人脸检测),也是用的最多的法门。

教练进度:
输入图像->图像预处理->提取特征->磨练分类器(二分拣)->得到陶冶好的模型;

测试进程:输入图像->图像预处理->提取特征->导入模型->二分类(是或不是所要检测的实体)。

Haar-like特征是很简短的,无非就是那么三种,如两矩形特征、三矩形特征、对角特征。后来,还加入了边缘特征、线特征、大旨环绕特征等。使用积分图可以加快总结特征。最后,使用集成的章程Adaboost实行练习。


本篇小说到此停止,有什么样错误欢迎指正!


补充:
1、SIFT / HOG 不同点:
SIFT提取的关键点是角点,HOG提取的是边缘特征。
2、传统特征提取 /
CNN特征提取分裂点:
传统特征提取方法的检测算子一般是人造设计好的,是通过多量的先验知识计算取得的;CNN特征提取相当于在教练一个个filter(过滤器、卷积核),那一个filter约等于传统特征提取方法中的检测算子。由此,CNN特征提取是应用神经互连网的自主学习取得的。

 

二、 算法原理

1.1. 高斯金字塔  (  Gaussianpyramid): 拉普拉斯金字塔 (Laplacianpyramid):

诚如情形下有三种档次的图像金字塔平常现身在文献和以及实际运用中。他们各自是:

 

高斯金字塔  (  Gaussianpyramid): 用来向下采样,主要的图像金字塔

 

拉普Ruskin字塔 (Laplacianpyramid): 用来从金字塔低层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像举办最大程度的复原,合营高斯金字塔一起行使

 

  1. 尺度空间和空间金字塔的打造

1.2. 图像金字塔 高斯金字塔 采样金字塔

图像金字塔是透过将本来图像经过平滑、下采样所生成一多级具有不相同分辨率的图像的集结。金字塔结构(Pyramid)适于多分辨率处理的一种图像存储数据结构

最常用的转移图像金字塔的法子是利用高斯函数平滑图像,每便将分辨率下跌为本来的一半,因此得到一个图像体系{ML,ML-1,……,M0},图像金字塔的存储量为N^2*(1+1/4+1/16+…)=(4*N^2)/3。

对此实际情状而言,物体都是以自然条件突显的,而图像汇总物体大小是原则性的。尺度空间的创设就是为着在数字图像中表现现实世界人对图像的多规格感知——距离和模糊程度。那样可以压实算法对实体的识别准确度。为了贯彻那五个目的SIFT算法使用多个步骤:1)降采样营造高斯金字塔
2)

1.3. 尺度空间的目的是『见森林又能见树木』,墨迹一点的演讲就是,在低标准下能够看掌握很多细节,在高规格下得以看看概略

动用高斯核打造多尺度空间。Lindeberg表明了高斯及其微分核是尺度空间分析中唯一线性的平滑核。我们先使用高斯函数:$G(x)

\frac{1}{\sqrt{2\pi}\sigma}e^{-x^2/2\sigma^2}$来打造尺度空间。对于二维图像其对应二维高斯核函数可以定义为$G(x,y,\sigma)
 =  \frac{1}{\sqrt{2\pi}\sigma}e^{-(x^2+y^2)/2\sigma^2}$.

一幅图像$I(x,y)$和高斯核函数卷积可以取得:

$$L(x,y,\sigma) =  G(x,y,\sigma)*I(x,y) $$

参数$\sigma$决定图像的分辨率,$\sigma$越大图像越模糊。那便是原图像的尺度空间表示。

这一步仅仅是落到实处了差别图像的歪曲程度模拟,大家还要求完成对分歧尺寸图像的象征。这一个可以一向通过对图像进行降采样得到。那样对于原图像大家接纳高斯函数卷积达到差距模糊程度(不一样$\sigma$)关键点,那对应的是一个octave。然后大家对原图像降采样(比如将图像成为原来大小的一半)然后对新得到图像再度利用高斯函数卷积得到下一个octave,那样直白重复大家就足以获得多少个octave,每个octave中有几个不等口径模糊图像,所有的octave构成高斯金字塔。上面是其示意图:

图片 5

 

  1. 尺度空间极值检测

成立好高斯金字塔之后我们开首检测兴趣点(interest
points),大家得以选用LOG(Laplacian of
Gaussian)来检测图像中大家须求的兴趣点(边缘,角点)。但是LOG
很不难遭逢噪声的干扰,那也是大家事先对图像做Blur模糊的原因之一。LOG计算公式如下:

$$\Delta^2 =
\frac{\partial^2}{\Delta_x^2}+\frac{\partial^2}{\Delta_y^2}$$

但是二阶尾数计量起来太困难,于是大家拔取了一个代表方案来就像是LOG:使用DOG(Difference
of Gaussian)计算公式如下:

$$D(x,y,\sigma) = \left(G(x,y,k\sigma)-G(x,y,\sigma)
\right)*I(x,y)$$

使用DOG
大家总结获得平静的keypoints。我们得以应用后面够贱的高斯金字塔,相邻高斯金字塔相减得到DOG空间。

图片 6

 

  1. 去除糟糕的关键点

  2. 给关键点赋方向

  3. 生成SIFT features

1.4. 在一幅图像中,要想描述真实世界的构造与音讯,多规格描述至关首要

值得注意的是,事物在实际世界中是客观存在的,但经过图像,在不一样口径下感知到的音讯是例外的。

 

2

 

高斯图像金字塔

    此处以SIFT算法中的高斯图像金字塔(Gaussian
Pyramid)
为例,解释图像金字塔的结合。尺度可变的高斯函数如下:

 

 

1.5. 图像金字塔那种结构在图像处理中有周边的用处。最知名的特点匹配算子SIFT就是因此社团图像金字塔来形成的。

有关图像金字塔在SIFT特征提取算法中的应用可参见雷切尔Zhang的博文“SIFT特征提取分析”

 

1.6. 在目的检测领域,图像中的物体经常很可能是远近分裂,大小不一的

,可以采纳金字塔来检测分裂尺度下的物体。但同时你也可以应用不一致大小的sliding
window在原图上做检测。

例如前边说的对象检测,有些情状下目标的变型尺度范围实际上是老大有限的,此时应该适量的设定条件的数额,来压缩不必要的总计量。比如你可以只降采样四遍,你也足以降采样八次,去最上边的三个规格。后者的益处是……快

 

譬如OpenCV里SIFT的达成默许是上采样一回,降采样至不可能再压缩停止。很多时候你实在不须求这么精细的特征点或这么high
level的特征点,也许有些改一下参数就能够优化一些速度回来。那里也亟需提一下SURF的反向模拟尺度空间的笔触,跟上面提到的高维LBP的思路如出一辙。

在点特征里面,有时候你愿意您的点在全路尺度空间里都是很强的,不是那种在最起首仍然一个相比较强的特征点,尺度高了后来那个特征点就没有了。你指望您只处理那个从始至终都比较独立的特征点,那你就足以在金字塔的顶层提取特征点,然后只是在上面的层开展局地搜索验证……那样你可以单方面提取着老大鲁棒的descriptor,一边还快如雷暴……

视觉里面很多类似直观且简单的事物往往有见怪不怪用法,除了那金字塔,还有诸如直方图,比如二值化,比如卷积,比如积分图,比如距离变换……等等等等。就算都不是怎么高档的东西,一但用到巧处,也引人深思啊。

 

 

1.7. 图像金字塔初期用于机器视觉和图像压缩,

一幅图像的金字塔是一名目繁多以金字塔形状排列的分辨率逐步下降的图像集合。金字塔的底层是待处理图像的高分辨率表示,而顶部是低分辨率的好像。当向金字塔的上层移动时,尺寸和分辨率就下跌。
答辩上讲,最好是2^n * 2 ^n
尺寸的图形,但实则大家经过补0扩充、近似、内插等措施,可以拍卖其他尺寸的图纸。

在部分边缘检测算法里面,为了忽略比较弱的边,也会选拔尺度空间来开展降采样(对,高斯滤波一大半时候被清楚成某种去噪/平滑操作,其实也是尺度空间思想)。

在有些基于特征的归类和辨认难点之中,也有尺度空间的黑影。比如按照高维LBP的人脸识别,其中LBP直方图的领取方式就包涵有尺度空间的牵记。

尺度空间的想法其实格外直观(当然注明它干吗那么协会可能会比较辛劳),不过因为尺度空间的协会和操作往往也是算法里面相比较费力的地点,所以针对的优化也应有说一下。

 

 

OpenCV图像处理篇之采样金字塔

  • xiahouzuoxin – 博客频道 – CSDN.NET.html

图像处理之高斯金字塔 – 流浪的鱼 –
博客频道 – CSDN.NET.html

(3
条新闻) 图像金字塔除了sift算法之外还有啥样应用? – 和讯.html

Python图像处理(16):图像金字塔.html

12图像金字塔.htm

 

小编:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 

汉字名:艾提拉(艾龙),   EMAIL:1466519819@qq.com

转发请评释来源: http://www.cnblogs.com/attilax/

Atiend

 

 

相关文章