数字图像处理-图像分割

数字图像处理-图像分割

ID:37152780

大小:14.56 MB

页数:138页

时间:2019-05-11

上传者:U-145848
数字图像处理-图像分割_第1页
数字图像处理-图像分割_第2页
数字图像处理-图像分割_第3页
数字图像处理-图像分割_第4页
数字图像处理-图像分割_第5页
资源描述:

《数字图像处理-图像分割》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

视觉信息处理图像分割 前言图像分割是由图像处理到图像分析的关键步骤,也是一种基本的计算机视觉技术。图像分割将图像上的目标区域和所需要的特征提取出来,为更高层次的图像分析打下基础。正因为其“承上启下”的重要位置,对于图像分割的准确度和精确度要求非常高。 实例原始彩色图像分割图像(一种颜色对应一个区域) 内容框架图像分割的定义边缘提取Hough变换阈值法分割K-means聚类彩色图像分割彩色纹理图像分割实例简单程序实现(matlab)兴趣阅读 图像分割的定义根据图像的某些特征(或特征集)的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列“有意义”的区域,使其后的图像分析、识别、理解等高级处理阶段所要处理的数据量大大减少(这些“有意义”的区域可以用抽象的概念和特征来描述),同时又保留有关图像结构特征的信息。 BoundariesofObjectsMarkedbymanyusershttp://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/segbench/bench/html/images.html BoundariesofObjectsfromEdgesBrightnessGradient(Edgedetection)Missingedgecontinuity,manyspuriousedges BoundariesofObjectsfromEdgesMulti-scaleBrightnessGradientBut,lowstrengthedgesmaybeveryimportant BoundariesofObjectsfromEdgesImageMachineEdgeDetectionHumanBoundaryMarking BoundariesinMedicalImagingDetectionofcancerousregions.[Foran,Comaniciu,Meer,Goodell,00] BoundariesinUltrasoundImagesHardtodetectinthepresenceoflargeamountofspecklenoise BoundariesofObjectsSometimeshardevenforhumans! 边界提取边缘的定义一阶微分算子二阶微分算子Canny算子 边缘提取的定义划分不同区域的分界线;边缘由连续的边缘点组成;边缘点:在局部范围内的灰度(彩色RGB值等)产生突变的像素点。 示例原始图像边界图像 微分算子边缘点即图像局部灰度突变处梯度的变化在该点上存在局部最大,所以常用梯度算子(一阶微分算子)来估计图像灰度变化的方向,即边缘的方向。用阈值运算把边缘点与非边缘点区分开阈值的选择在丢失边缘点与噪声引起的虚假边缘点之间进行折衷。 一阶微分算子微分数学定义:一个连续函数,在像素位置处的微分算子是:梯度的幅度为:以上定义的梯度算子需要对图像上的每一个像素点进行计算。由于数字图像是离散的,所以用差分代替微分:在实际中常用小区域模板卷积运算进行来近似计算。对Gx,Gy各用一个模板,所以需要2个模板组合起来以构成一个梯度算子。 常用微分算子一阶RobertsSobelPrewitt二阶LaplacianMarrCanny Roberts算子罗伯特交叉算子(Robertscross)最简单的梯度算子模板: Roberts算子(续)梯度幅值g(x,y)(欧式距离)用方向差分的均方值来近似计算,适当取门限(阈值)TH,作如下判断:g(x,y)>TH,(x,y)为阶跃状边缘点。F(x,y)={(x,y)|g(x,y)>TH}为边缘图像。缺点:对噪声敏感 Sobel算子最常用的梯度算子3×3邻域模板如下:Gx(左),Gy(右) Sobel算子(续)梯度幅值为:适当取门限TH(阈值),作如下判断:g(x,y)>TH,点(x,y)为阶跃状边缘F(x,y)={(x,y)|g(x,y)>TH}为边缘图。 Prewitt算子与Sobel算子类似3×3邻域模板定义如下:Gx(左),Gy(右) Prewitt算子(续)梯度幅值为:适当取门限TH,作如下判断:g(x,y)>TH,(x,y)为阶跃状边缘点.F(x,y)={(x,y)|g(x,y)>TH}为边缘图像。 SobelPrewittRoberts比较原始图像SobelPrewittGauss-LaplacianMatlab函数:fspecial,imfilter Sobel与Prewitt的比较相似处:2个3×3模板在空间域中的实现比较容易不同处:模板的加权值不同结果:Sobel算子效果比较好,可以产生较好的边缘检测效果,且噪声影响也比较小。当使用较大的邻域时,抗噪声的特性会更好,得出的边缘相对较粗。 拉普拉斯算子(Laplacian)拉普拉斯(Laplacian)算子是一种二阶导数算子,对一个连续函数f(x,y),它在位置(x,y)的拉普拉斯值定义如下:3×3邻域模板定义如下:左图(卷积核),右图(卷积加平滑) Laplacian算子(续)梯度幅值为:拉普拉斯算子对噪声比较敏感,所以要配合图像平滑来进行边缘提取,图像平滑通常采用高斯平滑的方法。 一阶微分与二阶微分一阶微分(梯度)是矢量,包括了强度与方向两部分,所以需要两个模板且存储量较大。二阶微分算子是一个标量,可以进行x,y两个方向上的微分运算,所以一个模板就够了。但计算出来的梯度只有幅度信息而没有方向信息。二阶微分的结果有正有负,一般取正或绝对值。二阶微分算子对噪声相当敏感,产生双象素宽的边缘,不能提供边缘方向信息。思考题:为什么任何一个模板系数之和为零? M_H算法与LOG滤波器Marr-Hildren,LaplacianofGaussian在经典的边缘检测算法中,通常采用求图像灰度的一阶、二阶导数的方法来确定边缘点。这类算法对噪声十分敏感,往往会出现“假边缘”的情况,影响最后的结果。人类视觉的空域特性与时域特性都极为平滑,对于微小的曲面变化和色彩变化,即使没有经过特殊训练的人也能识别出来。希望在边缘检测之前先滤除噪声。选择高斯函数作平滑滤波器高斯函数的空域特性与时域特性都很平滑,与图像数据卷积后引入新变化的可能性也最小。 M_H算法与LOG滤波器(续)无论一阶偏导还是二阶偏导都具有方向性,为了避免因方向性而增加计算量,选取一个与方向无关的算子,最低阶各向同性的微分算子是拉普拉斯算子。M_H算法的主要思想:先对图像用二维高斯函数进行平滑;再用二阶微分算子(拉普拉斯算子)进行边缘检测。 M_H算法构造高斯模板(如下)对图像进行平滑处理构造拉普拉斯算子模板(如下)对平滑后的图像进行边缘检测 高斯(Gauss)函数二维高斯函数定义如下:高斯函数是一个二维可分解的圆对称函数。一个二维运算可以分解为两个一维运算,从而以减少计算强度 LOG滤波器根据M_H算法的思想,有:结合高斯函数的定义,有下式成立:就称为LOG滤波器,又叫做Marr-Hildretch算子,简称M_H算子。 LOG滤波器(续)有无限长拖尾,一般取一个N×N的窗口,在窗口内进行卷积。为避免过多地截去拖尾,N较大,通常取效果较好。为了减小卷积的计算量,通常用两个不同带宽的高斯曲面之差来近似式中正项代表激励功能,负项代表抑制功能。从工程观点来看,时,DOG最逼近原值。DOG滤波器则是它在工程上的一种近似实现。 实例原始图像边缘图像 Canny算子Canny算子是一种边缘检测算子,由于其对图像的边缘检测有非常好的效果,因此在图像处理算法中具有很重要的地位,通过Canny算子检测出来的边缘结果可以直接用在图像的区域分割方面。 Canny算子给出检测性能优劣的三个指标好的信噪比,即将非边缘点判为边缘点的概率要低,将边缘点判为非边缘点的概率也要低;好的定位性能,即检测出的边缘点要尽可能在实际边缘的中心;对单一边缘仅有唯一响应,即单个边缘产生多个响应的概率低,并且虚假边缘响应得到最大抑制。 Canny算子(续)给定边缘类型的最佳边缘检测模板一维理想阶跃边缘,Canny推导出的最优边缘检测器的形状与高斯函数的一阶导数类似。可用高斯函数的一阶导数作阶跃边缘的次最优检测算子。对于二维图像,可用高斯函数的二阶导数作为次最优算子。根据二维高斯函数的圆对称性与可分解性,容易计算高斯函数在任一方向的方向导数与图象的卷积。对于二维图像,需要使用若干方向的模板分别对图像进行卷积处理,再取最可能的边缘方向。 Canny结果原始图像canny边缘图像 代码实现在matlab的command对话框里输入helpedge在接下来的对话框里会看到edge函数的用法,其中包括sobel,Prewitt,Roberts,Gauss_Laplacian,Canny等算子的用法。BW=EDGE(I,‘method’,THRESH),‘method’是指所用的算子类型,THRESH指阈值大小,BW是输出的边界图像。 代码实现例如:im=imread('camera_8.bmp');im_edge=edge(im,'sobel');imshow(im_edge);imwrite(uint8(im_edge),'sobel.bmp');‘’camera_8.bmp’是存放在本地电脑上matlabwork文件夹下的图像名称,如果没有放在该目录下,那么需要在图像前加上目录索引,例如:‘Dimagecamera_8.bmp’.‘sobel’可以替换成其他的算子,比较不同方法的好坏。最后将im_edge边界图像存储到camera_8的相同目录下。详细的介绍请参考helpedge 代码结果originsobelPrewittRobertsLogCanny TopicsPreprocessingEdgeImagesEdgeTrackingMethodsFittingLinesandCurvestoEdgesTheHoughTransform PreprocessingEdgeImagesImageEdgedetectionandThresholdingNoisyedgeimageIncompleteboundariesShrinkandExpandThinning EdgeTrackingMethodsAdjustingaprioriBoundaries:Given:ApproximateLocationofBoundaryTask:FindAccurateLocationofBoundarySearchforSTRONGEDGESalongnormalstoapproximateboundary.Fitcurve(eg.,polynomials)tostrongedges. EdgeTrackingMethodsDivideandConquer:Given:BoundaryliesbetweenpointsAandBTask:FindBoundaryConnectAandBwithLineFindstrongestedgealonglinebisectorUseedgepointasbreakpointRepeat FittingLinestoEdges(LeastSquares)Given:ManypairsFind:ParametersMinimize:Averagesquaredistance:Using:Note: ProblemwithParameterizationLinethatminimizesE!!Solution:Useadifferentparameterization(sameastheoneweusedincomputingMinimumMomentofInertia)Note:ErrorEmustbeformulatedcarefully! Linefittingcanbemax.likelihood-butchoiceofmodelisimportant CurveFittingFindPolynomial:thatbestfitsthegivenpointsMinimize:Using:Note:isLINEARintheparameters(a,b,c,d) LineGroupingProblemSlidecredit:DavidJacobs Thisisdifficultbecauseof:Extraneousdata:clutterormultiplemodelsWedonotknowwhatispartofthemodel?Canwepulloutmodelswithafewpartsfrommuchlargeramountsofbackgroundclutter?Missingdata:onlysomepartsofmodelarepresentNoiseCost:Itisnotfeasibletocheckallcombinationsoffeaturesbyfittingamodeltoeachpossiblesubset HoughTransformElegantmethodfordirectobjectrecognitionEdgesneednotbeconnectedCompleteobjectneednotbevisibleKeyIdea:EdgesVOTEforthepossiblemodel ImageandParameterSpacesEquationofLine:Find:Considerpoint:ImageSpaceParameterSpaceParameterspacealsocalledHoughSpace LineDetectionbyHoughTransformParameterSpace1111112111111Algorithm:QuantizeParameterSpaceCreateAccumulatorArraySetForeachimageedgeincrement:Ifliesontheline:Findlocalmaximain BetterParameterizationNOTE:LargeAccumulatorMorememoryandcomputationsImprovement:Lineequation:HereGivenpointsfind(FiniteAccumulatorArraySize)ImageSpaceHoughSpace?HoughSpaceSinusoid ImagespaceVotesHorizontalaxisisθ,verticalisrho. Imagespacevotes MechanicsoftheHoughtransformDifficultieshowbigshouldthecellsbe?(toobig,andwemergequitedifferentlines;toosmall,andnoisecauseslinestobemissed)Howmanylines?CountthepeaksintheHougharrayTreatadjacentpeaksasasinglepeakWhichpointsbelongtoeachline?SearchforpointsclosetothelineSolveagainforlineanditerate Fewervoteslandinasinglebinwhennoiseincreases. Addingmoreclutterincreasesnumberofbinswithfalsepeaks. RealWorldExampleOriginalEdgeDetectionFoundLinesParameterSpace FindingCirclesbyHoughTransformEquationofCircle:Ifradiusisknown:AccumulatorArray(2DHoughSpace) FindingCirclesbyHoughTransformEquationofCircle:Ifradiusisnotknown:3DHoughSpace!UseAccumulatorarrayWhatisthesurfaceinthehoughspace? UsingGradientInformationGradientinformationcansavelotofcomputation:EdgeLocationEdgeDirectionNeedtoincrementonlyonepointinAccumulator!!Assumeradiusisknown: RealWorldCircleExamplesCrosshairindicatesresultsofHoughtransform,boundingboxfoundviamotiondifferencing. FindingCoinsOriginalEdges(notenoise) FindingCoins(Continued)PennyQuarters FindingCoins(Continued)Coinfindingsampleimagesfrom:VivekKwatraNotethatbecausethequartersandpennyaredifferentsizes,adifferentHoughtransform(withseparateaccumulators)wasusedforeachcirclesize. GeneralizedHoughTransformModelShapeNOTdescribedbyequation GeneralizedHoughTransformModelShapeNOTdescribedbyequation GeneralizedHoughTransformFindObjectCentergivenedgesCreateAccumulatorArrayInitialize:ForeachedgepointForeachentryintable,compute:IncrementAccumulator:FindLocalMaximain HoughTransform:CommentsWorksonDisconnectedEdgesRelativelyinsensitivetoocclusionEffectiveforsimpleshapes(lines,circles,etc)Trade-offbetweenworkinImageSpaceandParameterSpaceHandlinginaccurateedgelocations:IncrementPatchinAccumulatorratherthanasinglepoint Hough变换霍夫变换是图像处理中一种经典的处理(变换)方法,目的是从图像中识别特定的几何形状,如边界,外形或外轮廓线等能够用参数方程表达的曲线。它的基本思想是:空间曲线与参数的点-线对偶性(duality):由某一组参数A描述的曲线在图像空间中对应了n个像素,但所有这n个像素在参数空间中只对应了一个点(这个点由A确定)。反之,参数空间中的任意一点对应着图像空间中的一组同类曲线。 图像空间与参数空间图像空间参数空间 图像空间与参数空间(续)对图像进行某种形式的变换,使得经过变换后原图上特定形状的曲线上的点,能够集中到变换空间(参数空间)的某些相对集中的位置上形成峰。这样,把对原图中特定形状曲线的检测问题(确定曲线的参数),转化为在变换空间中寻找峰值的问题(确定峰值点的位置)。优点:抗干扰能力强。因为它是基于统计的方法,所以如果待检测曲线上有小的扰动,断裂,甚至是虚线,都能很好地检测出来。利用的是图象的全局特性。定位比较精确:可以到亚像素级精度。霍夫变换的应用很广,也有很多改进算法。最基本的霍夫变换是从二值图中检测直线和圆等。Hough变换还可以推广到更多参数的曲线检测中,甚至可以用来检测任意形状的曲线。这种被推广了的Hough变换称为广义Hough变换。 检测直线直角坐标系XOY中,直线y=mx+b可以用极坐标表示为:r=xcos+ysin。因此可以用一个二维向量(r,)(与直线y=mx+b垂直)来表示这条直线:r表示向量的长度,表示向量与轴X的夹角。直线在直角坐标和极坐标之间的关系 在由参数r和定义的二维参数空间里,XOY平面上的任意一条直线都可以映射为该空间中的一个点(该点的位置由r和确定)。反过来,考察XOY平面上的一个点(x,y),过该点可以作任意多条直线,每一条直线都对应了参数空间(r,)上的一个点,而且这些点都满足方程r=xcos+ysin。由于过点(x,y)可以有无数条直线,因此可以任意选取(由于cos函数和sin函数的周期性,一般只在(0,360)的范围内考虑,所以r与的关系是一条正弦线。也就是说XOY平面上的一个点(x,y),它在参数空间里是一条正弦线。 假设有一条XOY平面内的直线L:y=mx+b,相应的参数为(r0,0)。对于直线L上的任意一点,它在参数空间中都对应了一条正弦线,因此L对应了参数空间中的很多条正弦线。但是这些正弦线必定有一个公共的交点:(r0,0),因为只要一个点落在L上面,它的坐标就一定满足方程r0=xcos0+ysin0。在参数空间内找到(r0,0),就相当于在XOY平面内找到了直线L:y=mx+b。 步骤建立XOY坐标系对参数空间进行量化(根据图像大小和精度要求确定量化精度)将参数空间分成很多小格,每个小格都有一个计数器。依次扫描图像(一般是二值图像)中各像素,对每个目标点,根据其XOY坐标(x,y)代入的量化值,求出对应的r(从理论上讲,反过来先量化r,再根据r计算也是可以的)。并对r取整,使之落入相应的小格内,并使该小格内的计数器加1。然后对每个小格内的累加器数值进行检验,有大的计数器数值的小格对对直角平面中的一条直线,该小格的索引值(r,)就是该直线的拟合参数。计数器数值不够大的小格舍弃不用。 检测圆对于XOY平面内的圆,它的参数方程可以表示为:利用Hough变换检测圆与检测直线类似,只不过参数有a,b,r三个((a,b)为圆心,r为半径),因此相应的参数空间也增加到三维。与检测直线相比,计算量将显著增大。而且平面空间上的一点经变换后对应于参数空间上的一个曲面(而非曲线)。而平面空间上同一圆上的点,经变换后的曲面簇会交于同一点。这一点对应参数空间的坐标就是要求的参数。 Hough变换——注意确定参数空间的量化精度(不同的参数可以有不同的量化精度),确定计算量的大小和参数空间的大小。仔细选择计数器的大小(整型还是长整型)以防累加(对像素点的累加)时溢出。仔细选择阈值,原因类似于基于灰度图像直方图的阈值分割。结果图的重现:对于每一个峰值参数组,根据参数方程,计算其相应的X-Y坐标并在结果图像(初始化为全背景)中标为前景(有时要作适当的补偿:对因分割或成像等原因造成的目标点的丢失进行补充)。 Hough变换——问题由于图像本身在采样时离散化的原因,真实世界中同一条直线上的点在成像后(变为像素)并不是严格地在同一条直线上,即直线上的点的坐标并不严格的遵从同一个变换方程,因此,图像中的一条直线会被映射到参数空间中多个不同的但又十分接近的参数对(小格子)。这样,根据这些参数对恢复出来的图像就会有多条彼此十分靠近的直线。这种现象有时会非常显著。由于对参数空间进行了量化,因此会产生误差,即检测到的直线和原图像中的直线不是严格一致的,因此要进行精度控制。丢失一些重要信息(如直线的长度,圆弧的方向等)需重新计算或确定。速度慢。占内存大。在提高计算速度时,准确度降低。 直方图阈值分割直方图分割前提条件:直方图上每个单峰对应图像上一个单独的区域。直方图分割的目标:取合适的阈值分割出一个个单峰,阈值基本选在直方图连续曲线的波谷位置。直方图 单阈值分割顾名思义,用一个阈值分割一副图像。 多阈值分割多阈值分割是指用多个阈值分割一副图像,每个阈值对应直方图上的极小值点。多阈值分割的关键是寻找到直方图各个“有效”的极小值点。“有效”是指由于数据是离散的,那么直方图会出现很多毛刺,毛刺带来很多没用的极小值点,影响出现过分割现象。高斯平滑滤除毛刺,保留真实的极小值点。 高斯平滑直方图的横坐标是灰度值,可以看做是数组的index;纵坐标是该灰度值像素点的个数,可以看做是数组的元素;直方图平滑变成了一维数组的平滑;选择一维的高斯模板长度可以是3、5、7等奇数长度。利用高斯函数计算系数:i是相邻像素点距离当前像素点的距离,例如选择模板长度为3,那么i=-1,0,1。 高斯平滑原始直方图高斯平滑直方图 多阈值分割示例原始图像分割图像 关于聚类什么是聚类?聚类是一系列具有相似特征的物体的集合,与其它聚类中的物体具有明显的不相似性。聚类的目标找出混合样本集中内在的组群关系常用的聚类算法ExclusiveClustering(K-means)OverlappingClustering(FuzzyC-means)HierarchicalClustering(Hierarchicalclustering)ProbabilisticClustering(MixtureofGaussians) K-means算法简介是一种非监督的学习算法,用于将给定的样本集划分为指定数目的聚类(假定为k类)。K=4 K均值算法主要思想为每个聚类确定一个初始的聚类中心,这样k个聚类存在k个聚类中心将样本集中的每一个样本按照最小距离原则分配到k个聚类中的某一个使用每个聚类中所有样本的均值作为新的聚类中心如果聚类中心有变化则重复2、3步直到聚类中心不再变化为止最后得到的k个聚类中心就是聚类的结果 K均值算法的聚类准则K均值算法的聚类准则函数为在算法中需要计算k个聚类的样本均值,K均值算法由此得名。 一个K均值算法的例子确定需要划分的聚类数目,比如,k=5随机选择k个聚类中心为每个样本寻找最近的聚类中心并将它划为该聚类每个聚类确定新的聚类中心如果聚类中心变化则重复直到收敛 关于K均值算法的若干问题算法的优化目标是什么?算法可以保证收敛吗?算法可以确定找到一种最优的聚类吗?算法应该如何初始化? K均值算法的优化目标K均值算法的聚类准则函数为即寻找J的最小值,显然当J最小的时候J对每个聚类中心的偏导数应该为0此时说明在算法过程中采用类内样本的均值作为聚类中心能够使得聚类准则函数达到最小 K均值算法的收敛性算法的收敛性证明如下:将样本集中的有限个样本分为k个聚类只有有限种方法因此只存在有限种可能的聚类情况,其中聚类中心均为聚类的质心如果聚类情况在一次循环中发生了改变,那么它一定使得聚类准则函数J改进了因此每一次聚类情况的改变都会产生一种未出现过的聚类情况这样反复进行下去,最终会遍历到所有的聚类情况,算法必然会收敛。 K均值算法的最优解问题K均值算法是一种贪心算法贪心算法并不一定能够得到全局最优解,经常会陷入到局部最优而非全局最优的情况右图是一种局部最优但并非全局最优的情况 如何寻求最优解?初始聚类中心的选择随机选择第一个聚类中心将第二个聚类中心选在距第一个尽可能远的地方…将第j个聚类中心选在距第1到第j-1个都尽可能远的地方…使用各种不同的随机的初始聚类中心得到较多的聚类情况的结果,取平均值 K-means程序简单实现在matlab软件的command对话框里输入:”helpkmeans”IDX=KMEANS(X,K)X代表输入图像,K代表所要分割的区域个数IDX代表分割后的标记图像。原始图像标记图像 彩色图像的分割选择好的颜色空间或模型;采用适合此空间的分割方法; 彩色图像的分割——颜色空间的选择RGB三个颜色分量具有很强的相关性,不易分割;为了降低颜色空间特征向量之间的相关性,将RGB投影到其他的颜色空间中;例如:RGB投影到HSI空间;H表示色调,S表示饱和度,I表示明暗程度;HIS非常适合基于人的视觉系统对彩色感知特性的图像处理。 彩色图像的分割——颜色空间的选择RGB转化到HSI公式: RGB与HSI分量表示颜色 彩色图像的分割——分割策略由于HSI三个颜色分量是独立的,那么就可以分别在三个颜色分量依次上进行分割;原始图像RGB-HSI用S分割低S区域高S区域用I分割用H分割合并结果后处理H分割图I分割图分割图像流程图 详解流程图利用S分高饱和、低饱和区;利用H对高饱和区进行分割由于在高饱和彩色区S值大,H值量化细,可采用色调H的阈值来进行分割;利用I对低饱和区进行分割在低饱和彩色区H值量化粗无法直接用来分割,但由于比较接近灰度区域,因而可采用I来进行分割。以上三个分割步骤中可以采用不同的分割技术。彩色图像和接下来介绍的彩色纹理图像可以通用分割方法,因此将两者的实例放在彩色纹理图像之后来介绍。 彩色纹理图像简介纹理图像指在普通的彩色RGB图像(或者其他格式)上,叠加纹理起伏变化的图像(以纺织布料图像为例)。特点:图片中的颜色种类较少,图片的复杂度较低。整张图片的纹理成规则变化。不同颜色的交界处,容易出现混叠颜色,这是分割中错误最容易出现的地方。 彩色纹理图像简介纹理彩色图像彩色纹理图像 彩色图像和彩色纹理图像分割方法种子生长色差距离贝叶斯概率距离多维直方图分割各个颜色分量上逐步投影分割 贝叶斯概率模型分割纹理图像贝叶斯概率模型是数理统计里十分重要的数学模型,将其应用到图像分割中也有很强的适应能力。贝叶斯概率首先需要先验概率,在图像分割中,可以人为的在原始图像上划分一些“种子区域”作为先验概率的基础。“种子区域”即对图像上的若干颜色区域,人为的做上标记,每个标记对应一个颜色区域。这些被标记的像素点是肉眼看起来十分符合这个颜色区域的整体颜色值的,没有歧义的。 种子分割人为的选取种子区域;种子区域扩大;计算非种子像素点与种子区域的“距离”,标记区域。 种子图像原始图像种子图像(每个黑色区域标值不同)*贝叶斯概率主要是用来对非种子像素点进行标记 距离公式种子区域的扩大和非种子像素点的标记都需要运用距离公式来判断该像素点属于哪个区域。常用的距离公式有:欧几里德距离公式x,y,z代表三个颜色分量,表示三个分量的均值。x,y,z三个分量可以是RGB,Lab,HSI或者其他色域。贝叶斯概率公式 贝叶斯概率的基本原理先验概率:多维正态分布概率:后验概率:是指区域的协方差矩阵,指区域RGB向量均值,x是当前像素点的RGB向量值。 欧几里德距离扩大种子区域计算每个种子区域的三个颜色分量的均值;遍历整幅图像,计算非种子像素点与种子区域的距离,寻找最小距离,如果最小距离同时小于其他距离的几倍(认为设置的参数),那么改像素点扩大为种子像素点;遍历整幅图像,计算非种子像素点与扩大后种子区域的均值向量之间的距离,寻找最小距离,标记到该区域。 贝叶斯概率种子区域扩大统计每个种子区域的像素个数,以及全部种子像素点的个数,得到各个区域的先验概率;计算每个非种子像素点相对于每个种子区域的多维正态分布概率;计算后验概率;取后验概率最大值,最大值对应哪个区域,则当前像素点属于哪个区域;更新该区域的像素个数,以及区域颜色均值和协方差矩阵。 原始图像色差分割概率分割由于概率分割考虑的是全局的信息,局部信息较少,所以会出现孤立的分割的点。 原始图像色差分割概率分割 原始图像色差分割概率分割 多维直方图分割首先选择一个颜色空间,例如Lab颜色域;现在L分量上进行直方图分割;将分割的各个区域依次在a分量上分割,每个区域又有可能分为几个新的区域;最后投影到b分量上,完成分割。 直方图分割实例原始图像分割图像 原始图像分割图像 原始图像分割图像 多光谱图像简介多光谱图像是样本图像在不同的光谱照射下,得到的一组图片。 多光谱图像分割将多光谱图像转换到Lab色域图像,直方图分割;利用主元分量提取方法,降低原始多光谱图像的维数,将多光谱反射率系数投影到特征向量上,形成直方图,直方图分割;K-means分割。 主元分量提取(PrincipalComponentAnalysis)寻找大量样本数据方差最大的方向;提取少数特征向量的方向,减低样本数据的维数。公式:将采集的多光谱反射率系数投影到特征向量上,投影系数形成直方图,进行直方图分割。协方差矩阵:求得特征向量: 分割实例原始图像Lab分割图像PCA特征向量分割图像K-means分割图像 原始图像Lab分割图像PCA特征向量分割图像K-means分割图像 车牌识别系统汽车牌照自动识别系统是公路交通自动控制和管理的一项重要内容,有关该系统的研究具有很高的现实意义和实用价值。车牌识别四个步骤:牌照分割(用到了图像分割技术)二值化字符切分字符识别 牌照分割所谓牌照分割是指从采集的汽车图像上,分割出牌照部分图像。根据车牌自身特点进行分割:图像上字符和背景有一定的灰度差别,且其分布较紧密而有序;牌照文字周围有一个类似于长方形的边框,但其厚度不一,有断裂处,且有时很不明显;牌照颜色与其他区域有差别,但在日光下很容易出现颜色漂移;2,3具有不确定性,1作为主要依据。 根据边框对牌照精确定位利用边缘提取的算子,提取牌照的边框:SobelPrewittRoberts原始图像横向sobel纵向sobel 二值化通过阈值分割的方法,将车牌图像分为图像和背景两部分信息,例如:背景设为0,那么图像就设为1。图像上图像用灰度值0表示,图像用255表示。车牌图像二值化图像 字符切割——预处理预处理:根据字符边沿作直线拟合;滤除边沿直线外部的边框区域;根据拟合直线的斜率调整形变。二值化车牌图像直线拟合图像消除边框图像斜率调整图像 字符切割二值化图像垂直投影,寻找投影图的断裂点。垂直投影(原理请见参考文献)字符切割后,根据模板匹配、神经网络识别、灰度法、小波分析等进行字符识别。预处理后图像垂直投影图像 TheEnd

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭