基于演化算法及改进词袋模型的病虫害分类识别技术研究

基于演化算法及改进词袋模型的病虫害分类识别技术研究

ID:76161161

大小:985.06 KB

页数:68页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第1页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第2页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第3页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第4页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第5页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第6页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第7页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第8页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第9页
基于演化算法及改进词袋模型的病虫害分类识别技术研究_第10页
资源描述:

《基于演化算法及改进词袋模型的病虫害分类识别技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

学校代码:10564学号:2013210002分类号:TP391.41密级:硕士学位论文基于演化算法及改进词袋模型的病虫害分类识别技术研究温志超指导教师:李康顺教授学院名称:数学与信息学院专业名称:计算机应用技术答辩委员会主席:周育人教授中国·广州2016年6月 华南农业大学学位论文原创性声明本人郑重声明:所呈交的学位论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:日期:导师签名:日期: 摘要农作物病虫害的爆发意味着农作物的大规模减产和品质下降,同时农户盲目施药也导致了农药残留超标、环境破坏等严重后果。随着计算机技术的发展,机器视觉技术的研究与应用已经扩展到农业工程领域。利用机器视觉技术检测和识别农作物病虫害,提供准确、可靠的病虫害诊断及防治意见,以达到合理施药,提质增产的目的,对促进我国现代化、智能化农业的发展具有重要意义。本论文以玉米农作物为研究对象,设计出适用于农作物病虫害诊断领域的分类识别方案,对图像病斑区域的精细化提取,并结合改进词袋模型实现玉米病虫害分类识别。本论文主要研究工作及创新点如下:(1)采集并分析玉米病虫害图像数据集。本论文主要采集玉米叶部病虫害图像用以进行测试实验,包括大斑病、小斑病、炭疽病等常见玉米病虫害类别,并对采集的图像数据集进行规格化。对数据集中玉米病虫害图像进行分析,得出病斑区域与无病状区域的颜色、纹理等方面的差异信息,作为病虫害图像分割及病斑提取的主要依据。(2)针对玉米病斑部位在图像中表现的特征,设计了基于演化算法的直方图二次分割方法。结合对玉米病虫害图像的分析,充分考虑病虫害病斑的颜色、纹理等特征,将图像色度与灰度组成二元组构建二维直方图,解决了一维直方图不能明显地区分目标和背景双峰分布的情况,同时改进了传统二维直方图应用在病虫害病斑提取的不足。运用了基于演化算法的OTSU二次分割方法,设计适合病虫害图像数据特征的染色体编码,并结合图像分析结果选择初始化种群,提高寻优效率,同时通过设定波动阈值,在最佳阈值的波动领域范围内继续搜索,实现全局搜索与局部搜索相结合。(3)借鉴导向滤波算法思想,实现了对玉米病虫害图像病斑区域的精细化提取。在病斑区域提取过程中,借鉴导向滤波算法的思想,利用灰度导向图进行引导,对图像分割结果进行滤波操作,设置权系数矩阵,针对在分割后病斑边缘、纹理模糊和粗糙位置进行恢复,优化病斑提取结果,更好地保留病虫害图像病斑的边缘、纹理特征。(4)通过对传统词袋模型各个算法模块的研究,融合病斑提取算法,设计应用于农作物病虫害识别的改进词袋模型识别方案。对农作物病虫害图像进行演化算法的区域提取,并采用Dense-SIFT进行均匀采样的特征提取,对提取的图像特征使用空间金字塔匹配方案映射到高分辨率空间中进行匹配,最后使用LIB-SVM对数据集进行分类。I 最后,通过病斑区域提取实验说明:本论文提出的病虫害图像病斑区域提取算法能够有效确定玉米病虫害图像中病斑位置,提取出具有细腻边缘和纹理的病斑,通过与基于阈值的传统OTSU算法、基于聚类的EM算法、G-MRF算法、SRG算法进行对比实验,证明本论文病斑提取算法的有效性和优越性。在此基础上,通过病虫害图像分类实验证明:本论文设计的应用于农作物病虫害识别的改进词袋模型识别方案提高了词袋模型对病虫害图像的识别性能,能够更加关注病虫害图像中病斑位置的特征,适用于病虫害图像识别领域,取得令人满意的结果。关键词:农作物病虫害;演化算法;病斑提取;图像分类识别II ResearchofCrop-DiseaseClassificationandRecognitionTechnologyBasedonEvolutionaryAlgorithmandImprovedBOWModelWenZhichao(CollegeofMathematicsandInformatics,SouthChinaAgriculturalUniversity,Guangzhou,510642,China)Abstract:Theoutbreaksofcropsdiseasesandinsectpestscanresultinseriousdeclineofyieldandquality.Besides,blindlyapplicationofchemicalpesticidescanleadpesticidesremnant,environmentaldamageandsoon.Withthedevelopmentofcomputingscience,researchandapplicationofmachinevisionextendstoagricultureengineering.Inordertorationalusingpesticideapplicationandincreasingqualityandproduction,cropspetsdetectionandrecognitioncanprovideprecisediagnosisandpreventivesuggestionsbyusingthemachinevision.Besides,it’ssignificantforthedevelopmentoftheprecisionandintelligentagriculture.Thispapertakesmaizeasthestudyobjectanddesignsaclassificationandrecognitionmethodapplyingtothefieldsofcorpsdiseasesandinsectpests.Itfineextractthediseasespotsofimagesandintegratesimprovedbag-of-wordsmodeltoachieveclassificationandrecognitionofmaizediseasesandinsectpests.Theresearchworkandinnovativepointsinthispaperareasfollows:(1)Collectingandanalyzingmaizediseasesandinsectpestsimagedatasets.Thispapercollectsmaizeleafdiseasesandinsectpestsimagestoconducttestsofcommondiseasesinmaizeincludingnorthernleafblight,southernleafblight,anthracnosediseaseandsoon.Besides,theimagedatasetsarenormalized.Byanalyzingthemaizediseaseandinsectpestsimages,thedifferencesinthecolorsandtexturesbetweendiseasespotsandthenormaloneareusedasabasisforimagesegmentationandextractionofdiseasespots.(2)Consideringthefeaturesofmaizediseasespots,thispaperpresentsamethodofhistogramquadricsegmentationbasedonevolutionaryalgorithm.Combiningwithanalysisofmaizepestsimage,itfullyconsiderthediseasespotscolorsandtexturefeaturesandsoon.Andatupleconsistingofgreyandchromaticityofimageconstructsatwo-dimensionIII histogram.Itcandealwiththeproblemofone-dimensionwhichcannotdistinguishthebimodaldistributionoftheobjectandbackgroundandimprovethetraditionaltwo-dimensionhistogramapplyingtodiseasespotsextraction.ItalsousestheOTSU’shistogramthresholdmethodbasedonevolutionaryalgorithmtodesignchromosomecodewhichissuiteddatafeaturesofpestsimages.Anditselectsinitialpopulationwiththeimageanalysistoimproveoptimizationefficiency.Meanwhile,itcontinuesthesearchwithinthefluctuationrangeofoptimalthresholdbysettingfluctuationthresholdwhichachievesthecombinationofglobalandlocalsearching.(3)Thispaperintroducesguidedfilteringtoachievepreciseextractionofmaizediseasespots.Intheextractionprocess,imagesegmentationresultsarefilteredbyusinggrayguidedpathwhichusestheideaofguidedfiltering.Settingweightsmatrixtorecoversedges,fuzzytexturesandroughspotsofsegmentedimages.Itoptimizesthediseasespotsextractionresultsandbetterkeeptheedgesandtexturefeaturesofdiseasespots.(4)BasedonresearchofeachmodularoftraditionBag-of-Wordsalgorithms,thispaperpresentsanimprovedBag-of-Wordsalgorithmscombiningwithdiseasespotsextractionalgorithmwhichisusedinidentificationofcropsdiseasesandinsectpests.Itusesevolutionaryalgorithmforanobjectregionextractionofcropspestsimages.Then,extractedfeaturesofimagesaremappedtothehigh-spacebyusingspatialpyramid.AndthenthedatasetisclassifiedbyLIB-SVM.Throughtheexperimentsofdiseasespotsextraction,thispaperpresentsdiseasespotsextractionalgorithmwhichcanbeeffectivetodeterminethediseasespotsofmaizeimagesandextractdiseasespotswhichhaveadetailedgesandtextures.ThediseasespotsextractionalgorithmiscomparedwithOTSUalgorithmbasedonthreshold,EMalgorithmbasedonclustering,G-MRFalgorithmandSRGalgorithm.Theresultsofexperimentdemonstratetheeffectivenessandadvantageofthisalgorithm.Onthisbasis,throughtheexperimentsofclassificationimagesfordiseaseandinsectpests,theimprovedbag-of-wordsmodelalgorithmdesignedinthispapercanbeappliedinidentificationofcropsdiseasesandinsectpests.Itimprovetherecognitionperformanceoftraditionalbag-of-wordsmodelandpaysmoreattentiontofeaturesofdiseasespots.ExperimentsIV showsthatitisapplicableforidentificationofdiseaseandinsectpestsandachievedsatisfactoryresults.Keywords:CropsDiseasesandInsectPests,EvolutionaryAlgorithm,DiseaseSpotsExtraction,ImageClassificationandRecognitionV 目录1引言....................................................................................................................................11.1研究背景与意义.............................................................................................................11.2国内外研究的现状.........................................................................................................21.2.1计算机视觉技术的研究与应用..................................................................................31.2.2图像识别技术在作物病虫害诊断防治领域的研究现状..........................................31.3论文主要研究目标.........................................................................................................51.4论文章节安排.................................................................................................................61.5本章小结.........................................................................................................................72基于词袋模型的图像分类技术........................................................................................82.1词袋模型.........................................................................................................................82.2图像特征.........................................................................................................................92.2.1全局特征......................................................................................................................92.2.2局部特征....................................................................................................................112.2.3特征提取和特征选择................................................................................................112.2.4SIFT特征算法............................................................................................................122.3视觉词典构建...............................................................................................................132.3.1聚类算法....................................................................................................................142.3.2K-Means聚类.............................................................................................................152.4图像分类器...................................................................................................................172.4.1SVM分类器...............................................................................................................172.4.2Adaboost算法分类器.................................................................................................192.5本章小结.......................................................................................................................213基于演化算法的病斑区域提取方法..............................................................................223.1演化算法.......................................................................................................................223.2作物病虫害病斑分析...................................................................................................223.2.1图像灰度分析............................................................................................................233.2.2HSI色度分析..............................................................................................................253.3基于演化算法的病斑区域分割提取方案...................................................................27VI 3.3.1基于演化算法的病斑区域分割提取算法流程........................................................273.3.2演化算法与色度-灰度二维直方图的结合应用.......................................................293.3.3编码设计及种群初始化............................................................................................313.3.4适应值函数设计........................................................................................................323.3.5遗传策略设计............................................................................................................323.3.6基于灰度导向图的提取效果优化............................................................................333.4实验结果与分析...........................................................................................................353.4.1实验结果....................................................................................................................353.4.2对比与分析................................................................................................................363.5本章小结.......................................................................................................................384基于演化算法及改进词袋模型的病虫害图像识别分类..............................................404.1基于演化算法及改进词袋模型的优化方案...............................................................404.1.1融合演化算法的改进词袋模型算法流程................................................................404.1.2Dense-SIFT特征提取算法及性能分析....................................................................424.1.3空间金字塔匹配方案................................................................................................444.2LIBSVM分类器与传统分类器....................................................................................464.3实验结果与分析...........................................................................................................474.3.1实验选取的农作物病虫害图像................................................................................474.3.2实验设置....................................................................................................................474.3.3结果与分析................................................................................................................484.4本章小结.......................................................................................................................505总结与展望......................................................................................................................515.1总结...............................................................................................................................515.2展望...............................................................................................................................52致谢..............................................................................................................................53参考文献........................................................................................................................55附录..............................................................................................................................59VII 1引言1.1研究背景与意义中国是传统的农业大国,而农业生产在我国国民经济中占有重要地位。我国当前农业现代化水平不高,落后于发达国家100年左右,这也成为了我国现代化进程中的短板。当前我国正处于粗放型经营、能源消耗型农业生产模式,生产效益低。在这种模式下,农作物病虫害的爆发,便意味着农作物的大规模减产减质,造成难以挽回的经济损失。据了解,我国每年因农作物病虫害而造成损失大约为(汪京京等,2014):粮食15%、棉花20%、果品蔬菜25%以上。农户为了避免病虫害影响农业生计,一般会选择盲目地大范围、大规模地使用化学农药。虽然这种粗放、盲目的化学农药投放方式在一定程度上减轻了病虫害的受害情况,但是过量的、没有针对性的农药不仅不符合经济效益,同时也导致了农作物的质量差、产量低,更重要的是对农作物种植区域的生态环境造成了巨大的破坏,并且也对所生产的农作物的食用安全性造成巨大威胁。数据表明,我国应用在农业作物病虫害方面的化学农药使用量超过了25万吨(李艳领,2015),这种乱用、滥用化学农药的现象已经导致了部分农田生态环境遭到严重破坏,农田及周边环境的生物多样性也大大降低。过量、盲目地施用化学农药,会导致农药残留超标、环境植物破坏等严重后果,却仍被农户农民使用,究其原因,主要有以下几点:第一,当前我国农业的从业人员大多科技文化素质低,对病虫害认识模糊。我国农民受教育水平不高,科技文化素质较低,对于所种植作物的认识不够深入,无法在病虫害发生初期对其症状进行把握。同时,由于病虫害防治知识的缺乏,农民也无法对发生病虫害的作物进行准确诊断。就有农民为了保证作物产量,不分作物病虫害类别、不判断作物病虫害受害程度,甚至不管作物是否有病虫害,都一概喷洒化学农药,以图安心。第二,拥有农作物病虫害专业知识的农业专家缺乏,大量农户不能得到专业指导。因为社会经济发展和就业环境的影响,从事农作物种植研究、病虫害防治等领域的专业人才紧缺,远远不能满足我们当前农业生产的需要。专业人员指导意见的缺乏和农作物病虫害诊断和防治的咨询渠道不足,使农户错失病虫害防治的最佳时期,只能大剂量使用化学农药,以期减少损失。第三,当前在计算机领域投入使用的农作物病虫害专家系统大多需要输入参数多,1 农民难以操作。随着信息化、科技化进程的不断推进,计算机得到普及进村进户,利用计算机解决农业生产问题也是当前大部分农民的选择。而目前,计算机领域出现的农作物病虫害诊断与防治专家系统、农作物病虫害预测专家系统等,需要农户自行调查病虫害原因、受害程度、症状等多项数据,并且在准确理解专家系统中对病虫害症状等信息的文字描述后,才能得出诊断结果和防治意见。这种限制多,输入参数多的专家系统,对农户的个体素质要求高,需要对症状描述正确、输入数据定量不含糊,这显然使得这种专家系统难以实现对病虫害的准确分析和判断。因此,为了给农业从业人员提供可靠、准确的病虫害诊断及防治意见,保证其合理、有针对性地使用化学农药,提高农作物产量,必须要解决好如何协助农民快速、准确、客观地获取农作物信息,并提供专业意见。近年来,随着国家对“三农”问题的不断重视,“精准农业”概念逐渐兴起,运用信息化技术、计算机技术辅助农民进行农业生产生活的新思路也被提上日程。为解决农民对农作物病虫害检测识别方面的模糊性、主观性等问题,图形图像处理技术被引入到了在农业病虫害识别与防治的应用领域。计算机图形图像处理技术兴起于上世纪80年代,主要以图像数字化、图像编码、图像增强、图像复原、图像分割、图像分析等为主要内容(陈汗青等,2013),对计算机图形、图像进行改造、创造、分类等处理。农作物病虫害图像分类识别技术就是图形图像处理技术在农作物病虫害识别防治领域上的应用(汪京京等,2014),这种图像分类识别技术能够依靠计算机图像获取农作物大量的信息,作为病虫害诊断的依据,能够弥补传统诊断技术的不足,具备输入参数少、诊断速度快、识别准确率高、实时性好等特点,为农业从业人员及时提供必要信息和病虫害防治建议具有重要意义。因此,研究采用计算机图形图像处理技术实现病虫害分类识别,对满足当前农业从业人员对农作物病虫害诊断防治信息和知识的需求,有助于滥用、乱用化学农药的环境破坏、农药残留超标等问题的解决,对提高我国粮食生产能力和粮食安全具有深远意义。1.2国内外研究的现状人类视觉是人类获取外界信息的主要途径之一。有研究表明,在人类所感知的外界信息中,有超过80%的信息是由人类视觉系统获取的。如何模仿人类视觉,对外界系统的信息进行收集和处理,成为当前科学研究领域的热门课题。让计算机能够像人类一样通过视觉对世界进行观察、认识是计算机领域科学家们一直的期望。但是,目2 前计算机视觉与人类视觉仍存在着巨大的差距。为了减小差距,科学家们从视觉机制着力,不断研究人类视觉,以人类视觉的特点来进行计算机对视觉信息的处理方法。国内外众多学者都在对基于机器视觉的病虫害分类识别技术研究进行不懈的努力,然而计算机科学界最新的视觉技术和理论还并未应用到农业工程中,也未形成成型的理论和算法。目前基于机器视觉的农作物病虫害分类识别技术研究还主要局限于实验室,要想推广到实际应用领域还需要不断的研究和奋斗。1.2.1计算机视觉技术的研究与应用目前,研究视觉感知的学者群非常多元化,他们当中有神经解剖学、生理学、心理学、计算机视觉、及其数字视觉、模式识别、应用工程等领域的专家。在国外,麻省理工学院(MIT)、斯坦福大学(Stanford)、卡内基梅隆大学(Carnegie-Mellon)、马里兰大学(Maryland)等著名高等院校在视觉研究领域中一直处于领先地位。在我国许多高校及科研机构中,从事这方面研究的教授、博士也是有增无减。国内许多知名大学的计算机系、自动控制和电子工程系也存在同时有多个课题组在从事视觉研究。各种层次的计算机视觉领域研究成果已经被多个工业和部门采用,如产品的分类和组装、部件的定位与测量、交通监测控制、国防和国土安全等。由于视觉研究的复杂性和特殊性,其发展速度也相对缓慢,模拟人类视觉系统的技术还不够成熟,在未来的发展和研究过程中还会面临更多更高的挑战。计算机系统来模拟人类的视觉系统的应用,不但能够提高计算机的智能化和运算效率,更会对人类社会中多个行业的发展产生强大的技术推进作用。其应用范围将会涵盖科研、工业、农业、医药、航天、军事、交通、公安、气象、天文、安全等国民经济的各个行业。1.2.2图像识别技术在作物病虫害诊断防治领域的研究现状国外开展有关于机器视觉的农作物病虫害的诊断和图像识别的研究要更早些(Keagyetal.,1993;Ridgwayetal.,2001;Zayasetal.,1998)。早于1985年相关研究人员就针对谷物的形状特征进行识别。近年来随着计算机技术的发展,其中包括模式识别等技术的发展,计算机视觉领域也随之发展,并且将其运用到农作物的病虫害的识别与检测中。Keagy、Zayas、Christopher研究采用计算机视觉的识别技术,将其运用到储粮害虫的识别当中,实验结果表明了该方案具有较好的识别效率。Gassoumi则是针对棉田中的昆虫识别检测,通过采用了计算机图像处理技术,结合特征提取,3 对虫害进行识别。Gassoumi提出的模糊神经网络识别算法,对该领域中12种害虫中的11种的识别率达到90%以上,剩下一种为72%。Murakami等人对黄瓜叶片采样,利用灰度共生矩阵等多种方法识别。其中针对蓟马等病虫害进行鉴别,识别率高达90%以上。Shariff则是针对水稻中的6类害虫的图片进行分类识别。他提出的基于模糊逻辑的分类识别经实验证明对水稻6类害虫具有良好的分类识别率。而我国在农作物病虫害分类识别领域的探索相比国外则启动较晚。尽管如此,在国内的部分院校和研究院针对该领域也具有一定的研究基础。这是由于在我国发布的《粮食行业科技发展规划》中表明了粮食技术的发展需要有信息技术的辅助。而目前的障碍在于我国的相关技术的落后,因此需要加强相关领域的技术研究,并且与世界前沿的粮食技术接轨,将研究成果与实际问题相结合。而在粮食科技发展中有众多的研究方向,其中关于病虫害的智能识别检测是有待解决的关键问题之一。在我国已经有许多的学者专家关注该问题,并且通过采用计算机视觉解决问题(陈兵旗等,2009;邱道尹等,2007;邹修国,2011)。其中,邱道尹等运用了人工神经网络技术。他们针对大田农作物中的9类害虫,开发了实时检测系统,进行识别分类。随着计算机视觉技术的高速发展,微型害虫的种群密集程度的计算的问题也随着解决。中国农业大学的IPMIST实验室利用其研究成果对位于农作物的白粉虱计算种群密度,实验结果证明其识别精度达到90%以上。通过采用数字图像处理技术和局部门限法,陈佳娟将目标区域和非目标区域分割,并将研究结果运用于棉花叶子上的虫洞面积和叶子边缘的缺损程度以及虫害程度的鉴定。其实验结果证明了有效性,虫害程度的误差范围小于0.05(邹修国,2011)。张长利则是将神经网络运用到番茄的育种程度的判别中。其中关于神经网络的训练是采用遗传算法实现的。徐贵平等人同样也是针对番茄物种,但是研究的是在培养过程中对营养元素缺失的鉴别。其算法是通过使用百分率差分直方图改善特征提取效果,排除由于叶片形态、叶片所处环境等因素的影响,从而提高了提取缺失营养素的纹理特征的精度,其识别率高达80%。王克如同样也运用了数字图像处理与神经网络(王克如,2005),但他将专家知识与信息技术相结合,从而起到了对农作物病虫害的远距离识别与检测。程鹏飞则是从植物的叶片的颜色和纹理为出发点。他是通过使用色度学理论,以这两方面特征为基础人工选取适合的参数,并且使用了模糊K-近邻法进行叶片分类。王剑等人则是通过摄像采集了水稻病虫害的图像(王剑等,2006),以4 三化螟为对象,以神经网络为基础,完成鉴别,实验结果精度高达90%。梁子安等人采集了不同种类的昆虫图像(梁子安等,2007),并且获取其中的特征。他们将获取的特征以数学形式展现,以神经网络为基础加入粗糙集。实验结果证明具有较高的分类精度。在2009年,田有文、牛妍等人的以SVM为基础,提出针对黄瓜的病虫害的识别方法。其方法采用了线性核函数和径向基为算法基础。实验结果展现了该算法在黄瓜领域的识别精度高于其它的支持向量机的算法,并说明该算法针对小样本的数据集有较好的分类识别精度。2011年,刘鹏也运用支持向量机识别病虫害。但研究的内容为甜柿,以病虫害在表面留下的痕迹为对象,将提取得到的纹理和颜色特征,作为参数。支持向量机采用Sigmoid为核函数进行分类识别,实验结果说明该算法能够较好识别果类的病虫害。邱道尹研究了基于模糊决策分类器的分类识别,并且将研究成果运用到储粮害虫的识别中。他以虫害的形态、复杂度为识别特征,通过分类器分类,其精度高达95.2%。该实验结果说明了该算法针对害虫分类效果。除此之外,邱道尹也实现了在大田病虫害的监测,实验结果证明其在该领域的实用性。陈月华等人的研究对象为小麦的害虫。除了对害虫的分类进行研究,还将图像分割运用到其中。他们以蚜虫为识别目标,实验结果证明算法的有效性,其识别精度高达90.7%。1.3论文主要研究目标为了给农业从业人员提供准确、可靠的病虫害诊断及防治意见,帮助其合理、有针对性地使用化学农药,提高作物产量,研究基于机器视觉的病虫害图像分类识别技术具有重要意义。本论文的主要研究目标是设计一种应用于农作物病虫害诊断及防治领域的图像分类技术,通过获取的病虫害图像信息,确定农作物受害的病种。本论文研究工作主要有以下几个方面:(1)以玉米农作物作为分析对象,对采集的数据集中玉米病虫害图像进行分析,获得病虫害图像在叶部病斑部位与健康部位在颜色、纹理、梯度等特征的差异。分别将图像转换为灰度图像和HSI颜色空间的色度图像,并进行全局和局部的统计数据特征进行分析,得出叶部病斑部位与健康部位在颜色、纹理、梯度等特征的差异,作为病虫害图像分割、病斑提取及分类识别的重要依据。(2)结合对玉米病虫害图像的分析,将二维直方图分割方法应用于病虫害病斑分割。通过充分考虑病虫害病斑的颜色、纹理等特征,将图像的灰度与色度组成二元组5 构建二维直方图,更好地描绘像素的分布情况,解决了一维直方图不能明显地区分目标和背景双峰分布的情况,有效确定玉米病虫害图像中病斑位置,同时改进了传统二维直方图应用在病虫害病斑提取领域的不足。(3)运用基于演化算法的二次阈值分割方法,利用最大类间方差确定阈值,实现病斑区域的二值分割。设计适合病虫害图像数据特征的染色体编码,并结合图像分析结果选择初始化种群,提高寻优效率,同时通过设定波动阈值,在最佳阈值的波动领域范围内继续搜索,实现全局搜索与局部搜索相结合。(4)利用灰度导向图进行引导,对病斑区域进行精细化提取。引入了引导滤波算法的思想,利用灰度导向图进行引导,对图像分割结果进行滤波操作,设置权系数矩阵,针对在分割后病斑边缘、纹理模糊和粗糙位置进行恢复,优化病斑提取结果,更好地保留病虫害图像病斑的边缘、纹理特征。(5)通过对基于传统词袋模型分类技术各个算法模块的研究,融合病斑提取算法,设计应用于农作物病虫害识别的改进词袋模型识别算法方案。对农作物病虫害图像进行演化算法的区域提取,并采用Dense-SIFT进行均匀采样的特征提取,对提取的图像特征使用空间金字塔匹配方案映射到高分辨率空间中进行匹配,最后使用LIB-SVM对数据集进行分类,优化各个模块中对病虫害图像的识别性能,能够更加关注病虫害图像中病斑位置的特征。1.4论文章节安排本论文主要章节安排如下:第一章为引言部分,主要介绍了农作物病虫害图像分类识别技术的研究背景和意义,简要地说明了当前计算机视觉技术的研究与应用,并综述了图像识别技术在农作物病虫害诊断、防治领域的国内外研究现状。第二章介绍了基于词袋模型的图像分类技术,首先是讲述了图像分类识别技术的总体思路以及算法各个组成部分,接着分别介绍了图像特征的类型及其提取、选择,视觉词典构建及其使用的主流聚类算法,图像分类器构建及典型的SVM分类器、Adaboost分类器。第三章提出了一种基于演化算法的农作物病虫害图像病斑区域提取算法。首先对作物病虫害的病斑进行分析,针对病斑的特点提出一种基于演化算法的病斑区域提取算法,利用图像二维直方图的概念,结合演化算法智能性、并行性和鲁棒性等特征,6 实现对病虫害图像的病斑区域提取。第四章提出了一种基于演化算法和改进词袋模型的病虫害图像分类识别方案,通过实验确定改进词袋模型的最优方案,得出适合作物病虫害诊断分类的特征提取算法、分类算法等部分,同时结合基于演化算法的病斑区域提取算法和空间金字塔匹配算法,提高识别精度,最后通过实验分析验证可行性。第五章对本论文的所有研究工作进行了总结,并展望未来的研究方向。1.5本章小结本章主要主要为引言作用,阐述了农作物病虫害分类识别技术的研究背景及意义,介绍当前国内外的研究现状及主要研究成果,并说明本论文的主要研究目标和章节安排。7 2基于词袋模型的图像分类技术2.1词袋模型词袋模型是由文档分类领域发展而来的(Lietal.,2005;Marszaeketal.,2006),其基本原理是:通过对图像的分析提取出许多能够描述图像特征的图像块,以许多无序的图像块集合来描述图像,并构建特征向量对每个图像块进行表达,这些描述图像块的特征向量被称为视觉单词;将这些提取出来的视觉单词通过聚类算法形成视觉词典,以统计视觉单词在图像中出现的频率对图像进行表达,将训练集中的图像特征向量进行聚类,以加权统计的方式构建出能够描述一类图像的描述向量集合;最后,通过将训练集视觉词典中的视觉单词进行分类器训练,使分类器能够在这些向量的基础上实现对图像的分类识别。图2.1为基于传统词袋模型的分类方案。图2.1基于传统词袋模型的分类方案基于传统词袋模型的分类方案实现的具体步骤有以下几点:第一,图像特征提取。从训练集图像中检测图像块,常见的检测方法有密集取样法、随机取样法和特征点取样法。以许多无序的图像块集合来描述图像,并构建特征向量。以具有代表性特征形成全局图像特征和局部图像特征。8 第二,视觉词典构建。将从训练集中提取得到的向量形式表示的特征,然后以单词聚类的方法构建出能够描述一类图像的单词集合,利用这些单词来构建视觉词典。通过这一步骤,可以使得在进行待分类图像分类处理时,通过一定的判别方法找到最相似的单词,这样每一张图片都可以表示为视觉单词出现概率的集合。第三,分类器的训练和产生。使用加权、归一化等方法,把提取出的特征向量分配到聚类中。根据描述特征的统计结果产生兴趣点频度向量,将训练集视觉词典中的视觉单词进行分类器训练,使分类器能够实现对图像的分类识别。词袋模型具有强鲁棒性,可以通过设计不同的特征提取方法使得分类算法能够具备旋转不变性、尺度不变性等特点,在图像分类识别领域具有重要地位。2.2图像特征图像特征是对图像中存在的某种特征性质的描述(吴丽娜,2013),包括全局或局部的性质,是图像的基本属性。图像特征提取一般是进行图像分析的第一步,把图像的特征性质以高维映射等方式,抽象成一组能够表示某种特质的向量。作为计算机实现图像分类识别技术的重要步骤,决定着分类算法的正确率和分类效率。要想让计算机具备对图像进行分类识别的能力,就需要再图像中提取出可以描述图像关键性质的特征,并且能够使得具有不变性,对可以满足由背景不同、尺度不同、角度不同等因素造成的差异。当前的图像特征在图像分类识别领域,主要分为全局特征和局部特征。全局特征一般指颜色特征(Lietal.,2005;Marszaeketal.,2006)、纹理特征(Smithetal.,1996)和形状特征(Kunttuetal.,2003)等。全局特征通过提取整幅图像的底层信息和视觉属性来描述图像,提取快捷方便,但同时也存在着问题,例如对部分区域描述不准确、不能对局部区域的关键信息丢失等。而局部特征以其抗噪能力强、尺度不变、形状不变等特点,被越来越多的研究人员所关注。2.2.1全局特征全局特征的提取方法是早期是图像特征的研究方法,具有相对成熟的研究,主要是通过对于图像中某些特征或视觉属性,如颜色、纹理、形状、大小等属性,在基于全局的统计描述得出的图像特征。(1)颜色特征颜色特征是在图像中最明显,也是最基本的视觉属性。在大自然中,每一类物体,都具有自身的颜色表达,因此在图像中也会有着相应的颜色特征表达。在图像中,颜9 色特征是组成图像的要素。基于全局特征的颜色特征方法,具有高稳定性、尺度不变性、旋转不变性等特点,而当前较常使用的表示方法有:颜色统计直方图和颜色矩等。颜色直方图是在给定的颜色模型中,以直方图方式统计图像中不同颜色的分布情况以统计直方图的方式(孙君顶,2005),得出图像颜色特征的描述。颜色特征直方图是简单有效的特征提取方法,同时因为其具有的尺度、旋转不变等特性被广泛地应用。颜色直方图通常表示为一维的离散函数,用公式(2.1)表示为:୬ౡHሺkሻൌ,kൌ0,1,2,…,mെ1(2.1)୒其中,k为图像的颜色特征值,n୩为当图像颜色特征值为k的像素个数,N为图像像素的个数总数,m为颜色特征取值的个数。因为颜色直方图只反映了每种颜色特征在图像像素总数中的所占比例以及分布情况,并没有考虑各个颜色特征在图像中所在的位置及意义,所以颜色直方图一般适用于对可以忽略图像空间及位置的特征提取。累积颜色直方图是颜色统计直方图中常用的方法,能够以累加的计算操作,解决直方图的零值问题。累积颜色直方图本质上就是对统计颜色直方图进行累积操作,能够大幅度减少在上式中出现的零值个数,其表示如公式(2.2)所示:୩୬౟Iሺkሻൌ∑୧ୀ଴,kൌ0,1,2,…,mെ1(2.2)୒其中,k为图像的颜色特征值,n୧为当图像颜色特征值为i的像素个数,N为图像像素的个数总数,m为颜色特征取值的个数。颜色矩主要是来源于颜色统计直方图(杨红菊等,2009;何姗等,2006)。颜色矩是通过对统计直方图中统计数据进行计算,将图像的颜色分布用色矩的方式进行表示,把颜色的信息集中分布在低阶矩中。这是一种简单可行的颜色特征表示方法,无需对颜色空间进行量化,在一阶、二阶等低维向量提取特征,简化计算、提高效率。但是这种方法一般只适合进行图像的初步过滤。(2)纹理特征纹理在图像中表现为不同的亮度和颜色,普遍存在却又难以描述,每一种物体都有着各自独特的自然纹理,在图像中,图像的纹理是包含目标物体表面结构的重要信息、用以区分目标与背景的重要依据,体现目标与背景的联系(徐琨等,2005;杨红菊等,2009)。在图像分类识别领域,纹理特征通常表示为灰度图像的灰度分布规律或彩色图像的颜色分布规律。纹理特征主要对图像中不同图像纹理进行对照,计算差10 异,找出相似的图像。纹理虽然在视觉中很直观,但是在进行特征提取时,需要充分考虑维数、稳定性、复杂性等因素。由于许多研究基于不同的认识和考察角度,当前出现了许多纹理特征提取的方法,如统计方法、模型方法、结构方法等。(3)形状特征形状特征是指目标物体的轮廓属性,是在图像中显示的外部属性,对目标物体轮廓信息的准确描述,对图像分类识别的效果起重要影响。图像通常从区域、轮廓方面进行描述,将目标物体的形状转换为封闭的曲线(郭庆等,2011)。主要方法是对图像进行点线面的分解,注重轮廓线边缘的信息,或区域内所有像素的信息,对形状特征进行描述。2.2.2局部特征全局特征是在图像全局信息的角度,提取底层信息和视觉属性来描述图像(郭敏杰,2014)。这种特征提取方法虽然提取快捷方便,存在着一定的优越性,但是只关注全局分布信息而忽略局部信息的同时也存在着一些问题,例如对部分区域描述不准确、不能对局部区域的关键信息丢失等。全局特征在处理包含尺度变化、方向变化、亮度变化等因素的数字图像时表现敏感,导致图像分类识别精度大为下降,分类效果变得不理想。人类视觉系统在进行事物认知的时候,通常是将视觉信息中的图像分为多个局部区域,通过把局部区域中的信息进行综合分析,来达到对视觉范围内的物体进行识别分析。针对全局特征的弊端,局部特征也由此进入计算机视觉领域,局部特征具有抗噪能力强、尺度不变型、方向不变性等特性,成为了近年来的研究热点。局部特征主要有目标区域和局部图像块。局部目标区域是将目标图像进行区域化的分割,通过分析不同区域的内部信息及区域之间的关系信息,对图像进行描述。局部图像块是将图像按照兴趣点的位置进行椭圆区域划分或者网格区域划分,把划分得到的每个区域作为一个图像块,常用的划分方式有尺度不变特征变换和梯度方向直方图获取。2.2.3特征提取和特征选择特征提取和特征选择是对图像进行特征描述的关键环节(马静,2010)。特征描述的主要目标就是通过有效的计算和筛选,从图像中存在的众多特征中寻找出最具有代表性的特征。特征的量化维度一般都比较高,不能直接将其应用于图像分类器的设计。想要设计有效的分类器,需要把图像特征进行变换,将其压缩到维度较低的空间,11 用低维特征空间进行描述。这也是图像特征算法的重要课题。有效特征的获取,一般需要有特征形成、特征提取和特征选择等环节。(1)特征形成特征形成是根据被分类目标产生出系列基本特征的过程(宗华丽,2010;陈慧楠,2008)。通过测量器、传感器等方法获得现实目标中的特征,通过计算、换算方式获得波长、图像的特征,这些特征叫做原始特征。(2)特征提取原始特征组成的空间叫做测度空间。在测度空间里特征的维数一般很高,无法直接对其进行利用(曹连连,2012)。所以要将原始特征从高维的测度空间向低维的向量空间转换,以满足分类器设计要求。通过映射的方式,用特征向量对分类目标的原始特征进行描述,将其映射到低维向量空间,这样就可以用低维的特征向量进行分类器设计,提高分类器精度和效率。低维特征向量可以理解为原始特征的组合,多数情况下为线性关系的组合。特征提取就是原始特征从测度空间向特征空间的变换:若Y是测度空间,X是特征空间,则变化A:Y→X就叫做特征提取器。(3)特征选择特征选择可以有效的实现降低特征空间维度的目的(韩览山等,2002)。从提取出的系列特征中,选取一些最重要的、最具有代表性的特征,可以使得特征描述更加有效。然而,在实际问题中,特征选择常常受到许多限制,如难以对某些特征的重要性进行评价、难以测量、重要特征的表现性不明显等,导致难以获取最重要的特征。从而使得特征提取和特征选择的过程更加复杂,并成为图像分类识别技术中难以完成的任务。特征提取和特征选择是实现对目标特征降维目的的两种不同途径。特征提取是通过映射的方式,用特征向量对分类目标的原始特征进行描述,将其映射到低维向量空间,实现空间的降维;特征选择是根据专家先验知识、既定评价标准等,从提取出的系列特征中,选取一些最重要的、最具有代表性的特征,实现空间的降维。实际上,在某些情况下,特征提取和特征选择是可以相互组合的。2.2.4SIFT特征算法SIFT特征算法是一种基于梯度分布的尺度不变特征变换描述算法(Liuetal.,2009;Zhenetal.,2014)。SIFT特征提取算法在高斯差分尺度空间中检测极值点,通过极值12 点定位特征点,确定特征点主方向并生成SIFT特征。具体流程如图2.2:尺度空间极值检测确定特征点位置确定特征点主方向生成SIFT特征图2.2SITF特征提取SITF特征提取在局部特征提取过程中,利用高斯差分滤波对输入图像进行高斯卷积,建立高斯差分尺度空间,进行局部极值点检测(罗勇等,2015)。定义I为输入图像,G为高斯函数,则用公式(2.3)表示为:Dሺݕ,ݔሺܫ∗൯ሻߪ,ݕ,ݔሺܩെሻߪ݇,ݕ,ݔሺܩ൫ൌሻߪ,ݕ,ݔሻ(2.3)其中,ߪ,݇ߪ为尺度因子。在定位特征点后位置后,SIFT特征利用梯度方向直方图来确定主方向(余旺盛等,2014)。SIFT将360度的方向分为均等的36部分,通过计算极值点领域梯度,建立领域内梯度方向的统计直方图,以直方图峰值作为主方向,这样便具有了旋转不变性。2.3视觉词典构建视觉词典的构建(杨晓敏等,2014)是在图像特征提取之后,将所得到的特征向量转化成视觉单词,然后对这些单词聚类操作生成视觉词典。通过构建视觉词典,在对待分类图像进行识别分类时,将对待分类图像提取出的特征描述与视觉词典中的单词进行匹配,通过一定的判别方法找出距离最接近的单词,实现图像的识别分类。在13 提取图像特征之后,需要使用图像训练集构建视觉词典,构建过程一般使用聚类算法来完成。聚类算法对视觉词典有着重要影响,不同的算法对不同的词典构建具有时间复杂度和准确率的差异。在对待分类图像进行分类处理时,利用这些视觉单词构建的视觉词典,与待分类图像中提取的特征相匹配,通过一定的判定方法找到最接近的视觉单词。因此,每一张图像都可以表示为视觉单词出现概率的集合,并通过基于特征的统计直方图来表示,如图2.3所示。图2.3基于特征的统计直方图2.3.1聚类算法聚类算法是以相似性为基础,依据规则把数据集划分成若干个以某个兴趣点为中心的子集(孙吉贵等,2008)。不同聚类子集中元素间的差异性要比同一聚类子集中元素间差异性更高。聚类算法一般是把距离作为划分的标准,通过对数据集合进行若干子集的划分,依据特定的属性值作为计算距离的标准,并把最终计算出的距离作为相似度判定的标准。具体步骤一般为:创建初始化类别,划定初始集合;;采用迭代重定位,通过把目标元素从一个子集中调整到另一个子集中来进行划分。一个好的划分的一般是:同一个子集中的元素尽可能相互接近或相似,而不同的子集中的元素尽可能远离或相异。聚类算法分为层次化聚类算法和非层次化聚类算法(谢毓湘等,2000)。层次化聚类算法中又分为自顶向下方法和自底向上方法。自顶向下方法是首先将整个数据集14 视为一个大的类簇,然后逐步向下构建更下的类簇。自底向上方法则是将每个数据集合视为大小为1的类簇,然后逐步向上组合,形成更大的类簇。非层次化聚类算法是仅遍历训练集一下次的聚类算法,且算法性能与聚类数据顺序相关性极大。算法首先假设第一个数据集合是大小为1的类簇,当输入新的数据集合时,计算新数据与已有类簇中心之间的距离,即相似度。当新数据与某个类簇的相似度超过了设定的阈值时,新输入的数据集合就会被归入该类簇中。2.3.2K-Means聚类K-Means聚类算法(Liuetal.,2010)一般是以元素到聚类中心的欧几里得距离作为优化函数,采用误差平方和准则,求取初始聚类向量的最优分类。K-Means聚类算法的算法核心是将向量空间中的n个元素点,以集合内方差和最小为原则,划分为指定的k个类别,如公式(2.4)所示:Vൌ∑∑௞ሺݔെߤሻଶ(2.4)௜ୀଵ௫ೕ∈௦೔௝௜其中S୧表示以μ௜为中心的第i个集合,x୨表示位于集合S୧中的元素。K-Means聚类方法的具体步骤包括:(1)初始质心选定。如图2.4所示,在给定聚类元素集合后,初始化k个初始中心点,然后按照一定的规则选择每个集合的质心,如采用随机选择的方法。在K-Means聚类算法中,初始质心位置的选择十分重要,质心位置选取不当,可能会导致聚类结果不稳定,陷入局部而非全局最优。图2.4初始质心选定15 (2)聚类集合划分。如图2.5所示,计算每个元素与聚类中心的距离,按照评价指标最小化准则,对n个元素进行分配,将其划入距离最近的聚类集合中去。K-Means算法并不擅长处理离散型属性元素,而对连续型属性元素比较合适,因此在计算聚类中心之间的距离时,可以使用欧几里得距离、曼哈顿距离等作为评价标准,其中最常用的是欧几里得距离。图2.5聚类集合划分(3)聚类中心调整。如图2.6所示,根据集合划分的结果对新形成的k个类别进行计算,使得原中心向新的聚类中心调整。图2.6聚类中心调整16 (4)重复步骤(2)和(3),直至聚类结果收敛。在K-Means聚类算法之后可以对图像训练集中的图像的描述特征进行聚类,其中聚类质心称为视觉单词,聚类质心的集合称为视觉词典。2.4图像分类器分类器是在得到视觉词典后通过视觉单词的匹配实现对图像分类识别的算法。直观上来看,分类性能越高的分类器在分类边界距离样本点越远。图像分类器可以分为判别式模型和产生式模型。判别式模型是一种自底向上的方法,需要多个不同类别的数据集合,以数据驱动的方式来进行学习。其中,支持向量机(SVM)方法是典型代表,以最优分类面作为学习的目的,能够将不同的数据集合进行准确的分类。产生式模型则是自上而下的方法,注重每个数据集合内部的元素情况,为每一个类别都产生一个模型,更容易为新的数据集合建立新的类别,从而表示更多的数据信息。因此,在处理不完整的数据、部分缺失的目标时,产生式模型能够有较为出色的表现。在词袋模型中,给定一个待分类的图像,图像分类器将从待分类图像中提取的描述特征与视觉词典中的视觉单词进行匹配,以设定的判别方式找出距离最接近的单词,实现图像分类。视觉单词以统计直方图的形式表达图像的特征,分类器可以通过设定这些特征向量距离的评价准则,设计满足针对不同目标对象的分类,从而有效地判别图像,实现识别分类。2.4.1SVM分类器支持向量机(SVM)是基于线性可分的最优分类面的(Guoetal.,2015)。SVM的基本思想可以概括为:以定义的内积函数对SVM的输入向量进行非线性变换,把输入向量映射到高维空间中,并计算高维空间中的最优分类面。如图2.7中的三角形点和圆形点分别表示两个不同类别的训练样本,两类样本元素为线性可分的情况,H为把两类样本准确分离的分类线,Hଵ、Hଶ表示为平行于分类线且分割两类的直线,Hଵ和Hଶ的距离成为分类间隔。最优分类线满足以下两个条件的分类线:能够准确地将不同样本进行分类和使得分类间隔最大化。17 图2.7低维空间的最优分类面在线性可分的前提下,误判样本会增加经验风险,因此最优分类线需要确保经验风险值最低。而分类间隔相当于分类线的置信范围,为了使期望风险最低,最优分类线需要让置信范围最大。将最优分类线推广到更高的维度,最优分类线就是最优分类面。最优分类函数如公式所示:fሺxሻൌsgnሼሺ߱∗∙ݔሻ൅ܾ∗ሽ(2.6)其中,ݔ为样本向量,߱∗为最优分类面的权向量,sgnሺሻ为符号函数。将问题转化为二次规划问题,构造拉格朗日函数,用公式(2.7)表达为:ଵଶ௡ሾሺ߱∙ݔሻ൅ܾሿെ1ሽLሺω,b,aሻൌ||߱||െ∑௜ୀଵܽ௜ሼݕ௜௜(2.7)ଶ若ܽ௜为最优解,最优分类函数可表示如公式(2.8):fሺxሻൌsgnሼ∑௡ܽ∗ݔ∙ݔሺݕሻ൅ܾ∗ሽ(2.8)௜ୀଵ௜௜௜在线性不可分的情况下,在条件中添加松弛变量,将问题转换为二次函数极值问题,也同样可以获得最优分类函数表达如公式(2.8)。从最优分类函数表示可以看出,SVM在结构上类似于神经网络,如图2.8所示。SVM的输入向量与支持向量的内积得出每一个中间节点,而通过其中中间节点的线性组合便得出了SVM的输出结过。因此,SVM也可以被称作支持向量网络。18 图2.8支持向量机结构图2.4.2Adaboost算法分类器Adaboost算法是Boosting算法的一种变形(Tang,2014),于1995年由Freund和Schapire提出。Adaboost算法是一种迭代算法(Yeom,2013),同时为了组合更加强大的分类器,它允许不断加入弱分类器,使得误差率达到设定的阈值。在AdaBoost算法中,首先对同一训练样本集进行抽样,获取不同的训练子集,以某种准则赋予训练样本集中的每个样本子集一个权值,以这一权值作为依据,计算每一个样本子集被某个确定的基分类器选中作为训练样本的概率。而在每一次迭代中,样本的分类情况和上一次整个训练样本集的分类正确率作为更新训练样本子集权值的依据,然后根据更新的权值选取样本点,获取新的训练子集,训练下一个基分类器。若样本被正确分类,则其权重降低,即被下一个基分类器选中作为训练样本的概率减小,反之,若样本被错误分类,则其权重加大,即被下一个基分类器选中作为训练样本的概率增加。因此,AdaBoost聚类方法聚焦于那些相对困难的样本。具体实现如下:(1)初始化训练样本和权重。对同一训练样本集进行抽样,获取不同的训练子集,对于初始化训练样本集中的每个样本子集赋予相同权重。19 (2)循环迭代,训练分类器。经t次循环后,得到t个弱分类器,按更新的权值叠加。在每次迭代中,如图2.9所示,根据样本权重选取样本点组成训练子集,利用学习算法BaseLearn获取基分类器h୲:X→Y,用基分类器h୲对当前所有样本进行分类并调整权重,并用评价因子α୲描述基分类器h୲的重要程度。图2.9训练分类器(3)构建最终组合分类器。如图2.10所示,利用迭代生成的基分类器hଵ,hଶ,…,h୲,和分类结果hଵሺxሻ,hଶሺxሻ,…,h୲ሺxሻ,对其进行带权重αଵ,,αଶ,…,α୲的投票,得到最终分类器。图2.10构建最终分类器20 2.5本章小结本章主要介绍了基于词袋模型分类技术及其各个模块。词袋模型的基本原理是以许多无序的图像块集合来描述图像,并构建特征向量对每个图像块进行表达。基于词袋模型分类技术主要分为三个部分:图像特征提取、视觉词典构建及分类器的训练和产生。在图像特征提取部分,对图像特征的类型、提取和选择方法进行说明,并介绍其经典算法SITF特征提取算法。在视觉词典构建部分,主要介绍了构建视觉词典的聚类算法及其主流算法K-Means算法。在图像分类器部分,主要是介绍了分类器的两种典型代表:SVM分类器和Adaboost分类器。21 3基于演化算法的病斑区域提取方法3.1演化算法演化算法是Holland在1975年提出的一种迭代搜索算法。演化算法借鉴达尔文生物进化理论(Zhangetal.,2011;Kavetha.M.,2013),将生物进化、种群繁衍的大自然规律融入到算法当中,使算法具有智能性和并行性。同时,合理设计演化算法能使得在问题求解的过程中有效避免局部最优问题,使算法具有强鲁棒性。演化算法本质上是一种概率性随机搜索,但是具有自适应性,借鉴“适者生存,优胜劣汰”的进化思想,算法赋予种群中每个个体一个适应值,代表个体在生物进化过程中的存活概率,适应值较高的个体,则其进入下一代繁衍的概率就高。正是这种选择策略,使得演化算法能够在对实际问题求解的过程中具备自适应性,产生更好的后代,更优的解。在演化算法中,算法对问题的处理并不是直接对问题的解空间进行最优解搜索的,而是将问题的解进行基因编码,建立问题解与基因编码的映射,让每一个潜在的候选解都存在一个基因编码与之对应,在算法搜索的过程中,对编码的解进行搜索。在确定对问题潜在候选解的编码方式之后,就是生成初始种群。初始种群是算法搜索的起点,是种群繁衍的第一代,科学合理地设置初始种群,有助于算法更快地更有效地得到问题的最优解。在种群繁衍进化的过程中,演化算法以适应值作为评价种群个体优劣的唯一指标。算法通过对问题的建模分析,设计符合问题求解的适应值函数,用适应值的大小评价种群个体在进化过程之中存活到下一代并进行繁衍的概率,实现对种群个体的优胜劣汰。和大自然的生物进化过程一样,演化算法的进化过程也需要经历选择、交叉、变异三个过程。选择、交叉、变异被称为演化算法的遗传操作。正是因为具有遗传操作,使得种群个体的繁殖更加具有多样性,能够产生不同的解,避免陷入局部最优的困境。演化算法的整个过程如同生物自然进化一般,不断产生更优的后代,在算法收敛时的末代种群个体中,适应值最高、最优的个体经过基因解码,就得到问题的最优解。3.2作物病虫害病斑分析由于作物病害本身具有多样性以及特征的变化性特点,为机器视觉诊断病害带来诸多困难。大田农作物病虫害具有数目繁多的类别、复杂多样的病害症状,这使得大田农作物病虫害的分类识别更加困难。对作物病虫害图像的研究和分析发现,叶部病22 虫害因为其发生部分相同,有的症状也及其相似,难以区分。本节将以玉米作物病虫害图像为研究对象,研究叶部病虫害,分析图像中病斑区域的视觉特征和统计特征。利用图像分析,结合机器视觉技术,将图像中一些难以描述的信息转换为计算机能够识别、处理的指标,成为病虫害图像分类识别技术中判别叶片有病与无病的重要依据。3.2.1图像灰度分析农作物病虫害图像的灰度图像包括了图像的许多特征,而灰度直方图可以概括地表示图像的灰度级统计信息,并且可以得到针对特定类型的图像描述信息。如图3.1所示,以玉米大斑病图像为分析目标,对原始图像进行灰度级256级灰度化后,利用灰度直方图对病虫害灰度图进行分析。从视觉角度分析,可以观察得到叶部病斑位置有着明显的外部特点,病斑区域灰度值明显比病斑周围无病状区域更高。从统计信息角度分析,可以发现玉米大斑病图像的灰度值统计直方图大致呈单峰分布,并且在灰度值100领域范围内发生明显变化,频数快速下降。图3.1大斑病图像灰度化分析表3.1病虫害图像灰度信息图像类型均值均方差熵能量无病状图像147.6713.875.820.019大斑病109.3030.276.800.012小斑病125.1143.417.010.010灰斑病127.2832.636.850.011褐斑病146.0126.396.640.012炭疽病147.1432.116.900.00923 农作物病叶受侵染的过程是病原菌侵入引起局部一边,逐渐向外发展,形成尺寸、颜色、形状各不相同的失绿斑点,使得病斑区域与健康叶部区域在色彩上产生差异,而这种差异在灰度图像上表现为灰度上的不均匀性。针对灰度图中,大斑病叶部病斑和叶部无病状区域,进行分析,如图3.2所示。分析结果:从直方图中可以看到,病斑位置的灰度值大致分布在100以上,而无病状位置的灰度值大致分布在100以下,即对于某一类特定的病虫害图像,病斑区域与无病区域内的灰度值处于不同的灰度值区间内,这与观察到的叶片病部与非病部的外观特点是一致的,也与病斑形成的规律一致;在表3.1和表3.2中可以发现,病虫害图像中病斑位置的灰度值均值高于无病状区域灰度值均值;而且图像中病斑区域内灰度值方差较大,分布较为不均匀,而无病状区域内灰度值趋同,分布更为均匀;病斑区域在直方图中灰度值分布较为平均,即在图像中灰度分布分散,叶部健康区域则反之,分布集中。图3.2大斑病图像灰度直方图分布特点24 表3.2病虫害病斑图像灰度信息病斑类型均值均方差熵能量大斑病173.7928.726.720.010小斑病183.7635.946.830.009灰斑病170.0432.036.450.013褐斑病140.9523.346.500.014炭疽病149.6719.326.240.0143.2.2HSI色度分析HSI颜色空间是使用色度值、饱和值、亮度值三种指标来描述图像颜色的模型(杨俊红等,2009)。其中色度值定义为颜色波长,即反映图像颜色的纯色程度。因为病叶受侵染的过程会在逐渐向外发展中形成尺寸、颜色、形状各不相同的失绿斑点,所以以HSI颜色空间中的色度值能够更加清晰明显地反映病虫害图像中病叶的颜色差异,一般病虫害病斑会呈现黄色、红褐色、灰褐色等异样的颜色。因此,在HSI颜色空间下对病虫害图像进行色度值分析,可以包含较多的颜色特点,能更有效的反映出病叶的某些视觉特征和统计特征。如图3.3所示,将玉米大斑病图像由RGB颜色空间转换为HSI颜色空间进行分析。为了便于观察分析,获取在HSI颜色空间中色度值H,计算转换图像IൌH/ሺ2πሻ,将转换图像I同样划分为256级。在转换图像I中病斑位置与无病状位置有着明显的外部相异特征,并且在统计直方图中可以观察到有较明显的双峰现象。图3.3大斑病HSI色度分析25 表3.3病虫害图像色度信息图像类型均值均方差熵能量无病状图像67.342.763.110.153大斑病63.7711.944.580.069小斑病55.1610.465.010.041灰斑病75.9821.856.130.017褐斑病58.549.224.870.044炭疽病44.7410.995.040.038针对转换图I中大斑病叶部病斑位置和叶部无病状位置,进行分析,如图3.4所示。得出分析结果:病斑位置色度值H的平稳性与无病状位置无明显差异,同时色度值H都集中分布于某一区间,分布均匀。在表3.3和表3.4中可以发现,HSI颜色空间中色度值是表示物体表面颜色的重要指标,而叶片在发生病害之后,颜色会发生明显变化,而这一变化能利用色度值准确反映,并以此作为判别病斑位置的重要依据。图3.4大斑病图像HSI色度值分布特点26 表3.4病虫害病斑图像色度信息病斑类型均值均方差熵能量大斑病32.446.903.320.170小斑病43.068.844.880.038灰斑病41.3920.155.450.034褐斑病55.919.184.940.040炭疽病37.685.114.330.0563.3基于演化算法的病斑区域分割提取方案3.3.1基于演化算法的病斑区域分割提取算法流程数字图像处理、图像匹配、图像分类识别等技术,其工作一般都是建立在图像分割的基础上。通过合理有效的图像分割可以提取图像中有意义的特征,获得应用所需的图像信息。图像分割的目标就是将图像中具有相同或相似特征的模块进行分解,得到一些具有不同特征的基元。图像分割得到的基元称为图像的基元。相对于整幅病虫害图像来说,提取出病虫害病斑的图像基元能够更容易也更快速地被处理。因此,针对农作物病虫害图像的特征,设计有效的图像分割算法,提取病虫害病斑区域,对图像分类识别的实现起着基础性的作用。病虫害图像特征可以分为视觉特征和统计特征(王瑶,2008)。其中病虫害图像的视觉特征指人类视觉系统能够识别的特征,如图像中病叶的色彩、病斑区域的亮度、纹理、形状等;病虫害图像的统计特征指通过一定的图像变换,用统计手段获得的特征,如颜色矩、统计直方图、图像频谱等。基于图像灰度值的阈值分割是十分有效的方法,阈值化可以减小计算代价,更易用于特殊实时要求的应用场景,因此阈值化分割方法被广泛应用。本章将提出一种基于演化算法的阈值分割算法,融合引导滤波算法设置权值矩阵,实现对病斑区域提取。具体流程如图3.5所示:27 图3.5病斑区域提取算法实现流程主要步骤如下:(1)构建二维直方图。对原始病虫害图像进行灰度转换和色度转换,利用色度信息和灰度信息建立二维色度-灰度直方图,将病虫害图像中的病斑设为目标类,将其他部分都设为背景类,使得在直方图中能够反映更多的病虫害图像信息。一维向二维的转换,能够更加清晰地反映病斑信息的分布情况和聚类信息。(2)应用演化算法得出标示病斑区域的二值矩阵。利用色度-灰度二维直方图设计演化算法进行阈值搜索,通过二次寻优的过程确定阈值。设计适合病虫害图像阈值特征的染色体编码,并结合图像分析结果以经验值结合随机值选择初始化种群,提高寻优效率。结合一维直方图及二维直方图中对目标及背景的测度方法,设计评价病斑分割效果的测度函数,评价个体的优劣。结合病虫害图像的特点,设计遗传操作的策略,提高寻优效率,加快算法收敛。最后利用演化算法得出的最佳阈值获取病斑分割的二值矩阵,标示病虫害图像中的病斑区域。(3)利用导向图计算病斑提取的权值矩阵。简单的二值化分割结果用于提取病害28 区域,容易丢失病斑原有的边缘、形状、纹理等特征,不利于病虫害的分类识别。因此,引入了引导滤波算法的思想,基于灰度导向图进行引导,对图像分割结果进行滤波操作,计算病斑区域提取的权值矩阵,优化病斑提取结果,针对在分割后病斑边缘、纹理模糊和粗糙位置进行恢复,更好地保留病虫害图像病斑的边缘、形状、纹理等特征。3.3.2演化算法与色度-灰度二维直方图的结合应用阈值分割是进行图像分割的有效手段,而进行阈值分割的理想情况是待分割图像的统计直方图为双峰形态,以直方图中的谷作为分割阈值,实现对目标和背景的分离(梁义涛等,2012)。但是在大多数情况下,图像直方图都不是双峰形态的,更多的是单峰或者多峰形态,这样就会使得直方图分割阈值的选取出现困难。二维直方图分割方法是由传统一维直方图分割方法发展而来的,是基于阈值的图像分割方法。二维直方图以i、j分别代表图像中两种指标,以具有二元组ሺi,jሻ出现的频数或频率作为纵坐标,建立图像的三维信息坐标。传统的二维直方图的基于灰度信息的,设二元组ሺi,jሻ出现的频数为f୧୨,其中i、j分别对应此像素点的灰度值和其右上像素灰度值,其联合概率密度定义为公式(3.1):௙೔ೕ݌௜௝ൌ(3.1)ெൈே式中MൈN为图像大小。以此形成代表灰度空间变化关系的灰度共生矩阵。二维直方图利用两个阈值ሺt,sሻ,如图所示,将二维直方图的区域划分为四个区域。其中,区域0和区域1代表的是背景或目标,区域2和区域3代表的是边界纹理、噪声点等信息。图3.6二维直方图区域划分29 在3.2节的病虫害图像分析中,可以知道,图像中病斑位置的灰度值特征与无病状位置的灰度值特征有着明显的差距,但是单一的灰度信息不能很好地确定图像中病斑的位置,同时容易出现区域误判情况。对此,本研究提出一种基于色度-灰度的二维直方图分割方法,在利用图像灰度信息的同时,充分考虑图像色度信息,确定病斑区域。将图像分别转换为HSI颜色空间提取色度值和灰度空间提取灰度值,将色度值分为K级,非绿色区域的色度值置于ሾt,Kെ1ሿ区间内,灰度值分为L级,统计图像中每个像素素色度值与灰度值组成的二元组ሺi,jሻ出现的频数。设P଴和ܲଵ分别表示区域0和区域1经阈值(t,s)分割后的分布概率,则两区域的分布概率用公式(3.2)和公式(3.3)表示为:Pൌ∑∑௧௦݌(3.2)଴௜ୀ଴௝ୀ଴௜௝Pൌ∑∑௄ିଵ௅ିଵ݌(3.3)ଵ௜ୀ௧ାଵ௝ୀ௦ାଵ௜௝定义区域0为背景区域,区域1为目标区域,则区域2和区域3为可忽略不计的噪声点和散乱点。此时表示为公式(3.4):P଴൅Pଵൎ1(3.4)因此,在二维直方图中,定义区域0和区域1的距离测度可以表示为公式(3.5):ߪ஻ሺt,sሻൌܲ଴ሺߤ଴െߤሻଶ൅ܲଵሺߤଵെߤሻଶ(3.5)其中,ߤ、ߤ为区域0和区域1内元素均值,ߤ为总体均值。求使ߪ最大时的ሺt∗,s∗ሻ,଴ଵ஻作为图像分割的阈值。如图3.7,以玉米灰斑病为例,将病虫害图像转换为图像灰度值和色度值组合的二维直方图,并把图像灰度值、色度值同设为256级,都为ሾ0,255ሿ,纵坐标为二元组ሺi,jሻ的联合概率密度ܲ௜௝。30 图3.7色度-灰度二维直方图如果图像使用二维直方图的OTSU方法利用公式(3.5)进行分割,其计算量呈指数增长。在任意的t和s处,都需要对ܲ଴、ܲଵ、ߤ଴、ߤଵ进行累加计算及6次乘除,导致对任意图像处理的时间复杂度为Oሺܰସሻ。在构建的色度-灰度二维直方图的分割问题中,本论文应用演化算法进行阈值寻优。在这里,本论文设计演化算法分割方法,结合一维及二维直方图目标与背景的测度方法,对直方图分割阈值t、s进行两次寻优。利用演化算法在进行阈值寻优的时候,比穷尽搜索实现阈值寻优快,并且最优解对应图像分割性能好且稳定。3.3.3编码设计及种群初始化(1)编码设计要对农作物病虫害图像的二维直方图进行阈值分割应用演化算法寻优,首要步骤就是要对图像阈值优化问题中,根据病虫害图像的特点对解集空间中潜在解进行基因编码。这一关键步骤也会在演化算法的执行过程中影响对问题的解的寻优效率、收敛速度等。在3.2节的分析中,我们可以利用通过统计分析数据得到的不同病虫害图像灰度、色度分布及特点,进行编码。在本问题中,采用二进制编码方式,将图像灰度值和色度值统一划分为256级,用8位二进制数进行编码,即从00000000到11111111,对应于病虫害图像灰度值和色度值的256级十进制数区间0至255。(2)种群初始化初始化的种群是最优阈值搜索的起点,根据病虫害图像的灰度及色度特征,我们给予图像灰度空间和色度空间不同的初始种群。对灰度图像和色度图像采取相同的策31 略,分别选取5个在实验中具有良好效果的经验值和5个采用随机生成在0至255之间的随机数值作为初始种群。3.3.4适应值函数设计演化算法是通过适应值评价产生个体的优劣程度,并以此为依据不断产生更优后代。适应值函数是计算种群个体适应值的函数,是直接影响算法搜索效率和算法收敛性的重要函数。因此,设计针对病虫害图像二维直方图阈值分割效果的适应值函数,对算法的有效性和收敛性有着至关重要的影响。适应值函数的设计,通常是通过对求解问题的进行建模计算目标函数,在通过一定的变换过程形成针对具体实际问题的适应值函数,反映群体中个体的优劣。设给定图像色度级为L,色度值分割阈值为t,灰度级为L,灰度值分割阈值为s。第一次寻优时假设sൌLെ1,即ܲଵൌ0,区域3的分布概率将不可忽略,则第一次寻优的距离测度表示为公式(3.6):ߪ஻,ଵሺݐሻൌܲ଴ሺߤ଴െߤሻଶ൅ܲଷሺߤଷെߤሻଶ(3.6)其中,ܲ为区域3的分布概率,ߤ为区域3内元素均值。求使ߪ最大时的t∗作为第ଷଷ஻,ଵ一次寻优的阈值。第二次寻优时,将tൌt∗代入公式(3.5)中,则为公式(3.7):ߪ஻,ଶሺsሻൌߪ஻ሺt∗,sሻൌܲ଴ሺߤ଴െߤሻଶ൅ܲଵሺߤଵെߤሻଶ(3.7)求使ߪ最大时的s∗作为第二次寻优的阈值。将两次寻优的结果ሺt∗,s∗ሻ作为最终஻,ଶ阈值。因此,式(3.6)和式(3.7)分别为本论文二次分割方法所采用的适应值函数。3.3.5遗传策略设计(1)选择选择是遗传操作的第一步,目的是为选择进行交叉、变异等操作的种群个体。通过选择操作,适应值排序更优的种群个体可以产生新一代的种群。为了在保证种群在繁殖过程中的多样性,同时兼顾算法收敛速度,本论文采用适应值比例选择和最优保存策略相结合的方法。具体设计为:首先按照种群个体的适应值比例分配法赋予每个个体选择概率,在进行交叉、变异操作后,将父代种群个体和子代种群个体分别按照适应值高低进行排序,对其中适应值最高的个体采取保存策略,以父代种群中的最优个体直接替换子代种群中的非最优个体,形成新的子代种群。这种集成的选择操作兼32 顾适应值比例选择对种群多样性的保证,同时可以通过保存最优个体以加快算法收敛速度和提高解的精度。算法中将演化计算过程分为初期、中期、末期三个阶段,对于不同时期,采取不同的最优保存策略。在演化计算初期,用上一代种群中最优个体(即适应值最大的个体),替换本代种群中适应值排序第五的个体,以此避免搜索结果局部收敛,扩大分割阈值的寻优区间;在演化计算中期,用上一代种群中最优个体,替换本代种群中适应值排序最后的个体,使得最优个体保存到下一代种群中,保证算法的收敛性;在演化计算末期,用上一代适应值排序前二的个体,替换本代种群中适应值排序后二的个体,以此使得算法在最优解邻域内快速收敛,提高寻优效率。(2)交叉交叉操作是产生新的种群个体的过程,通过父代种群个体的结构交换,产生出结构不同于父代的新个体,从而确保了种群在进化过程中的多样性。通过交叉操作,扩大了演化算法的搜索空间,使得算法具备强大的搜索能力。本论文采取单点交叉方法,具体步骤为:选定进行交叉操作的配对个体,在其二进制编码位串中设定一个交叉位,交叉位为配对个体发生交换重组的结构分界点,将两个个体编码位串的后面部分结构进行交换,形成新的种群个体。本论文采用随机函数生成随机数确定交叉点,并设定交叉概率为0.7。(3)变异变异是子代个体以小概率使个体编码结构发生变化的操作。这种小概率的结构变化本质是演化算法的局部随机搜索功能。通过这种局部搜索使得算法能够在保持种群繁殖多样性的同时防止出现算法过早收敛,出现非成熟解。在这里,本论文采用基本位变异,通过设定变异概率和变异位,改变子代个体的编码结构,对二进制编码中的变异基本位进行取反操作。在演化过程的初期和中期发生变异的基本位同样以随机数确定,在末期对个体映射的阈值T设定阈值波动区间为[T-A,T+A],变异基本位为第五位,即A=16,使得全局搜索与局部搜索更好地结合。本论文设定变异概率为0.3。3.3.6基于灰度导向图的提取效果优化为了让二值化分割结果能够有更加细腻的边缘纹理,本论文借鉴导向滤波思想(Zhengguoetal.,2015;Heetal.,2013),提出一种新的病斑提取权值计算方法,对图像分割得到的二值化矩阵进行滤波操作,通过计算转换为病斑区域提取的权值矩阵。33 导向滤波是一种在导向图的引导下对图像进行边缘保持的平滑滤波操作。定义p为待处理的输入图像,I为导向图,q为滤波操作后的输出图像。导向滤波是假定在一个以像素点k为中心的窗口ݓ௞中,q为导向图I的一个线性变换,用公式(3.8)表示为:ݍ௜ൌܽ௞ܫ௜൅ܾ௞,∀݅∈ݓ௞(3.8)其中系数ܽ௞和ܾ௞是窗口ݓ௞中的常量。本论文在病斑区域提取问题中,定义一个权值矩阵H,设D为原病虫害图像,J为病斑提取图像,则区域提取过程用公式(3.9)表达为:J௜ൌܪ௜ܦ௜,H୧∈ሾ0,1ሿ(3.9)灰度图像具有细腻的边缘纹理,因此这里将灰度图作为导向图I,引入导向滤波思想,定义图像分割结果的二值化矩阵为A,在一个以像素点k为中心的窗口ݓ௞中,把H转换为导向图I的一个线性变换,用公式(3.10)表示为:ܪ௜ൌܽ௞ܫ௜൅ܾ௞,∀݅∈ݓ௞(3.10)导向滤波需要系数ܽ௞和ܾ௞来使得输出图像q和输入图像p的差别最小化。同理,这里需要系数ܽ௞和ܾ௞来使得权值矩阵H与二值化矩阵A的差别最小。在窗口ݓ௞中,认为其代价函数为公式(3.11):Eሺܽ௞,ܾ௞ሻൌ∑௜∈௪ሺሺܽ௞ܫ௜൅ܾ௞െܣ௜ሻଶ൅ߝܽ௞ଶሻ(3.11)ೖ其中ε是一个正则化矩阵,用以防止a୩过大,保持滤波计算稳定。根据线性回归分析,a୩、b୩的最优解表达式可以表示为公式(3.12)和公式(3.13):భ|౭|∑೔∈ೖூ೔஺೔ିఓೖ஺ೖܽ௞ൌమ(3.12)ఙೖାఌܾ௞ൌܣ௞െߤ௞ܽ௞(3.13)其中σଶ和μ是灰度导向图I在窗口ݓ内的方差和均值,|w|为窗口ݓ中的元素个数。୩௞௞同时,A୩为窗口ݓ௞中所有元素的均值。由于元素i可以被多个窗口包含,而同时ܽ௞、ܾ௞取值因窗口中心k位置的改变而改变,所以需要计算以元素i为中心的窗口内ܽ௞、ܾ௞的平均值。最终权值矩阵H的引导滤波输出结果为公式(3.14):ଵܪ௜ൌ|୵|∑௜∈௪ೖሺܽ௞ܫ௜൅ܾ௞ሻൌܽ௜ܫ௜൅ܾ௜(3.14)34 ଵଵ其中,ܽ௜ൌ|୵|∑௞∈௪೔ܽ௞,ܾ௜ൌ|୵|∑௞∈௪೔ܾ௞。为了减少噪声点、散乱点的影响,这里设置一个系数θ,将权值矩阵转换为公式(3.15):0,H௜൏ߠH௜ൌ൜(3.15)H௜,H௜൒ߠ可以看出,权值矩阵H具有与灰度导向图I相似的细节纹理和边缘效果,同时具有与二值化矩阵A相似的特征。而且引导滤波具有快速的实现方法,只需要OሺNሻ的时间复杂度,是性能很好以及能够快速实现的滤波算法。3.4实验结果与分析3.4.1实验结果图3.8为本论文病斑提取算法的效果展示。图像测试集中为像素200×200的玉米病虫害图像,其中包括常见的大斑病、小斑病、灰斑病等主要病虫害。实验结果表明,病斑提取算法能够有效对病斑位置进行分割,误分点少,并且较完整地保留了原图像中病斑的颜色、边缘、纹理等特征。图3.8病斑提取效果展示35 图3.9为在权值矩阵计算中,设定不同的θ值对病斑区域提取效果的影响。实验表明,当θൌ0.1时,病斑提取区域保留细腻完整的边缘、纹理,但是包含着较多的散乱点。随着θ值的增加,散乱点逐渐减少,同时病斑边缘纹理也逐渐变得模糊、粗糙。因此,本节实验将θ值设定为0.2。(a)病虫害图像(b)ߠൌ0.1(c)ߠൌ0.2(d)(e)ߠൌ0.4(f)ߠൌ0.5(g)ߠൌ0.6(h)图3.9不同θ值对实验结果的影响3.4.2对比与分析图3.10为本论文算法与一维OTSU阈值分割方法、EM聚类分割算法的对比。实验结果表明,OTSU方法和EM算法在进行分割时存在着误判点,将非病斑位置误判为病斑进行提取,同时也存在将病斑位置误判为非病斑而去除。而本论文算法能够有效确定其中病斑位置,误判点少,并且进行具有细致纹理边缘的区域提取,与原图像的病斑区域保持良好的一致性。36 (a)病虫害原图像(b)OTSU算法效果(c)EM算法效果(d)本论文算法效果(f)病虫害原图像(g)OTSU算法效果(h)EM算法效果(i)本论文算法效果图3.10与OTSU算法、EM算法对比结果G-MRF算法(赖军臣,2010)和TSRG算法(李娇娇,2010)是以玉米病虫害为对象的病斑分割算法。图3.11为本论文病斑提取算法与G-MRF算法、TSRG算法的实验对比。实验结果表明,G-MRF算法虽然能够较完整地保留病斑的形状和纹理,但是容易受到其他散乱点影响,导致少量的误判点;而TSRG算法虽然能够避免其他非病斑区域散乱点的影响,但是其病斑区域不能很好地保留病斑原有的形状;本论文算法能够在保留原有病斑纹理边缘特征方面有突出表现,并且能够一定程度上避免散乱点的影响,具有较高的区域提取质量。37 (a)病虫害原图像(b)G-MRF算法效果(c)TSRG算法效果(d)本论文算法效果(e)病虫害原图像(f)G-MRF算法效果(g)TSRG算法效果(h)本论文算法效果图3.11与G-MRF算法、TSRG算法对比结果3.5本章小结本章主要阐述了病斑提取算法的技术路线和设计方案。本论文提出的病斑提取算法主要分为三个部分:二维直方图构建、分割阈值优化和病斑区域权值计算。本章首先对数据集中玉米病虫害图像进行图像分析,在灰度空间和色度空间两个方面对图像中全局和局部的统计数据特征进行分析,获取病斑位置与无病状位置的颜色、纹理等方面的差异,作为病虫害图像分割及病斑提取的主要依据。根据对病虫害图像的分析,将图像的灰度图像与HSI颜色空间的色度图像组成二元组构建二维直方图,以更好地描绘像素的分布情况,解决了一维直方图不能明显地区分目标和背景双峰分布的情况,同时改进了传统二维直方图应用在病虫害病斑提取领域的不足。对于二维直方图阈值优化问题,本论文设计基于演化算法的阈值优化过程,设计适合病虫害图像数据特征的染色体编码,并结合图像分析结果选择初始化种群,采用最优保存策略,提高寻优效率,同时通过设定波动阈值,在最佳阈值的波动领域范围内继续搜索,实现全局搜索与局部搜索相结合。对于二值分割的病斑提取结果,本论文引入了引导滤波算法的思想,利用灰度导向图进行引导计算,对图像分割结果进行滤波操作,计算权值矩阵,针对在分割后病斑边缘、纹理模糊和粗糙位置进行恢复,优化病斑提取结果,更好地保留病虫害图像病斑的边缘、纹理特征。38 最后,通过实验结果展示,说明病斑区域提取算法的有效性,并讨论权值矩阵参数设置对实验结果的影响。通过与传统OTSU算法、EM聚类算法的对比试验,说明本论文算法对农作物病虫害图像的适用性,同时通过与G-MRF算法、TSRG算法的对比试验,说明本论文算法在病斑区域提取效果方面的优越性。39 4基于演化算法及改进词袋模型的病虫害图像识别分类农作物病虫害的图像识别与分类最为关键的步骤是特征提取,农作物的病虫害的类别往往不止一种,不同的农作物病虫害往往具有不同的特征,直接的采用传统的、单一的特征提取算法(如颜色,纹理)来对农作物病虫害进行特征提取往往鲁棒性不高,当前农作物病虫害主流的特征提取算法都采用了多特征融合的特征提取算法,虽然多特征融合的特征提取算法的复杂度增加,但是识别分类的准确精度也得到很大的提高。本论文针对传统和单一的特征提取算法鲁棒性不足以及当前多特征融合的特征提取算法的复杂度高等的缺陷,结合第三章提出的演化算法,提出了应用于农作物病虫害图像进行识别分类的改进词袋模型分类算法,对农作物病虫害图像进行识别分类。首先针对第三章演化算法对病虫害区域进行提取,然后采用比传统词袋模型应用的SIFT特征性能要好而且能应对在农作物病虫害图像的多变尺度的密集SIFT特征描述符,并生成视觉词典,然后应用空间金字塔匹配原理对农作物病虫害图像生成的视觉词典进行直方图表示以提高分类匹配的准确度,最后为了提高匹配分类的效率,采用快捷有效的LIBSVM工具进行分类。4.1基于演化算法及改进词袋模型的优化方案4.1.1融合演化算法的改进词袋模型算法流程本论文将结合演化算法的改进词袋模型应用到农作物病虫害识别分类的流程主要有4个步骤:第一,对农作物病虫害图像进行基于演化算法的病斑区域提取;第二,对农作物病虫害区域提取的图像进行特征提取与特征描述符的转化;第三,对农作物病虫害图像提取的特征描述符进行视觉词典的构建;第四,对不同的病虫害进行识别分类。图4.1为应用于病虫害识别领域的改进词袋模型的主要流程。40 图4.1词袋模型改进方案根据图4.1,本论文在农作物病虫害应用改进词袋模型的实现过程如下:首先,本论文通过利用演化算法的自适应性以及处理病虫害图像的大规模复杂的数据的特性,对于多目标的多种不同的病虫害的区域进行提取。其次,本论文词袋模型在农作物病虫害特征提取的过程中采用了更具鲁棒性的Dense-SIFT算法代替传统的SIFT算法,使得对于提取出来的病虫害特征无论是角度不同,位置不同,还是大小不同,经过Dense-SIFT的特征提取后,形成农作物病虫害的特征描述符,在分类中依然可以比较好的分类效果。再次,在提出出来的农作物病虫害特征描述符中,本论文为了提高算法的智能性放弃使用手动指定聚类中心,而采用随机选取聚类中心的K-Means聚类方法,经过K-Means的算法迭代,当收敛时得到的聚类中心就是词袋模型的词典,并通过直方图进行表示。最后,为了提高农作物病虫害各种病虫害的分类效果,本论文采用空间金字塔匹配方案,对分层的农作物病虫害图像在高分辨率空间中提取特征以提高匹配分类的准41 确度。在分类的过程中,为了提高分类的效率,使用LIBSVM工具包进行识别分类。4.1.2Dense-SIFT特征提取算法及性能分析从第二章的传统词袋模型中的SIFT特征提取中可以知道,SIFT算法对于差分金字塔中提取的图像的关键点不足,对于农作物病虫害提取出来的小的病虫害图像特征以及纹理不足的农作物病虫害特征,如果是采用SIFT来提取特征,就会造成关键点以及信息的丢失或者不能够提取出在分类过程中所需要的最少关键特征点,这不仅会影响构建视觉词典以及直方图的准确性,也会使得在分类的过程中分类准确率大幅度的降低。因此本论文采用了密集尺度不变特征算法(Dense-SIFT)(Saleemetal.,2014;Liuetal.,2015),对由演化算法分割的农作物病虫害局部图像进行优化。Dense-SIFT算法的主要流程如图4.2:图4.2Dense-SIFT主要流程Dense-SIFT的采样方法一般是采用均匀采样的方法,先对图像进行网格划分,然后通过相同像素的滑动窗口进行逐个对网格抽取特征。先在滑动的窗口指定多尺度,然后在多种尺度下对农作物病虫害局部图像多次密集SIFT的特征提取。由于Dense-SIFT算法提取的特征点的个数与滑动窗口中移动的步长有关,如果滑动窗口的步长越大,则相对应的农作物病虫害图像的特征点就会越稀疏,如果步长越小,农作物病虫害图像的特征点就越密集。但也不是步长越小就越好,因为步长小了,特征点多了,使得算法的效率会急剧的下降,一般选取步长为8这个经验值得到的效果是比较好的。Dense-SIFT提取每个块的特征点可以表示为图4.3:42 图4.3Dense-SIFT特征采样图4.3表示本论文对农作物病虫害图像的Dense-SIFT算法,首先滑动窗口从图像的左上方根据选取的步长进行移动,一直移动到最后;然后,返回到下一行,继续重复从左到右的按照步长的移动方法;最后,重复步骤一直到达图像的右下角,并计算Dense-SIFT的描述符。要实现对Dense-SIFT描述符的计算,首先要构建尺度空间。利用高斯卷积核对图像I进行尺度变化,生成尺度空间图像L,如公式(4.1)表示。Lሺݕ,ݔሺܫ∗ሻߪ,ݕ,ݔሺܩൌሻߪ,ݕ,ݔሻሺ4.1ሻ其中ܩሺݕ,ݔ,ߪሻ为尺度可变高斯函数,如公式(4.2)所示。1௫మି୷మିమܩሺݕ,ݔ,ߪሻൌ݁ଶఙሺ4.2ሻ2ߨߪଶ在一幅尺度空间图像L中,每一个像素点的梯度大小和方向可以用公式(4.3)和(4.4)表示。mሺx,yሻൌඥሺܮሺݕ,ݔሺܮെሻ1൅ݕ,ݔሺܮሺ൅ଶሻሻݕ,1െݔሺܮെሻݕ,1൅ݔെ1ሻሻଶሺ4.3ሻܮሺݕ,1െݔሺܮെሻݕ,1൅ݔሻθሺx,yሻൌarctanቆቇሺ4.4ሻܮሺݕ,ݔሺܮെሻ1൅ݕ,ݔെ1ሻ将采样窗口内容所有像素点的梯度大小和方向都计算出来以后,用梯度直方图的43 方式统计窗口内每个子区域的梯度方向。梯度直方图的范围为ሾ0,2πሿ,每π/4统计为一个梯度方向,则每个子区域可用8个梯度方向进行表示。在采样窗口内设定4ൈ4的子区域,形成4ൈ4ൈ8的128维特征向量,如图4.4。图4.4特征点128维特征向量生成Dense-SIFT可以有效改善SIFT特征在提取特征点时丢失大量信息的问题,通过密集提取SIFT特征的方式,改善对病虫害图像病斑纹理等特征信息的描述。另外,Dense-SIFT以均匀采样的方法提取SIFT特征,不需要建立高斯差分金字塔及检测极值点,可以有效降低对特征运算的次数,提高计算效率。4.1.3空间金字塔匹配方案空间金字塔是由Lazebnik在2006年的CVPR中提出的(Lazebniketal.,2006),空间金字塔匹配方案的核心思想是对图像分层,对分层的每个网格都应用传统词袋模型,匹配算法的核心思想如图4.5所示,将提取出来的特征集映射到高分辨空间中,然后在高分辨率空间中进行匹配。这对于农作物不同的病虫害图像的识别分类具有极高的提升效果。44 图4.5空间金字塔匹配方案本论文对于农作物的病虫害图像应用空间金字塔匹配方案有2个核心步骤,分别是金字塔匹配核与空间金字塔在词袋模型下的匹配方案。在图像中,定义X和Y分别代表d维空间的特征向量集,然后对图像进行网格划分,划分好的网格从左到右从上到下,编号为0,1,2,…,L,然后定义变量l,使得l∈L,通过变量l对图像进行划分维数时得到2௟个子集,则在d维的特征空间中所有维数之和为Dൌ2ௗ௟。定义X向量集和Y向量集的直方图表示为H୶௟和H୷௟,H୶௟ሺiሻ和H୷௟ሺiሻ定义为X向量集和Y向量集落入到第i个子区域的点的个数。在l层中直方图交叉函数匹配的数量表示为公式(4.5):Γ൫H୶௟,H୷௟൯ൌ∑ୈ୧ୀଵminሺH୶௟ሺiሻ,H୷௟ሺiሻሻ(4.5)为了简化公式,将Γ൫H௟,H௟൯记录为Γ௟。在图像分割的网格中,当一共有l൅1层时,୶୷l层以及l൅1层的直方图交叉函数匹配的数量之差表示为Γ௟െΓ௟ାଵ,ሺ݈ൌ0,1,2,…,ܮെଵ1ሻ。定义l层的权值为,则金字塔匹配核的定义如公式(4.6):ଶైషభ45 ݇௅ሺܺ,ܻሻൌΓ௅൅∑௅ିଵଵሺΓ௟െΓ௟ାଵሻൌଵΓ଴൅∑௅ଵΓ௟(4.6)௟ୀ଴ଶಽష೗ଶಽ௟ୀଵଶಽష೗శభ空间金字塔在词袋模型下的匹配方案中,本论文先对农作物不同的病虫害图像特征进行K-Means聚类到视觉单词的各个类别中,然后将视觉单词使用直方图进行表示,这样可以最大减少匹配算法的计算量,提高算法的效率。本论文定义视觉单词的个数为M,最终核函数的总和定义为公式(4.7):݇௅ሺܺ,ܻሻൌ∑ெ௠ୀଵ݇௅ሺܺ௠,ܻ௠ሻ(4.7)然后将农作物病虫害图像划分为不同的层级,对于每个层级表示成视觉单词直方图,根据公式(4.6)计算视觉单词金字塔匹配核,然后根据公式(4.7)求出最终核函数的总和即视觉单词的总和。根据图4.5的level0可以看出,当Lൌ0时,就是标准没有优化过的词袋模型。4.2LIBSVM分类器与传统分类器在第二章中我们提到了词袋模型中常用最终的分类器,如SVM,Adaboost等。除此之外应用在农作物病图像分类以及词袋模型的分类器还有决策树,朴素贝叶斯,反向传播神经网络,随机森林等。但是这些分类器都具有一个缺点,复杂度太高,严重影响整个农作物病图像分类算法的效率,而且对于农作物病虫害图像分类的准确度还不够高。本论文采用LIBSVM工具对农作物病虫害图像使用改进词袋模型进行最后的分类,LIBSVM是由LinChih-Jen开发设计的一个简单、易于使用且快速有效的SVM模式识别和回归的软件包,LIBSVM所涉及的参数调节相对较少,提供了很多的默认参数,而且运行速度比较快,完全可以解决本论文的识别和分类问题。LIBSVM还是跨平台的,提供Windows、Linux等多个平台的应用。在使用的时候,相对于其他SVM,LIBSVM需要手工调节的参数比较少,只要使用默认的参数即可达到比较好的模式识别与线性回归的效果,在实际的应用中还提供了校验的应用功能。LIBSVM沿用SVM分类器的思想(Changetal.,2011),SVM的核心思想是寻找最优的分类面,对空间中不同的数据集进行分类。SVM可以描述为如下的最优化问题如公式(4.8):ଵ்௟min௪,௕,ఌଶݓݓ൅ܥ∑௜ୀଵߝ௜(4.8)约束条件为:ݕ,௡ܴ∈௜ݔ中其。݊,…,2,1ൌ݅,0൒௜ߝ,௜ߝെ1൒ሻܾ൅ሻ௜ݔሺ߶்ݓሺ௜ݕ∈46 ሼ1,െ1ሽ௟表示数据点所属的类别,w为与最优分类面垂直的向量,C为惩罚因子,ߝ为௜稀疏变量。使用LIBSVM软件包代替传统的SVM,不仅减少了代码量,而且在效率方面也提高了。4.3实验结果与分析4.3.1实验选取的农作物病虫害图像本论文实验采用大田非结构农作物病虫害图片,以玉米农作物叶部病害为实验对象,以玉米大斑病、小斑病、灰斑病、褐斑病、炭疽病等五类病虫害图像数据为图像识别与匹配分类的实验数据集。实验数据集统一规格化为像素200×200的图像,并且实验使用训练样本集图像为每类30幅,测试样本集图像为:大斑病22幅、小斑病26幅、灰斑病11幅、褐斑病14幅、炭疽病17幅。图4.6为部分实验数据集展示。图4.6部分实验数据集展示4.3.2实验设置本章实验都在台式计算机上运行,参数如下:操作系统:win8.1,64位,CPU:i7-3770,主频:3.4GHz,内存:8GB。实验结果为对每个实验重复进行10次所得结47 果取平均值。4.3.3结果与分析(1)Dense-SIFT及加入空间金字塔匹配词袋模型分类算法与传统词袋模型中的SIFT对比首先为了测试算法的有效性,本论文在Dense-SIFT与加入空间金字塔匹配的词袋模型分类算法与传统词袋模型中的SIFT对比中,首先选择具有明显区分度的玉米大斑病、小斑病、炭疽病这三种病虫害特征来验证,数据如表4.1:表4.1Dense-SIFT与传统词袋模型中的SIFT在简单类比中对比病虫害类型方法匹配分类准确率传统的词袋模型中SIFT算法85.90%大斑病本论文方法91.36%传统的词袋模型中SIFT算法83.46%小斑病本论文方法93.84%传统的词袋模型中SIFT算法86.25%炭疽病本论文方法92.50%从表4.1可以看出,由于这三种病虫害易于区分,Dense-SIFT与传统词袋模型算法中的SIFT的特征提取后进行分类都可以达到很好的分类效果,本论文算法在简单的分类中还可以达到93.84%的分类准确率,比经典的词袋模型算法还要高,证明本论文算法是有效可行。但是从表4.1不足以说明算法具有很好的鲁棒性,因此本论文还选取了玉米大斑病、小斑病、灰斑病、褐斑病、炭疽病五类病虫害进行试验的识别分类对比。表4.2中表示Dense-SIFT与传统词袋模型中的SIFT在比较复杂的五类图像中进行对比的数据。随着分类样本种类的增加,分类准确率通常都会有一定程度的下降。从表4.2中可以看出本论文方法总体的分类准确率比较高,而且比起传统的词袋模型具有明显的优越性,虽然在灰斑病、褐斑病分类的准确率还不够高,但是各类病虫害的分类准确率均比传统的词袋模型分类的准确率更高,因此算法是可行有效的。48 表4.2Dense-SIFT与传统词袋模型算法中的SIFT在复杂类比中对比病虫害类型方法匹配分类准确率传统的词袋模型中SIFT算法76.81%大斑病本论文方法89.09%传统的词袋模型中SIFT算法74.61%小斑病本论文方法88.46%传统的词袋模型中SIFT算法65.45%灰斑病本论文方法76.36%传统的词袋模型中SIFT算法60.71%褐斑病本论文方法72.85%传统的词袋模型中SIFT算法78.75%炭疽病本论文方法87.50%(2)LIBSVM分类器与传统词袋模型中的AdaBoost分类器对比本论文算法是采用高速有效的LIBSVM,经过重复10次的5类病虫害的总体分类,与在分类识别中具有很高的分类准确率的AdaBoost分类器进行对比实验。表4.3表示本论文LIBSVM分类器与采用词袋模型中的AdaBoost分类器对比。表4.3本论文方法在不同分类器下的对比分类器算法分类准确率时间AdaBoost75.00%140.97sLIBSVM82.85%128.64s从表4.3可以看出,本论文算法所采用的分类器在分类准确率和时间效率上都要比AdaBoost要表现更优,虽然AdaBoost在人脸识别的效果很好,但在词袋模型算法中效果没有LIBSVM的效果好。(3)演化算法融合改进词袋模型分类算法与其他病虫害识别分类算法对比本论文算法首先是通过演化算法的自适应性以及处理病虫害图像的阈值寻优时49 具有的智能性和并行性特性,对于多目标的多种不同的病虫害的区域进行提取,然后通过Dense-SIFT与空间金字塔匹配原理改进传统的词袋模型,最后通过有效的LIBSVM进行分类。除此之外,表4.4还选取了一些经典的病虫害分类算法对比,分别选取了经典的通过颜色特征来分类的算法,通过纹理特征来分类的算法,HOG特征来分类的算法,以及MVPL算法(王孟月等,2012)的来对比。表4.4本论文方法与其他方法的对比比较的算法分类准确率颜色特征62.14%纹理特征65.02%HOG特征74.58%MVPL76.42%本论文方法82.85%表4.4是本论文与最近几年一些学者的研究的改进算法的比较,可以看出,本论文算法在分类的准确性和精度上都具有优越性。从比较的算法中可以看出,单纯的单一特征(无论是颜色还是纹理)的识别匹配算法分类效果普遍比较差,尽管HOG算法在一些应用场景的效果不错,但是在农作物病虫害的识别分类效果也不理想,本论文算法针对农作物病虫害的识别分类效果具有比以上提到的算法都具有优越性,鲁棒性也得到提高。4.4本章小结本章主要介绍了基于演化算法及词袋模型的病虫害图像分类识别技术的设计方案。主要步骤是:第一,对病虫害图像进行病斑提取;第二,采用Dense-SIFT算法对病斑图像特征进行采样提取;第三,通过K-Means聚类,将提取的图像特征聚类成视觉词典;第四,在单词与词典的匹配环节,采用金字塔匹配方案,提高分类识别效率;第五,用LIB-SVM代替传统的SVM分类器,减少代码量,调高效率。通过实验证明,本论文提出的算法在病虫害图像分类识别领域具有优越性,能够针对病虫害图像进行有效的分类识别。50 5总结与展望5.1总结农作物病虫害会造成农作物产量减少和品质下降,另外因农户盲目施药也会产生一系列如农药残留超标、植被土壤破坏的问题。本论文研究集中于利用机器视觉技术检测和识别农作物病虫害,提供准确、可靠的病虫害诊断及防治意见,以达到合理施药,提质增产的目的。当前提出的病斑区域分割的有效算法并不多,而病斑分割和区域提取是病虫害分类识别技术中的重点、难点,有效的分割、提取算法可以增加病虫害分类识别的效率和准确率。对此,本论文研究基于机器视觉的病虫害图像分类识别技术,提出了一种基于演化算法的病斑区域提取算法,融合改进词袋模型图像识别算法模型,设计分类识别方案,并以玉米作物为对象将其应用于农作物病虫害分类识别领域。总结本论文研究工作主要有以下几个方面:(1)对数据集中玉米病虫害图像进行图像分析,在灰度空间和色度空间两个方面对图像中全局和局部的统计数据特征进行分析,获取病斑位置与无病状位置的颜色、纹理等方面的差异,作为病虫害图像分割及病斑提取的主要依据。(2)结合农作物病虫害图像的灰度、色度二维信息,设计直方图二次分割方法。结合对玉米病虫害图像的分析,充分考虑病虫害病斑的颜色、纹理等特征,将图像的灰度与色度组成二元组构建二维直方图,更好地描绘像素的分布情况,解决了一维直方图不能明显地区分目标和背景双峰分布的情况,同时改进了传统二维直方图应用在病虫害病斑提取领域的不足。(3)运用了基于演化算法的阈值分割,利用最大类间方差法自动确定阈值,设计适合病虫害图像数据特征的染色体编码,并结合图像分析结果选择初始化种群,提高寻优效率,同时通过设定波动阈值,在最佳阈值的波动领域范围内继续搜索,实现全局搜索与局部搜索相结合。(4)借鉴引导滤波算法的思想,利用灰度导向图进行引导,实现病斑区域边缘、纹理恢复。对图像分割结果进行滤波操作,设置权系数矩阵,针对在分割后病斑边缘、纹理模糊和粗糙位置进行恢复,优化病斑提取结果,更好地保留病虫害图像病斑的边缘、纹理特征。(5)通过实验说明,病斑提取算法能够有效确定玉米病虫害图像中病斑位置,提取出具有细腻边缘和纹理的病斑。通过与基于阈值的OTSU算法、基于聚类的EM算51 法、G-MRF算法、SRG算法进行对比实验,证明本论文病斑提取算法的有效性和优越性。(6)改进传统词袋模型,使其适用于病虫害图像分类识别领域。通过对基于传统词袋模型分类技术各个算法模块的研究,融合病斑提取算法,设计应用于农作物病虫害识别的改进词袋模型识别算法方案,对农作物病虫害图像进行演化算法的区域提取,并采用Dense-SIFT进行均匀采样的特征提取,对提取的图像特征使用空间金字塔匹配方案映射到高分辨率空间中进行匹配,最后使用LIB-SVM对数据集进行分类。(7)通过实验说明,本论文设计的应用于农作物病虫害识别的改进词袋模型算法方案,优化各个模块中对病虫害图像的识别性能,能够更加关注病虫害图像中病斑位置的特征,改进算法方案比传统词袋模型算法更加适合于图像病虫害识别领域,取得满意的结果。5.2展望大田农作物病虫害具有数目繁多的类别、复杂多样的病害症状,这使得大田农作物病虫害的分类识别更加困难。本论文算法主要以玉米农作物为实验对象,研究针对多种类别玉米病虫害图像的分类识别技术,具有十分重要的现实意义。在未来的研究中,将针对不同农作物的多种病种研究分类识别算法,着重关注叶部病虫害发生部分相同、症状也极其相似的病虫害类别,将图像分类识别技术在农作物病虫害诊断防治领域中推广。另外,实现类人高智能的农作物病虫害监测分类识别系统,将有效解决目前农作物病害分类识别领域存在的困难问题。因此,在未来的研究方向中,将融入主动视觉注意机制,设计面向农作物病虫害分类识别领域的感兴趣区域提取模型和显著目标检测模型。52 致谢时间如白驹过隙,晃眼七年,当年踏入华南农业大学的百年校庆之景依然历历在目。十分庆幸能够在三年前获得华南农业大学推荐免试硕士生资格,在这里度过我的七年本硕学术生涯:教一的朗朗书声开启我充满激情的一天,教三的铃声规划着我每日的学习计划,教四的钟楼记录着我每刻的学习,图书馆的大门引领着我进入知识的殿⋯⋯今日硕士学位毕业论文的完成正是为我打开了另一扇探究学问的门,当年懵懂的本科大学生现在已即将成为步入社会的硕士毕业生。路漫漫其修远兮,我会将“修德、博学、求实、创新”这八字校训刻入心中,继续探索前行。感谢导师李康顺教授在我硕士生阶段给予我的悉心教导。李老师渊博的学识,严谨细致的科研态度深深影响着我硕士三年的学习。李老师耐心指导我在学术科研方面的学习,为我规划三年的学习计划,因材施教,考虑他每个研究生的特点制定适合个人特点的培养方案,让我学有所长、学有所用。李老师与学生亦师亦友,在平常的生活中关心我,时常一同打乒乓球强身健体,同时也在交流中让我学到许多为人处世的道理。李老师虽然教学科研工作任务繁重,但是他仍然不厌其烦的对我耐心指导,指引我进行毕业设计和论文撰写。从毕业论文的起稿到最终撰写完毕,李老师始终给予我充分的信任,在此我对李老师表示最衷心的感谢!感谢张明武老师、黄琼老师、常珊老师对我生活和学习的关心和指导。感谢张明武老师把我带入了硕士研究生生涯,指明我在研究生阶段的学习目标,关心我的学习和生活状况。感谢黄琼老师在我研究生入学阶段的培养,指引我学习信息安全领域的知识,给予我许多学术上的帮助,黄琼老师年轻有为,更是我学习的榜样和目标。感谢本科班主任常珊老师一直以来的关心和教导,时刻关心我的学习与生活,在谈话交流中为我学术、生活、工作等各方面提出建议、给予帮助。感谢数学与信息学院辅导员詹瑾妮老师、戴文浪老师、顾美霞老师对我的关心、指导和帮助。辅导员老师们妥善安排教务工作,耐心指导学生工作,鼓励学生积极上进,在学习、就业处处关心着我。感谢数学与信息学院632实验室一起学习、生活的同门。感谢陈琰师姐、杨磊师兄、张丽霞师姐、李伟师兄、熊璐师姐,为我们实验室提供了强有力的支撑,妥善地安排实验室各项事务,以丰富的知识和学术经验为实验室同门提供帮助。感谢张楚湖53 师兄、谭岳峰师兄、黎燊师兄、邓晓阳师兄、王法杰师兄、程海丹师姐,与师兄师姐们的交流学习,丰富了我的学识,充实了我的生活。感谢与我同级的伙伴王福滨和左磊,我们一同学习、生活,共同解决遇到的问题,论学术、悟道理、共进退。感谢钟亮师弟、严英鹏师弟、杨舒玲师妹、陈卫广师弟、郭露妍师妹,为实验室增添了不少乐趣,创造了融洽的氛围。感谢小黑屋工作组成员徐登建、林晓阳、杨瑩在我研究生阶段给予我帮助。感谢他们在背后支持着我,帮助我结决生活、就业方面的困难,一直给予我精神上的支持,共同创造了求实创新的学术氛围,浓厚的学习气氛让我积极地探索和汲取知识。感谢舍友余联昌、陈嘉峰与我一同生活了三年。感谢他们营造了互帮互助的和谐氛围,让宿舍生活井井有条,宿舍成员团结友爱。感谢养育我、为我的健康成长付出无数汗水和心血的父母。感谢他们一直以来给予我的爱心、耐心、鼓励和支持,让我积极乐观、奋发向上。54 参考文献曹连连.基于信息论的加权Laplacian分类器设计[D].南京航空航天大学,2012.陈兵旗,郭学梅,李晓华.基于图像处理的小麦病害诊断算法[J].农业机械学报,2009,40(12):190-195.陈汗青,万艳玲,王国刚.数字图像处理技术研究进展[J].工业控制计算机,2013,26(1):72-74.陈慧楠.玉米、黄瓜叶部病害的图像处理技术研究[D].沈阳理工大学,2008.郭敏杰.基于空间金字塔模型的图像分类方法研究[D].江西理工大学,2014.郭庆,姜宇鸣.形状特征在多媒体图像检索中的应用研究[J].Superence,2011(3).韩览山,邵贝恩.KDD中的特征选择[J].计算机工程与应用,2002,38(22):217-219.何姗,郭宝龙,洪俊标.基于兴趣点颜色形状特征的图像检索方法[J].微电子学与计算机,2006,23(3):40-42.赖军臣.基于病症图像的玉米病害智能诊断研究[D].石河子大学,2010.李娇娇.玉米叶部病斑图像智能处理算法的研究与实现[D].北京邮电大学,2010.李艳领.现阶段农业病虫害防治现状与建议探讨[J].城市建设理论研究:电子版,2015(21).梁义涛,庞蕊,朱远坤.灰度图像二维Otsu折线阈值分割法[J].计算机工程与应用,2012,48(33):178-182.梁子安,刘飞,赵秋红,等.数学形态学在昆虫总科阶元分类学上的应用研究[J].ZoologicalSystematics,2007,32(1):147-152.罗勇,叶正源,陈远知.高效并行递归高斯SIFT算法的实现[J].中国科技论文,2015(20):2382-2385.马静.空间目标特征提取及识别技术[D].西安电子科技大学,2010.邱道尹,张红涛,刘新宇,等.基于机器视觉的大田害虫检测系统[J].农业机械学报,2007,38(1):120-122.孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008,19(1):48-61.孙君顶.基于内容的图像检索技术研究[D].西安电子科技大学,2005.汪京京,张武,刘连忠,等.农作物病虫害图像识别技术的研究综述[J].计算机工程与科学,2014,36(7):1363-1370.王剑,周国民.基于神经网络的水稻三化螟识别系统的研究[J].农业网络信息,2006(2):39-41.55 王克如.基于图像识别的作物病虫草害诊断研究[D].中国农业科学院,2005.王孟月,宋彦,戴礼荣.一种用于图像分类的多视觉短语学习方法[J].小型微型计算机系统,2012,33(2):298-302.王瑶.图像分割中关键技术的研究[D].江南大学,2008.吴丽娜.基于词袋模型的图像分类算法研究[D].北京交通大学,2013.谢毓湘,吴玲达,张宪海,等.聚类算法在基于内容图象检索中的应用研究[J].计算机应用研究,2000,17(9):19-20.徐琨,李燕.基于分块颜色矩和纹理特征的图像检索方法[J].西安石油大学学报:自然科学版,2005,20(2):77-79.杨红菊,张艳,曹付元.一种基于颜色矩和多尺度纹理特征的彩色图像检索方法[J].计算机科学,2009,36(9):274-277.杨俊红,刘传领.数字图像处理中的颜色空间及其转换研究[J].商丘职业技术学院学报,2009,8(2):25-27.杨晓敏,严斌宇,王潘,等.一种基于视觉显著度词袋模型的图像分类方法[J].数字技术与应用,2014(7):77-79.余旺盛,田孝华,侯志强.基于区域边缘统计的图像特征描述新方法[J].计算机学报,2014,37(6):1398-1410.宗华丽.基于图像特征的玉米叶部病害模糊识别研究与应用[D].北京邮电大学,2010.邹修国.基于计算机视觉的农作物病虫害识别研究现状[J].计算机系统应用,2011,20(6):238-242.ChangCC,LinCJ.LIBSVM:Alibraryforsupportvectormachines[J].AcmTransactionsonIntelligentSystems&Technology,2011,2(3):389-396.GuoW,AlhamNK,LiuY,etal..AResourceAwareMapReduceBasedParallelSVMforLargeScaleImageClassifications[J].NeuralProcessingLetters,2015:1-24.HeK,SunJ,TangX.GuidedImageFiltering[J].PatternAnalysis&MachineIntelligenceIEEETransactionson,2013,35(6):1397-1409.Kavetha.M.J.CoevolutionEvolutionaryAlgorithm:ASurvey[J].InternationalJournalofAdvancedResearchinComputerScience,2013,04(04).KeagyPM,SchatzkiTF.Machinerecognitionofweevildamageinwheatradiographs.[J].ProceedingsofSpie-TheInternationalSocietyforOpticalEngineering,1993,70(6):108-119.56 KunttuI,LepistoL,RauhamaaJ,etal..MultiscaleFourierdescriptorforshapeclassification:ImageAnalysisandProcessing,2003.Proceedings.12thInternationalConferenceon,2003[C].LazebnikS,SchmidC,PonceJ.BeyondBagsofFeatures:SpatialPyramidMatchingforRecognizingNaturalSceneCategories:IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition,2006[C].LiFF,PeronaP.ABayesianHierarchicalModelforLearningNaturalSceneCategories:IEEEComputerSocietyConferenceonComputerVision&PatternRecognition,2005[C].LiuJ,WangHW,XieCS,etal..DigitalWatermarkingAlgorithmforColorImageUsingSIFTImageCorrection.[J].JournalofChineseComputerSystems,2009.LiuYM,DaiLJ.AnimprovedmethodofK-meansimagesegmentationbasedonspatialpositioninformation[J].CaaiTransactionsonIntelligentSystems,2010.LiuY,LiuS,WangZ.Multi-focusimagefusionwithdenseSIFT[J].InformationFusion,2015,23(C):139-155.MarszaekM,SchmidC.SpatialWeightingforBag-of-Features:ComputerVisionandPatternRecognition,2006IEEEComputerSocietyConferenceon,2006[C].RidgwayC,DaviesR,ChambersJ.ImagingfortheHigh-SpeedDetectionofPestInsectsandOtherContaminantsinCerealGraininTransit:2001Sacramento,CAJuly29-August1,2001,2001[C].SaleemS,HollausF,SablatnigR.RecognitionofdegradedancientcharactersbasedondenseSIFT:ProceedingsoftheFirstInternationalConferenceonDigitalAccesstoTextualCulturalHeritage,2014[C].SmithJR,ChangSF.Automatedbinarytexturefeaturesetsforimageretrieval:Acoustics,Speech,&SignalProcessing,onConference,IEEEInternationalConference,1996[C].TangH.ComparisonofanActiveBasisModelandanAdaboostModelinImageRepresentation[J].AmericanSocietyofCivilEngineers,2014:1-8.WadaN,KanekoSI,TakeguchiT.Usingcolorreachhistogramforobjectsearchincolourand/ordepthscene[J].PatternRecognition,2006,39(5):881-888.YeomS.FacedetectionatadistancewithAdaBoostfilteringandcolor-shapeinformation:SocietyofPhoto-OpticalInstrumentationEngineers(SPIE)ConferenceSeries,2013[C].ZayasIY,FlinnPW.Detectionofinsectsinbulkwheatsampleswithmachinevision[J].Transactions57 oftheAsae,1998,41(3):883-888.ZhangJ,ZhanZH,LinY,etal..EvolutionaryComputationMeetsMachineLearning:ASurvey[J].IeeeComputationalIntelligenceMagazine,2011,6(4):68-75.ZhenL,HouqiangL,LiyanZ,etal..Cross-indexingofbinarySIFTcodesforlarge-scaleimagesearch.[J].IEEETransactionsonImageProcessingAPublicationoftheIEEESignalProcessingSociety,2014,23(5):2047-2057.ZhengguoL,JinghongZ,ZijianZ,etal..Weightedguidedimagefiltering.[J].IEEETransactionsonImageProcessingAPublicationoftheIEEESignalProcessingSociety,2015,24(1):120-129.58 附录硕士研究生阶段所发表论文:[1]KangshunLi,ZhichaoWen,ZhaopengWang,ShenLi.OptimizedPlacementofWirelessSensorNetworksbyEvolutionaryAlgorithm.InternationalJournalofComputationalScienceandEngineering(IJCSE,EI期刊,已录用)硕士研究生阶段所参与的项目:[1]广东省自然科学基金项目“基于主动视觉注意机制的农作物病虫害分类识别技术研究”硕士研究生阶段所获得的奖励:[1]2014年12月获华南农业大学优秀硕士研究生二等奖学金;[2]2015年1月被评为院级“优秀研究生干部”;[3]2015年6月被授予院级“学生工作先进个人”;[4]2015年11月获华南农业大学优秀硕士研究生二等奖学金;[5]2016年5月获华南农业大学优秀硕士研究生一等奖学金;[6]2016年5月获华南农业大学优秀毕业研究生。59

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭