基于深度学习的葡萄叶片病害识别方法研究

基于深度学习的葡萄叶片病害识别方法研究

ID:76136604

大小:3.18 MB

页数:73页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于深度学习的葡萄叶片病害识别方法研究_第1页
基于深度学习的葡萄叶片病害识别方法研究_第2页
基于深度学习的葡萄叶片病害识别方法研究_第3页
基于深度学习的葡萄叶片病害识别方法研究_第4页
基于深度学习的葡萄叶片病害识别方法研究_第5页
基于深度学习的葡萄叶片病害识别方法研究_第6页
基于深度学习的葡萄叶片病害识别方法研究_第7页
基于深度学习的葡萄叶片病害识别方法研究_第8页
基于深度学习的葡萄叶片病害识别方法研究_第9页
基于深度学习的葡萄叶片病害识别方法研究_第10页
资源描述:

《基于深度学习的葡萄叶片病害识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

分类号密级UDC单位代码10733甘肃农业大学硕士学位论文基于深度学习的葡萄叶片病害识别方法研究ResearchonMethodsforGrapeleafDiseaseRecognitionbasedonDeepLearning刘媛指导教师姓名冯全教授(甘肃农业大学兰州730070)学科专业名称农业电气化与自动化研究方向图像处理论文答辩日期2018年5月20日学位授予日期2018年6月答辩委员会主席党建武教授评阅人胡晓辉教授刘成忠副教授2018年6月 甘肃农业大学2018届硕士学位论文摘要中国葡萄酒产业发展迅猛,葡萄酒产量和销售量稳步增长。酿酒和鲜食葡萄的大规模、高密度和集群化种植模式给传染性病害的防治带来极大挑战。传统的侵染性试验或依靠经验诊断病害的方法,周期长、主观性强,且盲目喷洒农药,易造成农药残留和病虫抗药性问题。随着技术进步,人工智能、计算机视觉和图像处理技术被越来越多地应用在农业领域,特别在作物病害识别领域。葡萄植株染病时,生理结构和形态特征均会发生变化,如形变、褪色、腐烂等,故将葡萄叶片病害图像作为对象,利用计算机视觉技术和深度神经网络进行病害种类识别的研究,对农产品质量提升和农业生态环境安全具有重要意义。本文针对自然光照下葡萄叶片6种常见病害的识别和诊断方法进行研究,主要包括以下内容:(1)对采集的葡萄病害叶片图像进行数据增强处理,在不改变研究对象的属性和类别的前提下,采用镜像翻转、随机裁剪、添加颜色扰动和噪声等方法增加额外副本拓充样本数量,解决数据集样本数量不足的问题,并根据不同识别方法制作A、B、C三类数据集。(2)葡萄病害的半自动识别:从包含复杂背景的叶片原图中手动截取病斑的外界矩形区域作为实验样本。首先根据6种葡萄病害在颜色、纹理等方面差异提取28种特征,通过特征筛选出20种特征,经过PCA降维实现样本有效特征化,分别测试22种传统分类器,根据各种特征对预测结果的贡献率筛选5种特征用于识别。实验结果表明,传统分类识别方法中的BaggedTrees对基于色度的彩色纹理特征的葡萄病害图像有很好的识别效果,6种病害的平均识别精度为86.67%,尤其对于白粉病具有较高的识别率和鲁棒性,识别率为92.94%。(3)葡萄病害的全自动识别:对于包含复杂背景完整染病叶片样本,本文使用FasterR-CNN模型先检测图像中的叶片,在检出的叶片区域再进行病斑检测,根据用外接矩形框出叶片上病斑区域,最后将该矩形图像送入CNNs进行病害类型识别。检测病斑时仍采用FasterR-CNN。本文的这种策略可以有效避免复杂背景因素和无效区域干扰造成的误检测与误识别。本文对传统机器视觉分类模型中的BaggedTrees进行了测试,与前文中人工截取病斑样本的识别方法作对I 甘肃农业大学2018届硕士学位论文比。此外,为了在多种卷积神经网络中选择最优的网络,本文测试了AlexNet、VGG-16、VGG-19、GoogLeNet、ResNet50等网络。实验结果表明,传统分类技术在包含复杂背景的病斑样本进行分类时,性能出现显著下降,正确识别率为73.99%。在5种被测的网络模型中,VGG-16表现出卓越的识别性能,对6种葡萄病害的正确识别率为94.48%。该方法对炭疽病、灰霉病、褐斑病、白粉病、黑痘病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率达99.62%。关键词:葡萄病害;识别;深度学习;FasterR-CNN;VGG-16II 甘肃农业大学2018届硕士学位论文SummaryWiththerapiddevelopmentofChinesewineindustry,theproductionandsalesvolumeofwinearesteadygrowing.Theplantingpatternsofwinegrapeandtable-grapearethelarge-scale,high-densityandclusteredwhichhavebroughtgreatchallengestothepreventionandtreatmentofinfectiousdiseases.Inthepast,peoplediagnoseddiseasesviatheinfectiontestortheirexperiencetoobservethecharacteristicsofdisease,butittakeslongcycleandsubjectively.Itiseasytocausepesticideresiduesanddiseaseresistanceduetosprayingpesticidesblindly.Withtheadvancementoftechnology,artificialintelligence,computervisionandimageprocessingtechnologyareincreasinglyusedinagriculture,especiallyinthefieldofcropdiseaseidentification.Whengrapeplantsinfected,thephysiologicalstructureandmorphologicalcharacteristicswillchange,suchasdeformation,fading,decayandsoon,sotheimageofgrapeleafdiseasecanbeusedastheobject.Itissignificancethatidentifydiseasespecieswiththeimagesofinfectedgrapeleavesbasedoncomputervisiontechnologyanddeepneuralnetworkforthequalityofagriculturalproductsandagriculturalecologicalenvironmentsecurity.Thispaperoutlinestheclassificationmethodsof6kindsofcommondiseasesingrapeleavesundernaturalillumination,includingthefollowingcontents:(1)Thecollectedgrapeleafimageswereenhancedwithoutchangingthepropertiesandcategoriesoftheresearchobject,usingthemethodsofmirrorflipping,croppingrandomly,addingcolordisturbanceandnoisetoincreasethenumberofadditionalcopiesinordertosolvetheproblemofinadequatesamples.3kindsofdatasetsweremadeaccordingtodifferentrecognitionmethodsthatareDatasetA,DatasetBandDatasetC.(2)Semi-automaticidentificationmethodofgrapediseases:Theexperimentalsamplesweretheinterceptedrectangularregionofdiseasedspotswhichweretakenfromoriginalleafimagecontainingthecomplexbackgroundmanually.Firstly,28kindsofcharacteristicswereextractedaccordingtothedifferencesof6kindsofgrapediseasesincolorandtexture,and20featureswereselectedthroughfeaturescreening.III 甘肃农业大学2018届硕士学位论文TheeffectivefeatureofthesampleswasrealizedbyPCA(PrincipalComponentAnalysis),and22traditionalclassifiersweretestedrespectively.Then5kindsoffeatureswereusedtoclassificationaccordingtothecontributionrateofpredictionresults.Inaddition,inordertostudytheeffectofthedeeplearningmethodonthespotarea.TheexperimentalresultsshowthattheBaggedTreesinthetraditionalclassificationmethodhasbetterrecognitioneffectonthegrapediseaseimagebasedoncolorandtexturefeature,andtheaveragerecognitionaccuracyof6diseasesis86.67%.Thismethodshowedhighrecognitionrateandrobustnessespeciallyforpowderymildew,andtherecognitionrateis92.94%.(3)Automaticidentificationofgrapediseases:ThefasterR-CNNmodelwasusedinthispapertodetecttheleafareaintheimagesthatarecompletediseasedleafsamplescontainingcomplexbackgrounds.Thediseasespotsaredetectedinthepreviousdetectedleafarea,thenoutliningtheleafareawiththeouterrectangularframes,andtherectangularimagesarefinallyusedtoidentifythediseasetypebyCNNs.FasterR-CNNisstillusedtodetectdiseasespots.Thisstrategycaneffectivelyavoidtheerrordetectionandfalserecognitioncausedbycomplexbackgroundfactorsandineffectiveregionaldisturbances.Inthispaper,theBaggedTreesofthetraditionalmachinevisionclassificationmodelsistestedandcomparedwiththeidentificationmethodoftheartificialinterceptionofthediseasespotsamplesinthepreviouspaper.Inaddition,inordertoselecttheoptimalnetworkinavarietyofconvolutionneuralnetworks,thispaperteststheAlexNet,VGG-16,VGG-19,GoogLeNet,ResNet50networks.Theexperimentalresultsshowthattheclassificationperformanceofthesampleswithcomplexbackgroundisnotsignificantlyimprovedbythetraditionalclassificationtechnique,andthecorrectrecognitionrateis73.99%.In5kindsofnetworkmodels,VGG-16showedexcellentrecognitionperformance,andthecorrectrecognitionrateof6kindsofgrapediseaseswas94.48%.Themethodhasbetterrecognitioneffectonanthracnose,Botrytiscinerea,brownspot,powderymildewandblackpox,andthecorrectrecognitionrateishigherthan90%,amongwhichtheidentificationrateofpowderymildewisupto99.62%.Keywords:grapedisease;identification;deeplearning;FasterR-CNN;VGG-16modelIV 甘肃农业大学2018届硕士学位论文目录摘要........................................................................................................................ISummry................................................................................................................III第一章绪论..........................................................................................................11.1论文研究背景与意义.....................................................................................11.2国内外相关领域研究现状.............................................................................21.3论文内容与结构.............................................................................................5第二章图像识别与机器视觉技术理论基础......................................................72.1传统机器学习概述.........................................................................................72.1.1决策树(DecisionTree)...................................................................82.1.2K-近邻分类器(KNN)......................................................................82.1.3支持向量机(SVM).........................................................................92.1.4集成学习............................................................................................112.2深度学习概述...............................................................................................122.2.1AlexNet...............................................................................................152.2.2VGGNet..............................................................................................152.2.3GoogLeNet..........................................................................................172.2.4ResNet.................................................................................................172.2.5FasterR-CNN.....................................................................................19第三章材料与数据集制作................................................................................213.1研究对象的主要病害类别...........................................................................213.2图像采集设备...............................................................................................223.3图像采集过程...............................................................................................243.4数据集的制作...............................................................................................26第四章基于传统分类方法的葡萄叶片病害半自动识别方法........................294.1颜色特征的提取...........................................................................................304.2纹理特征的提取...........................................................................................334.3实验结果与分析...........................................................................................34第五章葡萄叶片病害的全自动识别方法........................................................375.1方法一:基于FasterR-CNN检测的病害识别方法..................................37-1- 甘肃农业大学2018届硕士学位论文5.1.1FasterR-CNN全图检测....................................................................385.1.2两种分类策略....................................................................................395.2方法二:基于Faster-RCNN+BaggedTrees的病害识别..........................415.3方法三:基于深度学习模型的病害识别方法...........................................425.3.1混淆矩阵............................................................................................46第六章总结与展望............................................................................................516.1总结...............................................................................................................516.2展望...............................................................................................................53致谢......................................................................................................................54参考文献..............................................................................................................56导师简介..............................................................................................................56作者简介..............................................................................................................65-2- 甘肃农业大学2018届硕士学位论文第一章绪论1.1论文研究背景与意义中国人口众多,经济发展迅猛,人民生活水平和生活质量显著提升,生活和消费观念不断改善的同时,日常饮酒习惯也随之发生了改变,葡萄酒逐渐取代了白酒成为节庆活动首选,葡萄酒在酒类市场中占有率也大幅提高。在过去的几年里,国内外葡萄酒市场增长势头强劲,我国的葡萄酒产业发展迅猛。2017年,国际葡萄与葡萄酒组织(InternationalOrganisationofVineandWine,OIV)公布2的一组数据中,世界葡萄总种植面积约为760万hm,当年全球葡萄酒总产量预计为246.7亿升,中国逐渐成为世界上葡萄酒生产和消费大国。据国家统计局发9布的最新数据显示,截止到2016年底,我国葡萄酒总产量达1.137×10升,20179年跃升至11.4×10升,同比增长23.8%,葡萄酒产量排名世界第七位。葡萄酒消费量稳步持续增长,逐渐成为国民生活支出的重要组成部分,葡萄酒消费和生产业作为新兴经济体展现出巨大的潜力,葡萄酒的生产也逐渐趋于优质化、高端化。近年来,巨大的葡萄酒消费刺激葡萄酒产业兴旺的同时,也带动了葡萄种植业的蓬勃发展。2013年起我国的酿酒葡萄种植面积迅速增加,2014年中国的葡萄种植面积已达79.9万公顷(197万平方英亩),仅次于西班牙(102万公顷),[1]成为全球第二大葡萄种植国,中国种植的葡萄主要用于酿酒和鲜食,其中主要集中在西北地区。生产优质的葡萄酒不仅需要精湛的酿酒技术和工艺,更重要的是原材料的质量,即用于酿酒的葡萄品质,因此,优质无污染的葡萄果实是酿制高品质葡萄酒的前提。在葡萄种植过程中,容易受到天气,环境,微生物,病毒和细菌等影响而产生各种病害,如白粉病、霜霉病、炭疽病、灰霉病、褐斑病和黑痘病等,这些病症多发生在植株叶片部位,严重时会影响植株的光合作用,造成作物产量和品质下降,给果农造成重大经济损失。因此,对葡萄植株叶部病害种类进行快速准确的判定,及时对病害进行防治是提升作物的产量和质量的基础。葡萄酒产业蒸蒸日上的同时,我国的酿酒葡萄种植面积迅速增加,葡萄种植模式趋于规模大,高密度,集群化,给传染性病害的防治带来极大的挑战。过去,1 甘肃农业大学2018届硕士学位论文果农们发现和判断病害类型通过聘请农业专家莅临现场指导或采集样本带去实[4]验室中做侵染性试验,这些方法尽管可行,但周期长,浪费人力和时间,而且由于时间和精力的限制,果农们能够获得的帮助也较为有限。更多情况下依靠自身长期的经验和视觉上的观察来判断病害种类,主观性强,效果较差,并且盲目的喷洒农药,造成农作物上农药残留,同时大量使用农药会使病害产生抗药性。因此,针对农作物病害的诊断和防治方法的研究,对农作物病虫害问题的防控,确保农作物在生长过程中免受病虫侵害,农产品质量安全和农业生态环境安全,促进农业增产增收,避免资源浪费和农药污染具有重要的现实意义。植物病症在外观表现难以用精确和定量的数值进行描述,故凭借经验和病理学知识进行病症分析和诊断往往出现偏差。随着计算机通讯和网络、传感器等技术的快速推广,人工智能,计算机视觉和图像处理技术等学科的交叉发展和应用,精准农业(PrecisionAgriculture)为发展现代智能农业提供了基础。葡萄植株染病时,感染病害部位(如叶片、嫩芽、稍蔓等)的外部形态特征和内部生理结构均会发生变化,如形变,褪色,卷曲,腐烂,变色等,内部特征变化主要包括,水分和色素含量等。这些外部形态特征的变化大多发生在叶片和果实部位,因此,可以叶片部位的病斑作为判断葡萄患病程度的重要依据,以葡萄叶片病害为研究对象,用机器视觉技术对作物病虫害叶片图像进行自动识别,认清病害种类,精准科学施药,对变量喷药,与人工方式相比,既降低了劳动强度,又提高了工作质量,避免了过度使用农药等原因造成产品环境污染,保证我国粮食和食品安全,促进我国农业生产活动从劳动密集型传统农业向智能精准现代化农业转变,解放生产力,提高生产效率。针对葡萄叶片部位常见病害的识别的应用和迫切需求,本文基于自然光照下葡萄叶片与复杂背景之间,葡萄叶部病害与正常叶片在外观特征上的差异性,以[3-4]及不同病斑在颜色、形状、纹理等上的特异性,研究葡萄常见6种病害识别和诊断的方法,为果园精确诊断病害、精准施药和高效管理提供切实、可行的技术支持。1.2国内外相关领域研究现状随着机器视觉技术的不断发展,计算机图像处理与模式识别技术在日常生活2 甘肃农业大学2018届硕士学位论文中应用日益广泛。中国自古以来是传统的农业大国,农业是国民经济建设与发展的基础,是社会正常稳定有序运行的保障。中国陆地面积944万平方公里,除去城乡用地、城市用地、建筑用地等,中国可用于耕作的面积仅占地球可用面积的9%,而人口却占世界人口的22%,人多耕地面积较少,土地荒漠化带来的耕地资源短缺,水资源匮乏,底层农业生产过程中设备和技术滞后的现状迫使我国农业必须加快由传统农业向现代农业过渡的进程,发展现代智能农业不仅是改变资源稀缺的现状关键,更是未来农业发展的必然趋势。植物病害的自动识别与诊断作为农业现代化发展的重要一环,已经成为国内外专家学者的研究热点。目前,图像处理技术被引入在农业生产实践中,主要应用在叶片分割、种子质量检验、叶片所缺元素诊断、果物的识别、果实质量检测和分级等领域,近年来,依靠叶部病害彩色图像的检测、识别与诊断方面的研究受到广泛关注,其应用价值和前景十分广阔。图像识别技术在农作物病虫害检测和识别方面研究始于20世纪80年代,起步比较晚。日本学者安冈善文等(1985)通过对受有害气体污染的农作物叶片图像的研究,提出可通过病叶片诊断植物病害;穗波信雄等(1989)在慈姑缺素诊断试验中,利用直方图分析了颜色特征,但由于提取特征不明显,未能对钙、镁、钛元素有良好区分效果;YuatakaSASAKI(1999)采用遗传算法,根据分光反射特性和形状特性建立识别参数,对病害进行了识别,由于病害的颜色和纹理信息未[5]充分利用,识别效果不佳;LuigiBodria等(2002)利用200W(辐射波长在360nm~430nm)疝气光源在单一波段和4个多光谱波段(450nm,550nm,690nm,740nm)采集图像,对不同真菌感染的小麦进行了多光谱图像识别;MohammedEl-Helly等(2004)利用神经网络对黄瓜白粉病、霜霉病和遭受潜叶虫危害的叶[6]片进行识别,效果显著;Liu等(2005)在11年间手机苹果树病虫害数据,用BP(BackPropagation)神经网络来预测苹果树病虫害的发生;MohammadSammany(2007)等利用遗传算法优化神经网络的结构和参数来识别植物病害图[7]像,同时把支持向量机和神经网络两种方法应用于识别植物病害;Sanyal等(2008)选用神经网络对水稻稻瘟病、胡麻病斑和正常叶片进行了识别,识别率为89.26%。Tellaeche等(2009)根据场景的透视几何原理,利用Hough变换、3 甘肃农业大学2018届硕士学位论文Gabor滤波方法,识别出田间农作物行列之间的杂草,解决了不同透视角度与不同空间频率下的杂草识别;V.A.Gulhane等(2011)提取病斑颜色和形状特征,利用其原始特征图和BPN网络结合,识别棉花叶片病害;PramodS.landge等(2013)基于颜色、纹理和形状特征图像处理方法和NNs实现自动检测和识别植物病害;P.Revathi等(2014)采用斜发散法提取边缘、CYMK颜色特征、GA特征、颜色、纹理等特征,利用SVM、BPN分类;SharadaP.Mohanty(2016)分别使用AlexNet和GoogLeNet网络测试PlantVillage数据集中54306张图片的[8]38个类别的14种作物和26种疾病,最高精确度达到99.35%;AmandaRamcharan等(2017)利用Inceptionv3网络对木薯的3种病害和2种虫害进行识别,褐斑病识别率为98%,花叶病识别率为96%,褐条病识别率为98%,红[9]螨和绿螨虫害的识别率分别为96%和95%。国内关于农作物病害诊断与分类领域的研究起步较晚,主要存在于高校和科[10]研院所等机构中。21世纪初,陈佳娟等(2001)根据棉花叶片的孔洞及叶片[11]边缘的残缺的特征有效的判定棉花虫害的受害程度,误差小于0.05;张长利等(2001)利用遗传算法训练的多层前馈神经网络,测试了50个不同成熟度的番[12]茄样本,实现番茄成熟度的自动判别;徐贵力,毛罕平等(2003)在对无土栽培番茄缺乏营养元素智能识别研究中,利用差分百分率直方图法成功提取了缺素叶片的纹理特征,并利用K-近邻模式识别法对番茄叶片进行缺素种类识别,[13-15]准确率高达80%;程鹏飞(2005)人为地选择颜色和纹理特征参数,利用模[16]糊K-近邻法对植株叶片进行模式识别;王克如(2005)将病害识别的专家知识结合数字图像处理、神经网络方法,实现了玉米病害的远程图像识别与诊断[17];田有文、李天来等(2007)对采集到的葡萄病害彩色图像滤波法后进行了病害分割。最后提取纹理特征、病斑的形状特征和颜色特征,并用支持向量机的模式识别方法来识别葡萄病害。试验结果表明:综合颜色特征和纹理特征的支持向量机识别方法对葡萄病种识别的正确率高于只用颜色特征或纹理特征的准确[18]率;田有文、牛妍等(2009)提取了病斑的形状、颜色、质地、发病时期等特征,采用支持向量机(SVM)对黄瓜病害进行分类,并得出SVM方法适于解[19]决小样本问题,线性核函数和径向基核函数适用于黄瓜病害的识别的结论;[20]王守志等(2009)利用核K-均值聚类算法对玉米叶部4种病害进行分类;管4 甘肃农业大学2018届硕士学位论文泽鑫等(2010)等利用逐步判别法对63个特征参数进行筛选后,用贝叶斯判别[21]法对水稻的3种常见病害进行识别,识别率达到97.2%;刘鹏(2011)将快速独立分量方法与颜色矩的方法结合提取了甜柿病害图像的纹理特征和颜色特征[22]参数,并使用支持向量机(SVM)识别甜柿表面病害;邓继忠等(2012)分别利用最小距离法、BP神经网络和支持向量机等对小麦腥黑穗病进行分类,通[23]过对比得出支持向量机(SVM)更适于腥黑穗图像进行分类;贾建楠等(2013)尝试了边缘检测法和最大类间方差法对黄瓜病害叶片图像处理后,综合运用病斑[24]形状和神经网络对黄瓜细菌性角斑病和霜霉病进行识别,正确识别率达100%;许良凤等(2015)使用自适应加权的多分类器融合的识别方法对246幅玉米病[25]害图像进行识别,识别率为94.7%;郭青,王骊雯等(2016)针对小麦条锈病、白粉病这两种病斑在方向分布一致性的特点,提出一种方向一致性描述方法,利[26]用此种特征对小麦白粉病和条锈病进行识别,准确识别率达99%;孙俊,毛罕平等(2017)利用8种改进的卷积神经网络模型对14种不同植物共26类病[27]害进行训练并选择最优模型,平均测试识别率达99.56%,识别率高,鲁棒性强。综上所述,农作物病害诊断与分类领域的研究起步较晚,前人对农作物病虫害识别和诊断研究主要在棉花、大豆、黄瓜、水稻等领域,但涉及葡萄病虫害方面研究甚少。而且,前人所采用的各类分类算法各有优缺点,且均为针对个别或者特定的单一病害进行分类识别,在单植株多种类病斑识别方面未有涉及。1.3论文内容与结构本文以常见的6种葡萄叶部病害(白粉病、褐斑病、霜霉病、灰霉病、黑痘病、炭疽病)为研究对象,采用传统计算机视觉技术和深度学习技术,对自然条件下,葡萄叶部6种病害进行识别和诊断的研究,包括不同病害胁迫下的葡萄叶片生理特征和外观表现变化,病害图像样本的采集与预处理,数据集的扩展,病害图像特征提取,以及不同病害识别方法的应用等。本文分为六个章节对研究课题展开详细的论述。第1章绪论。主要介绍了农作物病害识别技术这一研究课题在农业领域的应用背景、目的、意义以及发展方向,并阐述了国内外研究状况和目前主流方法。第2章图像识别与机器视觉技术的理论基础。主要介绍了几种传统分类器5 甘肃农业大学2018届硕士学位论文和深度学习技术,以及常用的卷积神经网络模型;第3章数据样本采集设备与硬件环境介绍。数据样本采集与图像的预处理过程,以及数据集扩展的方法和数据库的制作过程;第4章人工截取叶片图像上包含边缘信息的病斑区域作为实验样本,分别使用22种传统分类器,并比较不同识别方法和分类器对小区域病害的识别性能;第5章自动截取叶片图像上病斑区域作为实验样本,分别使用传统分类器和5种深度学习网络模型进行病害识别并比较分类效果。第6章总结与展望。对本课题研究过程所做的工作和主要成果进行总结,针对论文研究过程中存在的突出问题和不足之处,提出今后的工作方向,并对未来的工作内容做出展望。6 甘肃农业大学2018届硕士学位论文第二章图像识别与机器视觉技术理论基础最早,针对农作物病害的诊断,果农们发现和判断病害类型通过聘请农业专家莅临现场指导或采集样本带去实验室中做侵染性试验,这些方法尽管可行,但周期长,浪费人力和时间,而且由于时间和精力的限制,果农们能够获得的帮助也较为有限。更多情况下依靠自身长期的经验和视觉上的观察来判断病害种类,主观性强,效果较差,并且盲目的喷洒农药,造成农作物上农药残留,同时大量使用农药会使病害产生抗药性。因此,基于传统的人工识别农作物病害方法的缺陷和不足,迫切需要科学、快速、有效的农作物病害诊断和分类方法,以提高农作物病害诊断的精确度和效率,确保及时准确地发现病害选择适当的农药,合理施药,对精准农业和葡萄病害的诊断和计算机图像处理技术在农业工程领域的应用具有重要实际意义。本章主要介绍了图像识别与机器视觉技术的理论基础,主要介绍了几种传统分类器和深度学习技术,以及常用的卷积神经网络模型。本章节讨论几种著名的常用在植物叶部病害识别的分类技术,分为两大类,即传统机器学习分类技术和深度学习技术。2.1传统机器学习概述[28]机器学习(Machinelearning)是一门兴起于20世纪50年代的学科,旨在研究利用经验,即数据,通过计算的方式来改善和调整系统自身的性能。因此机器学习所研究的内容是关于计算机从数据中参数“模型(model)”的算法,即学习算法(learningalgorithm),根据经验数据产生模型。机器学习出现于人工智能(artificialintelligence)研究发展过程中,是其到一定阶段的必然产物。20世纪50年代到70年代末,人工智能研究经历了基于符号知识表示和演绎推理技术为主的“推理期”,基于符号知识表示并通过获取和利用相关领域知识来建立专家系统数据库的“知识期”,直到20世纪80年代机器学习才开始步入“学习期”,真正走上人工智能舞台,不久围绕“异或”问题进入了瓶颈,局限性凸显;此时,伴随着“学习期”发展,20世纪90年代,“统计学习”闪亮登场,成为机器7 甘肃农业大学2018届硕士学位论文[29]学习领域最热门的研究对象并迅速占据主流舞台。2.1.1决策树(DecisionTree)[30]决策树(DecisionTree)是一类常见的非参数机器学习分类方法,主要根据给定的数据来推断数据特征,从而学习简单的决策规则,即创建一个预测目标变量值的模型。该方法在学习过程中,无需使用者了解过多知识背景,只需对训练实例进行较好的标注,就能从一类无序,无规则的事物(概念)中推理出觉得树表示的分类规则。如图2-1所示,决策树是一种树形结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类[31]别,它是以实例为基础的归纳学习。?1011011000010011110111图2-1决策树工作示意图Fig.2-1DiagramofDecisiontreework2.1.2K-近邻分类器(KNN)[32-33]K-最近邻(K-NearestNeighbor)是一种类非概率监督学习算法,常被用于解决分类或回归问题。K-最近邻算法没有任何参数,在训练阶段将样本保存起来,不局限于固定数目的参数,数据处理的过程仅在收到测试样本后才进行。K-最近邻算法没有真正的训练阶段或学习过程,属于一类“懒惰学习”(lazy[34]learning)。K-最近邻算法的本质是在某种距离度量的基础上,找出训练集中与给定的所有测试样本最靠近的k个训练样本,然后根据这k个“邻居”的信息来对新的样本进行预测。K-最近邻算法用在分类任务中时,通常使用“投票法”,即选择这k个样本的实值输出标记的平均值作为预测结果,基于距离远近进行加权平均或加权投票,距离越近的样本权重越大。K-近邻分类器原理如图2-1所示。最近相邻(NN)分类法也是非参数分类方法,根据最邻近一个或几个样本类别来决定待分样本所属的类别。8 甘肃农业大学2018届硕士学位论文k=1,测试样本判别为++-k=3,?测试样本判别为-+测试样本k=5,测试样本判别为+-+图2-2K-近邻分类器示意图Fig.2-2K-nearest-neighborclassifierschematicdiagram其中,k是一个重要参数,当k取不同值时,分类结果会有显著不同。相比与其他非参数学习算法,K-最近邻算法拥有很高的容量,这个特征使其在训练样本数目大时能够获取较高的精度。然而,它的泛化能力容易受训练集的影响,训练集越小性能越差,计算成本很高且无法学习出更具识别力的特征。2.1.3支持向量机(SVM)[35]支持向量机(SupportVectorMachine,SVM)属于监督学习算法,旨在寻找到一个最优超平面,使样本分成两类,且两类之间的最大的间隔,并通过核函数把不同类别的数据点映射到高维空间中。例如,给定训练样本集D={(x1,y1),(x2,y2),(x3,y3),…,(xn,yn)},yi属于{-1,+1},在训练集D在样本空间中找到一个划分超平面,将不同类别样本分开,并且这个超平面所产生的分类结果鲁棒性最后,对未见示例的泛化能力最强,如图2-3中红色线段所表示的超平面[36]。x2+++++++++++++-------------0x1图2-3超平面将两类训练样本分开示意图Fig.2-3ThesuperplaneseparatestwokindsoftrainingsamplesT支持向量机与逻辑回归类似,也是基于线性函数wxb,但是支持向量机9 甘肃农业大学2018届硕士学位论文T输出的是分类结果,而不输出概率。当wxb为正时,支持向量机对样本的预T测结果属于正类。类似地,当wxb为负时,支持向量机对样本的预测结果预测属于负类。x2+-xϕ(x)+++-+-++-0x1图2-4异或问题与非线性映射Fig.2-4XORproblemandnonlinearmapping在现实很多任务中,训练样本并不一定是线性可分的,那么原始样本空间就不一定存在一个能正确划分两类样本的超平面。这种情况下,需要将样本从原始空间映射到高维的特征空间,使得样本在该特征空间内线性可分。如图2-4所示。此时需要引入核函数(kernelfunction),支持向量机中的线性函数为,mTT()iwxbbixx(2-1)i1核函数,()ii()kxx(,)()x(x)(2-2)()i其中,x是训练样本,是系数向量;将x替换为特征函数()x的输出,可以使用如下函数对样本进行预测,fx()bkxx(,()i)(2-3)ii该函数关于x是非线性的,关于()x是线性的。α和f(x)之间的关系也是线性的。核函数完全等价于用()x预处理所有的输入,然后在新的转换空间学习线性模型。在特征映射的形式未知的情况下,核函数的选择至关重要,它直接影响映射特征空间的选择和支持向量机的性能。核函数能够使支持向量机保证有效收敛的凸优化技术来学习非线性模型(关于x的函数)。最常用的核函数是高斯核10 甘肃农业大学2018届硕士学位论文(Gaussiankernel),2K(u,v)=N(u–v;0,σI)(2-4)其中,N(x,µ,Σ)是标准正态密度。当d=1时,称谓径向基函数核(radialbasisfunction,RBF),因为其值沿v中从u向外辐射的方向减小。2.1.4集成学习[37]集成学习(ensemblelearning),即多分类器系统(multi-classifiersystem),通过产生一个“个体学习器(individuallearner)”,再用某种策略将其结合起来,完成学习和分类任务。集成学习分类器中可以只包含同种类型的个体学习分类器,例如“决策树集成”中全为决策树;同时集成学习分类器也可以包含不同类型的个体学习期,例如同时包含决策树和神经网络。集成学习示意图如图2-5所示。集成学习通过多个学习器的组合常可获得比单一分类器更优越的性能和泛化能力。根据个体学习器的生成方式,目前的集成学习方法大致可分为两大类,即个体学习器间存在强依赖关系、必须串行生成的序列化方法,以及个体学习器间不存在强依赖关系、可同时生成的秉性化方法,如随机森林(RandomForest)、BoostedTrees、BaggedTrees、SubspaceDiscriminant、SubspaceKNN、RUSBoostedTrees等。个体学习器1个体学习器2结合输出.模块..个体学习器T图2-5集成学习示意图Fig.2-5IntegratedLearningdiagram集成学习要有2种:基于Boosting策略和Bagging策略,前者的代表算法有Adaboost、GBDT、XGBOOST、后者的代表算法主要是随机森林。Bagging策略如图2-6所示。从原始样本集中抽取训练集,每轮从原始样本集中使用Bootstapsampling的方法抽取m个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽中),通过T次随机采样得到T个训练集,对于这T个采样集分别独立的训练出T个弱学习器。再对这T个弱学习器通过结合[38]策略(简单多数投票、权重投票,贝叶斯投票等)来得到最终的强学习器。11 甘肃农业大学2018届硕士学位论文m个样本弱学习器1训练集1训练随m个样本结弱学习器2m个原始机训练集2训练合强学习器……策样本采……略样m个样本训练弱学习器T训练集T图2-6Bagging策略Fig.2-5Bootstrapaggregatingdiagram2.2深度学习概述传统机器学习技术在处理原始形态的自然数据方面有很大的局限性。21世纪初,为了克服核机器的这些限制,(Hintonetal.2006b)表明神经网络能够在[39]MNIST基准数据上胜过RBF核的支持向量机,于是以“深度学习(DeepLearning,DL)”为名的连接主义学习卷土重来,并被广泛应用于图像中物体识别、语音转换成文字、匹配新闻条目、内容相关度搜索,以及用户需求商品推荐[37]等领域。深度学习是机器学习的一个特定分支,是Hinton等人(2006)为解决深层结构相关的优化难题,提出的一种基于非监督贪心逐层训练算法,旨在建立、模拟人脑进行分析学习的神经网络,从而模仿人脑的机制来解释数据,例如图像,声音和文本。此外Lecun等人提出的卷积神经网络是第一个真正多层结构[38]学习算法,它利用空间相对关系减少参数数目以提高训练性能。随着大规模训练数据(如ImageNet)和高性能计算硬件(GPU)的出现,深度学习已经在语音识别、图像处理等方面取得了巨大成功。从2013、2014年开始,自然语言处理领域也出现了应用深度学习的浪潮,例如2017年ACL上BBN公司利用深度学习技术极大地提升了统计机器翻译的性能。随机梯度下降(StochasticGradientdescent,SGD)和反向传播(BackpropagationAlgorithm)是所有深度学习中最重要两个算法,神经网络的[40]前向传导过程,反向传播都是用梯度下降法进行训练。(1)随机梯度下降(Gradientdescentalgorithm)机器学习旨在对一个目标函数最优化,而寻找一个函数局部最优解的有效方12 甘肃农业大学2018届硕士学位论文法就是梯度下降算法。主要的步骤是构造代价函数,然后对代价函数进行优化,使得Cost值最小。梯度下降法核心就是找到最陡的方向,逐一小步,然后再找到当前位置最陡的下山方向,再迈一小步。梯度是期望,期望可使用小规模的样本近似估计。图2-7最小和局部最小Fig.2-7MinimumandLocalminimum以线性回归(linearregression)为例,构造拟合函数(hypothesisfunction):hx()x+...x(2-5)01nn其中,θ0,θ1…θn为参数,x0,x1…xn为输入特征。为了求解线性回归模型,需要找到合适的参数使拟合函数能够更好地适合模型,然后使用梯度下降最小化代价函数J(θ)。构造Cost函数:1mii()2J(,)01(()hxy)(2-6)2mi1优化目标是最小化J(,),即通过求解导数求函数最小值,故对J(,)求偏0101导数:mJ(,)101()01xy(2-7)0mi1m1(()hxy)mi1mJ(,)011()i()01xyx(2-8)0mi113 甘肃农业大学2018届硕士学位论文m1()i(()hxyx)mi1得:J(,)01-(2-9)000J(,)01-(2-10)111(2)反向传播(backpropagationalgorithm)在使用梯度下降求解最优问题的过程中,需要计算函数的梯度,反向传播算法主要用来是解释计算神经网络中误差函数梯度,其主要的思想是将网络最后输出的结果计算其误差,并且将误差反向逐级传下去,即找到一个中间变量,通过[41]链式法则来求解误差对参数的偏导数。反向传播运用的是链式求导的基本思想(隐函数求导),例如:函数u=ϕ(t)在点t处可导,z=f(u)dzzdu(2-11)dtudt对于下图所示的神经网络:InputOutput图2-8简单神经网络示例Fig.2-8SimpleNeuralNetworkexample假设第一个神经元的表达式为f1(x)=x第二个神经元的表达式为011f2(y)=θ0+θ1y,那么实际上第一个神经元的输出是第二个神经元的输入,也就是第二个表达式中的y=f1(x)。对于训练这个模型首先采用前向传播算法(也就是按步骤计算得出输出结果):对于输入x1计算:xfx()(2-12)01111fx()f(())fx(2-13)0111211假设输出结果计算后得到y1′,构造代价函数为:14 甘肃农业大学2018届硕士学位论文12Cyy(2-13)112其中,y1表示分类,y1′表示预测值;计算误差之后需要将误差反向传播回去,首先计算最后一层的误差,更新θ0,θ1:CC-;-(2-14)0101然后再更新前一个节点,Cff21-(2-15)0ff210Cff21-(2-16)1ff211采用梯度下降依次逐层更新知道最终收敛为止。2.2.1AlexNet[42]AlexNet是Hinton小组在ISVRC2012中使用的神经网络模型,并以巨大的优势赢得了第一名,Top5测试错误率是15.3%,第二名是26.2%。AlexNet基[39]于LeNet,并结合了数据增强、ReLU、dropout和GPU实现,AlexNet的网络结构比LeNet更深,网络结构如图2-9所示,共有60M个参数,650k个神经元,包含8层神经网络,即5个卷积层和3个全连接层(1000类的softmax分类器),图像输入尺寸为227×227×3。AlexNet开创了计算机视觉的新纪元。图2-9AlexNet网络结构Fig.2-9Alexnetstructure2.2.2VGGNetVGGNet是牛津大学计算机视觉组(VisualGeometryGroup)和Google15 甘肃农业大学2018届硕士学位论文[44][43]DeepMind公司共同研发的深度卷积神经网络。时至今日,VGG-16仍然被认为是一个杰出的视觉模型。Vgg-16是一种深度卷积神经网络模型,网络深度为16层,共包含1.38亿个参数,结构简单且性能优越,VGG-16模型在常规分类任务中可以达到92.7%的测试准确度。后期的CNN输入不受图像尺寸限制,但为了避免高分辨图像对识别效果的影响,故在训练之前需要将输入图像尺寸统一化为224×224,在比较性能和时间做出性能评价时,可以保证更客观更公平。VGG-16的网络结构示意图如图2-10所示。224×224×3224×224×64112×112×12856×56×2567×7×51228×28×51214×14×5121×1×40961×1×1000sConvolution+ReLUMaxpoolingFullyconnected+ReLUsoftmax图2-10VGG-16网络结构图Fig.2-10VGG-16structureVGG-19共19层,包括16层卷积层和最后的3层全连接层。如图2-11所示,VGGNet网络框图,从左至右每一列代表着深度增加的不同的模型,从上至下代表模型的深度,其中D栏为VGG16模型,E栏为VGG19模型。图2-11VGGNet网络框图Fig.2-11VGGNetstructure16 甘肃农业大学2018届硕士学位论文2.2.3GoogLeNet[46]Google凭借一个22层的深度网络GoogLeNet,赢得2014年ILSVRC的冠军。在InceptionV1的结构中,在不同深度处增加了两个loss来保证避免梯度消失问题。GoogLeNet采用了Inception模块化(9个)的结构,共22层,方便增添和修改;网络最后采用了averagepooling来代替全连接层,参数个数仅为AlexNet的1/12,性能优于AlexNet。Inception结构如图2-12所示,主要是用密集成分来近似最优的局部稀疏结构。1×1Filterconcatenation3×31×1conv3×3conv5×5conv3×3maxpooling5×5641283×3323228×28×19228×28Previouslayer图2-12Inception结构Fig.2-12Inceptionstructure如图所示,采用不同大小的卷积核意味着不同大小的感受野,最后拼接实现不同尺度特征的融合;卷积核大小分别为1×1、3×3和5×5。2.2.4ResNet[47]为了解决网络结构加深带来的梯度消失和梯度爆炸问题,以适应更深层[48]次的CNN训练,MSRA何凯明团队设计了一种网络构架ResNet(残差网络),该网络引入了残差模块(residualblock),如图2-13所示,并在2015年ILSVRC和COCO赢得多项冠军。xxCCOONNVVCCOONNVVF(x)xReluReluidentityCCOONNVVCCOONNVVH(x)+F(x)+xRelu图2-13残差模块Fig.2-13ResidualsBlock假设某段神经网络的输入为x,期望输出是H(x),若直接将输入x传到输[49]出作为初始结果,则学习目标为F(x)=H(x)-x,即残差。17 甘肃农业大学2018届硕士学位论文图2-14ResNet网络结构Fig.2-14ResNetstructure图2-14左侧为VGG-19网络,中间为34层普通卷积网络,右边为34层的残差网络。由上图可知,ResNet有很多旁路的支线将输入直接连到后面的层,18 甘肃农业大学2018届硕士学位论文使得后面层可以直接学习残差。传统卷积层或全连接层在信息传递时,会存在信息丢失、损耗等问题,ResNet直接将输入信息绕道传递到输出,保护信息的完整性,整个网络只需要学习输入、输出差别那一部分,简化了学习目标和难度。2.2.5FasterR-CNNFasterR-CNN算法是RossB.Girshick(2016)在R-CNN和FastR-CNN基[50-51]础上改进后的算法,主要被用在目标检测任务中。在结构上,FasterR-CNN网络整合了特征提取(featureextraction),proposal提取,边框回归(boundingboxregression)和分类(classification)等功能,综合性能和检测速度相比其他算法[54]尤为突出。图2-15FasterR-CNN结构图Fig.2-15FasterR-CNNstructure(1)卷积层(Convlayers):作为一种CNN网络目标检测方法,FasterRCNN首先使用一组基础的conv+relu+pooling层提取图像中的特征图(featuremaps),然后被共享用于后续RPN层和全连接层;[52](2)区域建议网络(RegionProposalNetworks):RPN网络用于生成区域建议框,该层通过softmax判断anchors属于前景(foreground)或者背景(background),再利用边框回归(boundingboxregression)来修正anchors获得精确的建议框;(3)池化(RoiPooling):该层综合输入的图像和区域建议框所提供的信息,提取建议特征图,送入全连接层判定目标类别。(4)分类(classification):利用建议特征图来计算proposal的类别,同时再次通过边框回归获得检测框最终的精确位置。19 甘肃农业大学2018届硕士学位论文分类部分利用已经获得的区域建议特征图,通过全连接层与softmax计算每个矩形建议框具体属于那个类别(本文中指6种病害类别,即白粉病、褐斑病、霜霉病、灰霉病、黑痘病、炭疽病),输出概率向量;同时再次利用边框回归获[53]得每个proposal的位置偏移量,用于回归更加精确的目标检测框。识别部分网络结构如图2-16所示。图2-16识别部分网络结构图Fig.2-16Identifyingpartofthenetworkstructure在中FasterR-CNN是其中最为典型的算法,它引入了RPN网络,并结合了基础的区域建议的卷积神经网络(Fast-RegionConvolutionalNeuralNetwork,Fast-RCNN)的检测结构,将整个检测过程统一在一个网络之内,实现了到端的[54]训练。20 甘肃农业大学2018届硕士学位论文第三章材料与数据集制作葡萄植株染病时,感染病害部位(如叶片、嫩芽、稍蔓等)的内部生理结构和外部形态特征均会发生变化,如形变,褪色,卷曲,腐烂,变色等。这些外部[55]形态特征的变化大多发生在叶片和果实部位。因此,叶片部位的病斑可以作为葡萄患病类型的重要依据,以葡萄叶片病害为研究对象,用机器视觉和深度学[56]习技术对作物病虫害叶片图像进行自动识别。3.1研究对象的主要病害类别每年5月到9月期间为葡萄植株病害高发季节,天气、光照和土壤水肥等条件均会影响植株的正常生长,此时葡萄植株处于幼果期,生理性病害会导致果穗和果粒产生多种问题甚至器质性病变,若不及时发现和尽早诊断和预防,后期容易造成葡萄整个植株真菌性病害的侵染和蔓延,严重制约葡萄植株和果实的正常[55]生长。本文以常见的6种葡萄叶部病害,即炭疽病、灰霉病、褐斑病、霜霉病、白粉病和黑痘病作为研究对象。(1)葡萄炭疽病感染部位主要在叶片,染病初期会在叶片表面形成零散的褐色小斑点,随着时间推移,单个小斑点逐渐扩大成圆形,并带有同心轮纹,中间略凹陷的深褐色病斑。(2)葡萄黑痘病初期感染黑痘病的叶片上产生分布零散,周围有淡黄色晕圈的红褐色或黑褐色的细小斑点,逐渐扩大,变成有红褐色清晰边缘无规则形状的大斑点,且大斑点中部叶肉为灰白色;后期大斑点中央灰白色部位干枯破裂,形成穿孔;整个叶片出现许多穿孔,严重时类似网状。(3)葡萄霜霉病叶片感染霜霉病时,初期叶片表面出现零散的不规则的淡黄色半透明油浸状小斑点,然后小斑点逐渐扩大,变为边界不明显的黄绿色小斑点,多个小斑点继续扩大延伸,连接在一起,边缘消失,逐渐组成一个形状不规则的大病斑;此时,21 甘肃农业大学2018届硕士学位论文大病斑对应的叶片背面(叶脉侧)会出现白色霜状霉层;后期病斑逐渐变为褐色,叶片上染病区域开始干裂、枯焦、卷曲,最后脱落;(4)葡萄褐斑病叶片感染大褐斑病时,叶片表面会出现直径约为3~10毫米的褐色圆形病斑,病斑中间有深浅相间的褐色纹路,病斑边缘有黄色晕圈。病害严重时,多个病斑逐渐扩大,连接在一起组成直径可达20mm以上形状不规则的大斑块。若气候湿润,叶片病斑表面及背面会产生零散的深褐色霉状物。发展到后期,叶片染病部位发生干枯破裂;小褐斑病与大褐斑病有所区别,病斑为大小一致、直径2~3mm的褐色小圆斑,在叶片上分布零散,一张染病叶片上可能同时出现数十个病斑。(5)葡萄灰霉病灰霉病主要侵害新生叶片,发病初期叶脉边缘上出现淡褐色病斑,沿着叶脉生长,蔓延至整个叶片。(6)葡萄白粉病白粉病为高发病害,叶片感染白粉病时,症状主要集中表现在叶片表面,发病初期,叶片表面覆盖一层灰白色粉状的霉菌层,逐渐扩散蔓延,覆盖整个叶片。病情严重时,染病叶片干枯、萎缩、卷曲,由灰白色变为灰色,最后全部变为黑[56]色。[58]不同病害,在葡萄叶片表面呈现的病斑形态不同,难以用精确和定量的数值进行描述,但根据病斑在斑点大小、形状、颜色、纹理等可视化外观特征,可对叶片感染病害类别做出一定置信度的判别。3.2图像采集设备自然条件下的葡萄叶片由于受天气、光照等因素的影响,为了得到较好的葡萄叶片图像,对我们的拍摄仪器的要求,以及后期图像训练好坏的硬件平台的需求重要,其中任何一个环节不达标,将对我们的试验结果产生巨大的偏差,更[59]有甚者会导致试验的失败。因此,本章将对试验前期的试验设备参数给与详细说明,以及数据集的制作过程。采集图像所使用的设备为CanonEos1200D单反相机型号,图像采集设备如22 甘肃农业大学2018届硕士学位论文图3-1所示。图3-1图像采集设备Fig.3-1Imageacquisitionequipment该型号相机的规格参数见表3-1所示。所选用的镜头型号为CanonEF-S18-55mmf/3.5-5.6ISII,相关参数见表3-2所示。表3-1CanonEos1200D相关规格参数说明Table3-1Canoneos1200dRelatedspecificationparameterdescription产品名称项目入门单反类型CMOS图像感应器尺寸APS画幅(22.3*14.9mm)图像感应器有效像素1800万最高分辨率5184×3456除尘功能手动、添加除尘数据类型眼平五面镜视野率垂直/水平方向约为95%(眼点约为21毫米)放大倍数约0.8倍(-1m-1,使用50mm镜头对无限远处对焦)眼点约21毫米(自目镜透镜中央起-1m-1)网格显示两种类型屈光度调节约-2.5-+0.5m-1(dpt)对焦屏固定式、精确磨砂取景器反光镜快回型自由移动1点,面部优先实时模式(反差检测)对焦模式快速模式(相差检测)手动对焦(能放大约5倍/10倍)对焦亮度范围EV1-18(23℃、ISO100)测光模式实时测光测光范围EV0-20(23℃、ISO100)23 甘肃农业大学2018届硕士学位论文程序自动曝光(P)光圈优先(A)曝光模式快门优先(S)手动曝光(M)曝光补偿手动±5EV(1/3EV步长)曝光控制自动包围曝光±2EV(1/3EV步长)日光阴影阴天预设效果钨丝灯白色荧光灯闪光灯表3-2CanonEF-S18-55mmf/3.5-5.6ISII规格参数说明Table3-2Canonef-s18-55mmf/3.5-5.6ISIIspecificationparameterdescription镜头画幅APS画幅镜头镜头分类单反镜头镜头用途标准镜头镜头类型变焦镜头结构9组11片主要性能镜头卡口佳能EF-S卡口变焦方式伸缩式镜头滤镜尺寸58mm驱动马达DC马达遮光罩EW-60C最大光圈F3.5-F5.6最小光圈F22-F38光圈叶片数6片焦距范围18-55mm等效焦距29-88mm光学参数最近对焦距离0.25m最大放大倍率0.34倍水平:64度30分-23度20分视角范围垂直:45度30分-15度40分对角线:74度20分-27度50分镜头直径68.5mm其他参数镜头长度70mm镜头重量200g3.3图像采集过程实验样本图像主要于2016年5月-2017年9月期间从甘肃多地葡萄种植区(甘肃农业大学葡萄园,甘肃天水,永登等地葡萄园)拍摄得到,相机型号为Cannon24 甘肃农业大学2018届硕士学位论文1200D,相机分辨率设定为640×480。自然条件下拍摄,获取包含复杂背景的葡萄病害图像,以JPG格式保存,共拍摄获得褐斑病170幅,白粉病300幅,霜霉病210幅,黑痘病137幅,炭疽病102幅,灰霉病64幅,负样本1000幅(其中包括健康叶片,套袋,土壤,葡萄果实和葡萄茎秆等)。葡萄病害样本图像示例如图3-2所示。a.褐斑病b.白粉病c.黑痘病d.灰霉病e.霜霉病f.炭疽病图3-2拍摄的葡萄病害原始图像示例Fig.3-2sampleoforiginalimageofgrapedisease在病害图像样本采集过程中,本文采用多角度、多时间段、多方位拍摄以获取足够多的病害图像样本,包含:(1)从同一时期拍摄的不同种类的葡萄病害叶片图像;(2)不同阶段的同种病害多幅图像;(3)同一病斑叶片不同角度拍摄的葡萄病害叶片图像;(4)同种病害多叶片图像和染病单叶片图像等。同时,考虑到葡萄病害生长过程中,外部特征会发生变化的不稳定性,故采集了6种病害不同发病期的图像,如图3-3所示。(a)褐斑病前期(b)褐斑病后期(c)炭疽病前期(d)炭疽病后期25 甘肃农业大学2018届硕士学位论文(e)霜霉病前期(f)霜霉病后期(g)黑痘病前期(h)黑痘病后期图3-3不同发病期的病害图像示例Fig.3-3Examplesofdiseaseimagesatdifferentstagesofdisease由于果园葡萄植株密集,为了防止病害扩散蔓延,果园管理人员对大部分病害及时作出处理,能采集到的图像样本不够充分,于是通过中国农业大学网络数据库、农业交流论坛、农业技术服务平台、Bingimages等渠道获得病害图像样本以充实实验样本集。最后,获得病害图像262幅,其中,褐斑病55幅,白粉病51幅,霜霉病52幅,黑痘病23幅,炭疽病48幅,灰霉病33幅。3.4数据集的制作本文针对不同的分类方法制作了A、B、C三类数据集。(1)数据集A由于获取到的图像较少,故采用随机剪裁图像的方法,在原图中根据人眼观察到的病害密度,随机截取带有病斑的局部叶片作为新图像,然后人工截取小病[60]斑的外接矩形作为传统机器视觉分类方法的样本。数据集A包含病斑样本2100幅,其中褐斑病350幅,白粉病385幅,炭疽病325幅,霜霉病367幅,灰霉病316幅,黑痘病357幅。此外负样本1000幅(包括正常叶片、茎秆、果实、地膜等)。数据集A中图像样本示例如图3-4所示。(a)多张病害叶片图像(b)裁剪多叶片图像(c)手工截取病斑样本图3-4原图像与数据集A样本Fig.3-4TheoriginalimageandsampleofDatasetA26 甘肃农业大学2018届硕士学位论文(2)数据集B在图像分类识别任务中,CNNs的性能和泛化能力受训练样本的数量的直接影响,足够大的样本量不仅可以提高分类方法的准确率,还能有效地防止过拟合现象等。然而,在实际实验过程中,难以获取到足够大的实验样本用于分类器的训练,此时需要人为扩展训练数据(ArtificiallyExpandingtheTrainingData),即通过对原始图像进行一些不改变其类别的几何变化来增加训练集的额外副本,[60]扩充训练集的大小,进而提高深度学习模型的泛化能力。由于采集的葡萄病害叶片图像数据库,包含中单张病害叶片组成的图像和多张病害叶片组成的图像,对于本文中研究对象病斑图像,任意旋转不会改变其属性和类别,先将部分原图中包含感染病害的多张叶片图像手工分割,截取单个病害叶片作为新的样本,采用随机剪裁图像的方法,根据人眼观察到的病害密度,在原图中随机截取带有病斑的局部叶片作为新样本,然后将截取的病害样本的副本经过拉伸压缩处理后作为新样本,再随机在0°~359°之间随机旋转。最后,经过随机缩放、扭曲、旋转图像、镜像翻转、添加椒盐噪声等多种几何变换以解决[61]数据集样本数量不足的问题。最后,共获得褐斑病1612张,白粉病1615张,霜霉病1579张,黑痘病1599张,炭疽病1602张,灰霉病1541张,负样本1469张(包括正常叶片、茎秆、果实、套袋等)。该方法获得的样本主要用于深度学习网络葡萄病害的分类实验。数据集B样本如图3-5所示。(a)病害叶片图像(b)垂直镜像(c)顺时针旋转50°(d)人工截取病害区域图3-5数据集B样本示例Figure3-5SampleofDatasetB(3)数据集C在数据集B中图像上进行样本标记,用矩形边框标记叶片上的病斑(一个叶片上可能存在数十个病害区域),并给定类型标签,用于后续算法提取感兴趣的区域进行学习。该方法获得的样本主要用于FasterR-CNN全图检测的葡萄病27 甘肃农业大学2018届硕士学位论文害识别方法。数据集C样本示例如图3-6所示。(a)多张病害叶片图像(b)单张病害叶图像(c)逆时针旋转30°图3-6数据集C样本示例Fig.3-6SampleofDatasetC28 甘肃农业大学2018届硕士学位论文第四章基于传统分类方法的葡萄叶片病害半自动识别方法在实际的农业生产生活中,作物叶片上病斑外观形态会随着时间推移发生改变。为了验证多种情况下,不同分类器对不同时期和不同状态病斑的识别效果,本文在采集图像样本的过程中从多角度、多时间段、多方位进行拍摄,以获取足够多的不同姿态和生长状况的病害图像样本。本方法中所用样本来自数据集A,均为手动截取的小病斑外接矩形,即叶片中包含边缘信息的病斑区域。然后选用多种传统分类器对样本进行病害种类识别。传统机器视觉技术在农作物病虫害检测和识别方面的研究始于20世纪80[62]年代,通常包括图像预处理,特征提取,特征选择,分类器的选择,训练和测试等步骤。传统机器学习做分类过程如图4-1所示。病害图像采集图像预处理图像特征提取特征选择模式识别输出分类结果图4-1传统分类器分类识别流程图Fig.4-1traditionalclassifierclassificationandidentificationflowchart待识别对象的外部特征是对象分类识别的依据,首先通过特征提取,针对图像的某些性质将图像的原始特征经过计算,转换为一组具有明显物理意义或者统[63]计意义的特征,如Gabor、几何特征(角点、不变量)、纹理(LBP、HOG等)[64]等,再通过特征选择,从特征集合中挑选一组最具统计意义的特征,达到降维的效果,用于图像中对象的检测和识别。故在使用传统机器视觉技术做分类识别任务时,特征提取过程是其中最重要的环节。在本研究中,葡萄病害特征参数29 甘肃农业大学2018届硕士学位论文提取是病斑识别的关键步骤,会直接影响识别结果的准确性。因此在进行提取和特征选择时,要选择同时具备最有效的特征,如同类样本的不变性、不同样本的可区分性和鉴别性、对噪声的鲁棒性等。农作物叶部病害特征常用的有颜色、纹[65]理和形状等特征。4.1颜色特征的提取颜色特征是彩色图像中最显著的特征,其对图像或图像区域的方向和大小等变化不敏感,不受图像旋转,平移变化的影响。属于图像的内部特征,描述了图像或图像区域所对应的表面性质,具有相当强的鲁棒性。颜色的不同空间分布极大的影响了人们对图像的相似性判断。因为考虑到实际农业生产生活中,植物叶片处在户外自然环境中,叶片表面附着灰尘不可避免,因此文中原样本均为自然[66]光照下拍摄的样本,未经过除尘降噪等处理。本方法中所用数据集中样本均为手动截取的包含边缘信息的病斑区域。在图像处理中,HSV模型的主要优点是亮度信息V和色彩信息是无关的,色度H和饱和度S和人类感知颜色特征的方式相关,故本文综合使用了RGB[67]和HSV颜色空间分析病斑颜色特征。颜色特征主要通过计算颜色矩,用数字的方法来描述图像的颜色分布,常采用一、二、三阶矩表示,定义分别如式(4-1)、(4-2)和(4-3)所示:一阶矩(均值):1niPij(4-1)nj1二阶矩(方差):11n22iPiji(4-2)nj1三阶矩(偏度):11n33i()Piji(4-3)nj1式中:n为图像像素数;Pij图像第i个通道中像素值为j的像素出现的概率。30 甘肃农业大学2018届硕士学位论文将图像样本从RGB颜色空间转换为HSV颜色空间,经上述公式可获得R、[61]G、B、H、S颜色分量的1阶矩,2阶矩和3阶矩共计15个颜色特征值。提取自然拍摄的葡萄6种病害的彩色图像样本的颜色矩特征,经归一化处理后,获得2100幅病斑样本颜色特征参数,随机选取各类病害样本30幅,共获得180幅病斑样本的取值范围如表4-1所示。表4-1颜色特征参数取值范围Tab.4-1valuerangeofcolorfeatureparameters白粉病褐斑病黑痘病灰霉病霜霉病炭疽病minmaxminmaxminmaxminmaxminmaxminmaxH分量1阶矩0.73170.27450.05230.09660.04160.86840.06170.18590.11910.43520.02170.4880H分量2阶矩0.12090.39190.00400.25760.01730.79330.00430.17570.00690.34370.00590.9212H分量3阶矩0.00630.25920.00530.02870.01580.38160.00260.04310.00660.39780.00550.4196S分量1阶矩0.00060.36940.05430.93000.09320.55740.26850.72200.05420.70120.07810.8278S分量2阶矩0.01390.15040.05430.36980.04730.71340.06860.31340.02130.36390.04050.3189S分量3阶矩0.00370.25790.01730.68390.06730.74470.05660.42910.05980.57990.08550.5877V分量1阶矩0.55930.90290.25390.84280.32430.95060.30100.70420.34310.94600.07660.8349V分量2阶矩0.00410.31380.02770.39230.03330.99720.05120.35920.00050.24020.03690.4904V分量3阶矩0.00880.42790.05380.52790.08850.76160.07760.99050.05490.46740.05140.0586由表4-1可知,病害特征规律不明显,6种病害特征值严重交叉,低阶矩分辨能力较弱。以病害样本号为横坐标,以颜色矩的9个颜色特征为纵坐标,绘制各颜色特征参数的区分效果图示例。图4-2HSV颜色空间H分量1阶矩特征值区分结果Fig.4-2HSVColorSpaceH-component1-momenteigenvaluedistinctionresult由图可知,葡萄白粉病病斑在HSV颜色空间H分量的1阶矩的颜色特征值在0.3~0.8之间,与其他5种病害交叉部分较小,故可以通过HSV颜色空间H分量的1阶矩的颜色特征对葡萄白粉病的识别有一定作用。31 甘肃农业大学2018届硕士学位论文图4-2HSV颜色空间H分量2阶矩特征值区分结果Figure4-2DistinctionResultofHSVcolorSpaceH-component2-moment由图可知,6种葡萄病斑在HSV颜色空间H分量的2阶矩的颜色特征值分布较为集中,交叉部分大,HSV颜色空间H分量的2阶矩的颜色特征对葡萄病害识别贡献率较小。图4-3HSV颜色空间S分量1阶矩特征值区分结果Fig.4-3DistinctionResultofHSVcolorSpaceS-component1-moment由图可知,白粉病与褐斑病的颜色矩特征值未有重合,褐斑病与黑痘病S分量1阶矩特征值交叉较小;黑痘病、灰霉病、霜霉病和炭疽病4种病害的颜色矩特征规律不明显且有较多重合,区分效果不好。因此,HSV颜色空间S分量1阶矩特征值可以较好的区分白粉病、褐斑病和黑痘病。32 甘肃农业大学2018届硕士学位论文4.2纹理特征的提取颜色特征无法描述图像中颜色的局部分布以及每种色彩所处的空间位置,在分类任务中常引入纹理特征。纹理是图像的一个重要特征,是从图像中计算出来的一个值,对区域内部灰度级变化的特征进行量化,描述图像或图像区域内容的表面性质。纹理特征常具有周期性,反映物品的质地,如粗糙度、光滑度、颗粒[68]度、随机性和规范性等。由于纹理是由灰度分布在空间位置上反复出现而形成的,因而在图像空间中相隔某距离的两个像素分别具有某个灰度的状态进行统计得到的。一幅图像的灰度共生矩阵能反映出图像灰度关于方向,相邻间隔和变化幅度的综合信息,因此[69-70]可采用了基于灰度共生矩阵的纹理特征。设f(x,y)为一幅二维数字图像,S为目标区域R中具有特定空间联系的像素对的集合,则满足一定空间关系的灰度共生矩M为:#xy1,1,xy2,2Sfxy1,1n1&fxy2,2n2Pnn12,(4-4)#S其中,#{}表示集合中的元素个数;#S表示像素对的总个数;(x1,y1),(x2,y2)表示图像中的像素坐标;取不同的距离和角度,得到的灰度共生矩阵不同,本文取0°、45°、90°、135°。文献[68]给出了从灰度共生矩阵导出的18种纹理特征,通过试验发现,对于葡萄叶片病害,其中对比度、相关性、能量、惯性矩[71]和熵等5种特征对后期识别具有较高的贡献率,因此本文只采用该5种纹理特征用于后续传统分类方法识别病害的实验中。33 甘肃农业大学2018届硕士学位论文表4-25种常用的基于灰度共生矩阵的纹理特征表示Tab.4-25Commonexpressionsoftexturefeaturesbasedongray-scaleco-occurrencematrix序号名称表示方法2T1对比度ijPij,ijixjyPij,T相关性ij2xy2T3能量Pij,ij1T4惯性矩2Pij,ij1(ij)T熵Pij,lg(,)Pij5ij其中,x,x,y和y分别为纹理参数x的均值和方差,y的均值和方差。4.3实验结果与分析为了测试不同分类器对6种病斑的识别效果,本节尝试使用传统机器视觉技术来区分病害样本的类别,并对督机器学习范例中5大类22个小类的分类器进行测试,涉及的分类方法包括决策树(ComplexTree、MediumTree、SimpleTree)、判别分析(LinearDiscriminant、QuadraticDiscriminant)、支持向量机(LinearSVM、QuadraticSVM、CublicSVM、FineGaussianSVM、MediumGaussianSVM、CoarseGaussianSVM)、最邻近分类器(FineKNN、MediumKNN、CoarseKNN、CosineKNN、CublicKNN、WeightedKNN)和集成分类器(BoostedTrees、BaggedTrees、SubspaceDiscriminant、SubspaceKNN、RUSBoostedTrees)。其中,集成分类器是由数个性能较弱的分类器组合在一起,获得比单一分类器对样本的预测和分类能力更优越的分类器。如Boosted[72]trees是由AdaBoost算法与决策树集成,根据Breiman的随机森林算法和判别分析分类方法的集成;RUSBoostedTrees是RUSBoost算法和决策树的集成。训练样本来自数据集A,即原图像中手动裁剪的病斑区域样本,共1680幅,其中褐斑病350幅,白粉病385幅,炭疽病325幅,霜霉病367幅,灰霉病316幅,黑痘病357幅。此外负样本500幅(包括正常叶片、茎秆、果实、套袋等)。34 甘肃农业大学2018届硕士学位论文表4-322种分类器对6种病害样本的分类结果Tab.4-3IdentificationResultsbasedon22kindsofclassifiers分类器名称样本数正确预测数预测正确率ComplexTree1680150089.28%MediumTree1680142684.88%SimpleTree1680125674.76%LinearDiscriminant1680130777.79%QuadraticDiscriminant1680131077.98%LinearSVM1680149088.70%QuadraticSVM1680156292.97%CublicSVM1680156593.15%FineGaussianSVM1680107564.00%MediumGaussianSVM1680154792.08%CoarseGaussianSVM1680144686.07%FineKNN1680156292.97%MediumKNN1680151890.36%CoarseKNN1680139482.97%CosineKNN1680152390.65%CublicKNN1680150689.64%WeightedKNN1680155592.56%BoostedTrees1680148088.10%BaggedTrees1680158994.58%SubspaceDiscriminant1680141784.35%SubspaceKNN1680158094.05%RUSBoostedTrees1680145686.67%表4-3为对1680张样本进行分类预测的结果,测试了22种传统分类器,由上表可知,FineGaussianSVM、SimpleTree、LinearDiscriminant、QuadraticDiscriminant等4种分类器对葡萄病害的分类精确度均低于80%,其中,FineGaussianSVM识别效果较差,识别率低于70%。而支持向量机中QuadraticSVM、CublicSVM、MediumGausianSVM、最近邻分类器中的FineKNN、CosineKNN、WeightedKNN、集成分类器中的BaggedTrees、SubspaceKNN等8种分类器的分类准确率均高于90%,其中BaggedTrees识别效果最好,正确识别率为94.58%。故选用BaggedTrees用于后续葡萄病害类型识别。表4-4BaggedTrees分类器识别测试集样本的分类结果Tab.4-4IdentificationResultsoftestsetsbasedonBaggedtrees病害名称样本数正确识别数识别率%白粉病857992.94褐斑病706187.14黑痘病685682.23霜霉病867587.21灰霉病554785.45炭疽病564682.14平均识别率42036886.67测试集中,白粉病样本数量85幅、褐斑病70幅、黑痘病68幅、霜霉病8635 甘肃农业大学2018届硕士学位论文幅、灰霉病55幅、炭疽病56幅。按照上述同样的方法提取测试集样本特征参数[73]后,利用训练好的BaggedTrees分类器进行病害分类测试取平均,试验结果如表4-3所示,对测试集6类病害样本平均识别率为86.67%,每种病斑识别率均高于82%;白粉病识别效果最为显著,识别率为92.94%;褐斑病、霜霉病、灰霉病的识别率均为85%以上。由于本文只选用颜色和纹理特征,对病斑形状比较规则的黑痘病识别效果稍差,识别率为82.14%。而加上形状特征,对于形状变化大的病害如灰霉病、白粉病等则识别效果会显著下降,故本文为采用形状特征。此外,测试了500幅负样本,正确识别数为487,BaggedTrees分类器能很好地将病害与非病害区分开来,对套袋、土地、无病叶片、葡萄枝干等非病斑样本,识别准确率达97.91%。本章节通过对葡萄常见的6种病斑在颜色、纹理方面特征差异进行数字图像分析,研究了葡萄病害的识别技术。主要研究结论如下,通过进行试验表[74-75]明,对于所提取特征,测试的决策树、判别分析、支持向量机、最邻近分类器和集成分类器等5大类22种分类器中,集成分类器中的Baggedtrees分类器对测试的6种葡萄病害样本识别效果最好,平均识别率可达86.67%。基于色度的彩色纹理特征能有效地表征葡萄病害图像的本质特征,对葡萄病害识别有较高的正确识别率和较好的稳定性。且在病害识别过程中发现,利用完整的病害叶片图像的识别率与利用病斑叶片局部病害图像的识别结果相比,并没有得到显著提高。在葡萄病害识别过程中,特别是目标病害种类较多的情况,用颜色、纹理特征来识别病斑效果较好,但对于某些颜色非常相似的不同病害,本文采用的方法还不能很好区分,应提取病斑其它特征才可能提高识别率,这方面的工作有待未来进一步深入研究。36 甘肃农业大学2018届硕士学位论文第五章葡萄叶片病害的全自动识别方法前文方法使用的数据集样本均为从获取的病害叶片原图中手动截取的病斑样本,操作复杂,耗时较长,且需要人工介入,无法实现病害的全自动识别,在实际农业生产过程中难以推广。因此,本章节将分别尝试使用传统分类器和卷积神经网络模型,对获得的包含复杂自然背景的完整病害叶片原图进行病害的全自动识别方法研究。全自动识别方法实现流程如下图所示。病害图像的获取图像中叶片的自动检测叶片区域FasterR-CNN病斑区域提取病斑检测方法一病斑样本CNNs特征提取方法三BaggedTrees方法二图5-1病害全自动识别流程图Fig.5-1ExamplesofFasterR-CNNfordetectingdiseasesinleaves5.1方法一:基于FasterR-CNN检测的病害识别方法FasterR-CNN算法是RossB.Girshick(2016)在RCNN和FastRCNN基础上改进后的算法,主要被用在目标检测任务中。在结构上,FasterR-CNN网络整合了特征提取(featureextraction),proposal提取,边框回归(boundingboxregression)和分类(classification)等功能,综合性能和检测速度相比其他算法尤为突出。本章将常用在目标检测任务中FasterR-CNN用于目标识别和分类。37 甘肃农业大学2018届硕士学位论文5.1.1FasterR-CNN全图检测本章节的病害检测在叶片检测的基础上进行的,首先用FasterR-CNN检测图像中葡萄叶片区域,用一个矩形边框将叶片在图像中所在位置围住,给出矩形边框在图像中的坐标,并贴上叶片所属的类别标签,然后从检测到的叶片图像中检测病斑,从而避免复杂背景中无效区域造成的误检测和误识别。具体实现过程为:(1)输入层为原始葡萄叶片图像;(2)在卷积操作中进行原始特征提取,选用ImageNet上常见的卷积神经分类网络,如VGG-16网络,产生不同特征图;(3)在VGG-16网络最后一层卷积层上提取特征图后,使用RPN生成建议区域,将生成的建议区域与ROI池化层中特征图进行定位,经过两个全连接层得到两个输出结果;(4)使用softmax函数做叶片识别(分类);叶片的边框回归(包围叶片的方框的坐标)。在完成检测后,每一个目标的检测结果用集合D表示,通过对集合D中检测结果按照得分排序,选择分数最高的检测框并跳过与前一个标定框重合率大于50%的检测框。本章节病斑检测的方法以6533张矩形框标记过的病斑图像作为样本,即样本集C,(褐斑病1074张,白粉病1092张,霜霉病1052张,黑痘病1066张,炭疽病1068张,灰霉病1027张,负样本959张),测试集2217张(褐斑病503张,白粉病523张,霜霉病541张,黑痘病515张,炭疽病500张,灰霉病433张,负样本510张)。默认单张样本中只单独包含一种病害。FasterR-CNN检测病害结果如图5-2所示。(a)白粉病(b)灰霉病38 甘肃农业大学2018届硕士学位论文(c)黑痘病(d)褐斑病图5-2FasterR-CNN检测叶片中病害示例Fig.5-2ExamplesofFasterR-CNNfordetectingdiseasesinleaves图中5-2中不同颜色的矩形框表示6种不同的病害类型,分别是葡萄褐斑病,白粉病,霜霉病,灰霉病,炭疽病,黑痘病;绿色矩形框为模型检测到的白粉病区域,橘色矩形框为灰霉病区域,红色矩形框为褐斑病区域,白色矩形条为模型给出的病害类型标签以及得分。图5-2(a)、5-2(b)为检测效果较好示例,准确判定叶片中病害的类型。而对于样本包含复杂背景的情况下,容易造成误检测,如图5-2(c)所示,单个叶片样本中,检测出多种病害并且包含多种病害标签,灰霉病、炭疽病、黑痘病、白粉病。如图5-2(d)所示背景中地面被误检为白粉病,同时检测结果输出3种病害标签。5.1.2两种分类策略由于单张葡萄叶片上可能存在多种病病斑,系统也可能会存在少部分病害类型误识别,因此本文基于FasterR-CNN检测的方法设计两种分类策略,即建议框数目策略与面积策略。(1)建议框数目策略:单张叶片样本中模型检测到的病害类别数目,即单类病害数目最大种类即为样本所属病害类别。(2)建议框面积策略:单张叶片样本中模型检测到的病害建议框面积,即单类病害面积总和最大类为样本所属病害类别。取阈值为0.3时,模型识别结果如下表所示。39 甘肃农业大学2018届硕士学位论文表5-1基于检测框数目策略的识别结果Tab.5-1IdentificationResultsbasedonthenumberofdetectionboxstrategy病害名称样本数正确识别数识别率%白粉病52336469.59褐斑病50315029.8黑痘病51517233.47霜霉病54120638.12灰霉病4339521.94炭疽病5007314.52由上表可知,对于被测试6种病害样本,FasterR-CNN直接检测叶片中病斑,并根据输出的各类标签的检测框的个数判断样本病害类型,其中,白粉病识别率最高,为69.59%;炭疽病识别率最低,为14.52%,其他4种病害识别率也均低于40%。的方法。表5-2基于检测框面积策略的识别结果Tab.5-2RecognitionResultsbasedonthedetectionboxareastrategy病害名称样本数正确识别数识别率%白粉病52336068.78褐斑病50314629.06黑痘病51515730.56霜霉病54119736.40灰霉病4338920.46炭疽病5005611.25由表5-2可知,对于被测试6种病害样本,FasterR-CNN直接检测叶片中病斑,并根据输出的各类标签的检测框的总面积大小判断样本病害类型,其中,白粉病识别率最高,为68.78%,炭疽病识别率最低,为11.25%,褐斑病、黑痘病、灰霉病和霜霉病4种病害识别率均低于37%。由于原图中有大量的无效区域(叶片外的区域),在检测器对病害建议区域打分时,部分的背景区域在卷积特征上与病害区域相似,即检测器错把背景区域当作病害,采用目标检测基础上的识别方法效果误差较大。植物叶片中病斑在生长过程中,同种病斑之间不规则变化,呈现的形状和外观特征也不能保持稳定,可辨别性能差,葡萄叶片表面病害区域分布不均匀且没有固定的形状,单个病斑在叶片中较小密集,对于目标检测任务而言,待检测目标可能出现在图像中的任何一个位置,较小的病害区域难被计算机所识别。当前的研究现状显示,对图像中小目标的检测任务研究较少,小目标在图像中所表现信息太少,在目标与背景的图像特征区别不明显的情况下,算法容易将检测区域与背景区域混淆。在物体检测识别挑战赛中所使用的单张图像中40 甘肃农业大学2018届硕士学位论文[76]一般有2~3个目标,且同类物体形状规则,差异性较小。在葡萄病害识别过程中,对于如黑痘病前期病斑和小褐斑病病斑等外部特征非常相似的不同病害,特别是目标病害种类较多的情况,本文采用的方法还不能很好区分,需要进一步改进,但检测病害叶片中病斑区域的方法为后面试验中自动提取叶片病斑区域提供依据。5.2方法二:基于FasterR-CNN+BaggedTrees的病害识别前文中利用FasterR-CNN检测数据集B中样本的病害叶片,并根据叶片上病斑区域的类别标签通过两种策略判断样本的病害种类,效果并不理想。第四章第一节针对人工截取叶片病斑样本采用传统机器视觉方法进行病害识别测试,测得集成分类器中的BaggedTrees分类器对手工截取的病斑样本平均识别率达到86.67%,故本章选用BaggedTrees分类器进行识别测试。首先利用FasterR-CNN检测数据集B样本中的叶片区域,然后对叶片区域进行病斑区域检测,有效避免了复杂背景中大量无效区域对于病斑检测的干扰,保留叶片中最左上角和右下角的病斑检测框,并根据两个检测框的坐标保留病斑区域的最大外接矩形,实现过程如图5-3所示,最终获得的叶片上病害区域外接矩形用于病害种类识别。224×224224×224图5-3叶片病斑区域外接矩形实现过程Fig.5-3Therealizationprocessofouterrectangleofleafdiseasespotarea获得的新样本组成数据集D,即自动检测的病斑区域样本。将6533张样本用于训练,(褐斑病1074张,白粉病1092张,霜霉病1052张,黑痘病1066张,炭疽病1068张,灰霉病1027张,负样本959张),测试集2217张(褐斑病503张,白粉病523张,霜霉病541张,黑痘病515张,炭疽病500张,灰霉病433张,负样本510张)。默认单张样本中只单独包含一种病害。41 甘肃农业大学2018届硕士学位论文BaggedTrees分类器识别6种完整染病叶片样本的分类结果如表5-3所示。表5-3BaggedTrees识别自动提取病斑样本的结果Tab.5-3IdentificationResultsofautomaticextractionofspotsbasedonBaggedTrees病害名称样本数正确识别数识别率%白粉病52346889.48褐斑病50325851.29黑痘病51532963.88霜霉病54147587.80灰霉病43331372.29炭疽病50038877.60平均识别率3015223173.99由表5-3可知,BaggedTrees分类器对测试集6类病害样本平均识别率为73.99%,其中白粉病识别效果最为显著,识别率为89.48%,霜霉病的识别率超过87%。另外,还测试了510张负样本,正确识别出461张,识别率为92.2%。由于该方法使用FasterR-CNN检测数据集B中病害样本得到的病斑区域作为样本,可能包含无病害的健康叶片、葡萄果实、葡萄枝干藤蔓、葡萄果实套袋、土[77]地、栅栏等复杂背景,因此提取颜色和纹理特征的可能包含无效区域的信息,因此在分类器对自动检测获得病斑区域样本进行目标判断时,造成整体识别精度过低。对于白粉病和霜霉病这两种发病时占叶片表面面积较大的病害识别效果较好,识别率分别为89.48%和87.80%,而对于发病时病斑区域小又稀疏的黑痘病和褐斑病,识别效果较差。5.3方法三:基于深度学习模型的病害识别方法前文尝试使用传统机器视觉的方法和深度学习的方法,分别对人工截取叶片染病区域样本进行了测试,本章将采用AlexNet、Vgg-16、Vgg-19、GoogLeNet和ResNet50对数据集D,即方法二中FasterR-CNN检测得到的叶片中病斑区域样本,实现全自动病害识别。分别使用6533张样本(褐斑病1074张,白粉病1092张,霜霉病1052张,黑痘病1066张,炭疽病1068张,灰霉病1027张,负样本959张)训练5种网络,并测试6种病害及负样本2217张(褐斑病503张,白粉病523张,霜霉病541张,黑痘病515张,炭疽病500张,灰霉病433张,负样本510张)。默认单张样本中只单独包含一种病害。42 甘肃农业大学2018届硕士学位论文训练前将图像样本调整到符合网络的输入的尺寸,如AlexNet网络图像样本输入尺寸为227×227像素,Vgg-16、Vgg-19、GoogLeNet、网络的图像样本尺寸为224×224像素。学习率为0.00001,迭代次数为Epoch10,即最大迭代次数为4210。ResNet50网络学习率设置为1e-7,Epoch200,最大迭代次数为65400。5种网络训练参数如图5-6所示。(a)AlexNet训练过程参数曲线图(b)Vgg-16训练过程参数曲线图(c)Vgg-19训练过程参数曲线图43 甘肃农业大学2018届硕士学位论文(d)GoogLeNet训练过程参数曲线图(e)ResNet50训练过程参数曲线图图5-65种网络训练参数曲线图Fig.5-6TrainingProgressoftheCNNs由图5-6可知,相同的训练样本和迭代次数,Vgg-16和Vgg-19网络的精确度曲线和损失曲线较好。当迭代次数到Epoch6时,预测精确度接近100%,迭代次数到达Epoch6以后,精确度平缓趋于稳定。红色曲线图为对应的迭代次数与损失的关系曲线,Epoch3之前迅速下降,随着迭代次数的增加,损失逐渐平缓下降。当迭代次数到Epoch6时,损失接近0,迭代次数到达Epoch6以后,损失曲线趋于稳定。AlexNet波动幅度较大,迭代次数在Epoch9以后,精确度曲线趋于稳定,损失曲线趋于0。而GoogLeNet、ResNet50网络在整个训练过程中波动较大,故预测精度曲线和损失曲线较为密集,且两模型的预测精度在80%浮动,损失曲线趋于0.5。将数据集C,即自动检测的病斑区域样本中测试集样本,共3525张(褐斑病503张,白粉病523张,霜霉病541张,黑痘病515张,炭疽病500张,灰霉44 甘肃农业大学2018届硕士学位论文病433张,负样本510张)分别测试5种网络,得到6种葡萄病害识别结果如下表所示。表5-55种网络病害识别结果Tab.5-55Identificationresultsofnetworkdiseases模型名称样本数正确识别数识别率%AlexNet3525319288.60Vgg-163525332094.48Vgg-193525331694.12GoogLeNet3525304486.52ResNet503525309587.99实验结果表明,测试的5种网络模型中,Vgg-16表现出卓越的识别性能,对测试的6种葡萄病害正确识别率达94.48%;Vgg-19对葡萄病害样本的正确识别率为94.12%;Alexnet、GoogLeNet、ResNet50模型对FasterR-CNN模型检测的病害区域样本的识别率均高于86%。5种网络识别效果如图5-7所示,以同一炭疽病样本为例。(a)AlexNet(b)Vgg-16(c)Vgg-19(d)GoogLeNet45 甘肃农业大学2018届硕士学位论文(e)ResNet50图5-75种网络模型识别炭疽病结果示例Fig.5-7IdentificationResultsbasedon5CNNs如图所示,图5-7(a)~(e)为5种网络识别葡萄炭疽病示例,样本图像上方黑色文本为网络预测的病害标签,以及预测概率;条形统计图的纵坐标表示网[78]络预测的Top5类别,横坐标表示该网络将样本预测为每种类别的概率。例,图5-7(a)中,对于测试使用的FasterR-CNN自动检测的炭疽病样本图像,AlexNet网络对该样本的识别结果为炭疽病,预测概率为96.4%,对该样本预测Top5类别为炭疽病、霜霉病、白粉病、灰霉病、黑痘病,其概率均小于20%。5.3.1混淆矩阵在使用机器学习做图像识别任务时,混淆矩阵(ConfusionMatrix)作为一[77]种可视化工具,可以直观地把分类结果的精度显示在一个混淆矩阵里面,比较分类结果和实际测得值,因此常被用在多分类问题中,来评价模型的精度。在混淆矩阵中,数据被划分为类i(输出类),实测为类j(目标类/观察值)的样[78-79]本数量,在测试样本总量所占的百分比。本文对白粉病、炭疽病等6常见种病害样本(共3015张样本图像)以及负样本510张的识别结果,生成5个网络模型的混淆矩阵如下图所示。46 甘肃农业大学2018届硕士学位论文(1)AlexNet炭疽病88.60%2.20%1.00%1.00%0.20%7.00%88.60%11.40%灰霉病6.00%92.38%1.15%1.62%0.23%0.23%92.38%7.62%褐斑病7.16%1.79%78.33%1.39%11.93%78.83%21.17%炭疽病4431144135霜霉病2.03%1.66%9.98%82.99%2.40%3.92%82.99%17.01%灰霉病26400511TrueClass褐斑病366394760白粉病2.68%97.32%97.32%2.68%霜霉病11954449135TrueClass黑痘病0.78%4.47%0.19%94.56%94.56%5.44%白粉病14509黑痘病4231487正常叶片100%100%0.00%正常叶片510炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片TrueFalsePredictedClassPostiveNegative炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片PredictedClassRateRate图5-8AlexNet识别结果的混淆矩阵Fig.5-8ConfusionMatrixoftheAlexNet如图所示,本方法识别3015个病害样本以及510个负样本图像的结果。其中,横坐标表示预测类,纵坐标表示样本真实类别,矩阵内各单元格对应模型输出某类别病害的预测结果。由左图可知用于测试的6种病害样本和负样本数目,每种病害分类预测为其他类别的样本数量。右图中每个单元格表示该方法对6种病害样本预测概率。由图可知,该方法对灰霉病、白粉病、黑痘病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率高达97.32%。此外,该方法能有有效区别病害样本和健康叶片、果实、茎秆、地膜等负样本,对正常无病叶片的识别率为100%。由于褐斑病病斑为直径2~3mm的褐色小圆斑且分布零散,同一叶片上可能同时出现数十个病斑,实验所用的样本C来自于FasterR-CNN检测的叶片上病斑区域,检测时单个病斑目标较小,且分布零散,容易出现误检测,故褐斑病的识别效果较差,识别率低于80%,主要误识别为黑痘病和炭疽病。47 甘肃农业大学2018届硕士学位论文(2)Vgg-16炭疽病91.20%0.40%1.20%0.20%7.00%91.12%8.88%灰霉病4.00%94.10%1.39%0.23%94.10%5.90%褐斑病3.98%92.45%3.60%92.45%7.55%炭疽病45626135灰霉病1940761霜霉病1.67%0.74%4.80%88.17%3.88%0.74%88.17%11.83%褐斑病2046518TrueClass白粉病0.38%99.62%99.62%0.38%霜霉病9426477214TrueClass白粉病2521黑痘病0.78%2.70%0.39%96.12%96.12%3.88%黑痘病4142495正常叶片0.19%99.80%99.80%0.19%正常叶片1509炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片TrueFalse炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片PostiveNegativePredictedClassPredictedClassRateRate图5-9Vgg-16识别结果的混淆矩阵Fig.5-9ConfusionMatrixoftheVgg-16由图5-9左图可知用于测试的6种病害样本为3015个病害样本,负样本510个,以及每种病害分类预测为其他类别的数目。右图中每个单元格表示该方法对6种病害样本预测概率。由图可知,该方法对炭疽病、灰霉病、褐斑病、白粉病、黑痘病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率为99.62%。此外,该方法能有有效区别病害样本和叶片、果实、茎秆、地膜等负样本,对正常无病叶片的识别率高于99%。由于霜霉病发病时,葡萄叶片正反面症状外观特征区别较大,叶片正面为边界不明显,形状不规则的黄绿色病斑,大病斑对应的叶片背面(叶脉侧)为白色霜状霉层与白粉病相似不易区分,当病害生长到后期是,叶片背面的白色霜状霉层下会长出褐色板块,此时外部特征类似褐斑病,故该方法对霜霉病识别率为88.17%,识别效果相对较差,主要误识别为褐斑病和白粉病。本方法的识别在检测的基础上进行,即对检测到的叶片区域进一步进行病斑检测,将大片病斑区域作为样本,对于单个病斑体积小分布密集的病害,如褐斑病,黑痘病等有很好的识别效果。与前文中手工截取单个病斑区域样本的病害识别相比,6种病害的识别率均有提高。48 甘肃农业大学2018届硕士学位论文(2)Vgg-19炭疽病91.60%0.80%0.40%0.40%6.80%91.60%8.40%灰霉病3.00%95.84%0.23%0.23%0.69%95.84%4.16%炭疽病45842234褐斑病7.16%0.60%87.48%0.80%3.98%87.48%12.52%灰霉病13415113霜霉病2.22%0.92%2.40%90.20%3.51%0.74%90.20%9.80%褐斑病363440420TrueClass白粉病0.19%0.78%99.04%99.04%0.96%霜霉病12513488194TrueClass白粉病142518黑痘病0.58%4.08%0.19%0.19%94.95%94.95%5.05%黑痘病32111489正常叶片0.39%99.61%99.61%0.39%正常叶片2508炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片TrueFalse炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片PredictedClassPostiveNegativePredictedClassRateRate图5-10Vgg-19识别结果的混淆矩阵Fig.5-10ConfusionMatrixoftheVgg-19由图可知,Vgg-19网络对炭疽病、灰霉病、褐斑病、白粉病、黑痘病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率为99.04%。此外,该方法能有有效区别病害样本和叶片、果实、茎秆、地膜等负样本,对正常无病叶片的识别率高达99.61%。由于小褐斑病病斑为直径2~3mm的褐色小圆斑且分布零散,实验所用的样本C来自于FasterR-CNN检测的叶片上病斑区域,检测时单个病斑目标较小,样本中大部分区域为无效,故褐斑病的识别效果与其他5类相比较差,识别率为87.48%,主要误识别为黑痘病和炭疽病。(4)GoogLeNet炭疽病79.00%7.40%2.40%1.00%2.40%7.80%79.00%21.00%灰霉病2.77%93.30%0.46%0.99%93.30%6.70%炭疽病395371251239褐斑病6.76%6.16%72.20%3.38%2.39%9.15%72.20%27.80%灰霉病124042105霜霉病2.03%4.99%9.06%73.20%8.87%1.48%0.37%73.20%26.80%褐斑病3431363171246TrueClass霜霉病1127493964882白粉病0.38%0.19%0.76%98.10%0.57%98.10%1.90%TrueClass白粉病2145133黑痘病2.91%6.60%0.39%0.19%89.90%89.90%10.10%黑痘病153421463正常叶片100%100%0.00%正常叶片510炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片TrueFalse炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片PredictedClassPostiveNegativePredictedClassRateRate图5-11GoogLeNet识别结果的混淆矩阵Fig.5-11ConfusionMatrixoftheGoogLeNet[80]由图中混淆矩阵可知,GoogLeNet网络对灰霉病、白粉病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率为98.10%,灰霉病的识别率为93.30%。黑痘病的识别效果也较为显著,正确识别率为89.90%。而炭疽病、褐49 甘肃农业大学2018届硕士学位论文斑病、霜霉病的识别效果较差,低于80%,其中炭疽病主要误识别为灰霉病和黑痘病,褐斑病主要误识别为黑痘病,霜霉病主要误识别为白粉病,误识别率为白粉病的概率为9.06%。此外,该方法对正常无病叶片的识别率高达100%。(5)ResNet50炭疽病84.20%4.28%3.80%0.60%0.40%7.40%84.20%15.80%灰霉病2.50%95.12%1.39%0.92%95.12%4.88%炭疽病42118193237褐斑病6.96%3.58%78.33%0.60%2.19%3.98%78.33%21.67%灰霉病114126104霜霉病1.84%2.59%14.05%76.52%4.25%0.74%76.52%23.48%褐斑病351839431142TrueClass白粉病1.53%1.34%1.53%95.60%95.60%4.40%霜霉病101476414234TrueClass白粉病8785003黑痘病0.97%12.43%0.19%0.19%86.12%86.12%13.88%黑痘病36411444正常叶片100%100.00%0.00%正常叶片510炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片TrueFalsePredictedClassPostiveNegative炭疽病灰霉病褐斑病霜霉病白粉病黑痘病正常叶片PredictedClassRateRate图5-12ResNet50识别结果的混淆矩阵Fig.5-12ConfusionMatrixoftheResNet50由图可知,ResNet50网络对灰霉病、白粉病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率为95.60%。此外,炭疽病和黑痘病的识别率也高于80%,分别为84.3%和86.12%。霜霉病和褐斑病的识别效果较差,分别为78.33%和76.52%。此外,该方法对正常无病叶片的识别率高达100%。ResNet50网络对葡萄病害的识别效果与Vgg-16、Vgg-19的识别效果相比略差。50 甘肃农业大学2018届硕士学位论文第六章总结与展望近些年来,随着现代农业科技的发展,一大批新兴农业科学技术被越来越多的研究探索者所挖掘,一些新的名词被大家所知晓,其中就有深度学习。深度学[82][83][84-85]习从2013年以来,被大量运用于手写字体识别,人脸识别,目标检测等,与传统的数字图像处理相比,深度学习不但在处理图像的颜色、纹理、形态等传统特征提取的特性上有较好的效果,而且由于深度学习所具有的深层网络结构,通过大量的同类型的图像学习,使得除了在颜色、纹理、形状上具有很好的学习能力,更强的是可以通过对整张图片记忆学习,当一类图像足够多时,该种学习能力产生的实际效果将被深度学习的卷积层、池化层网络层层学习达到最优的结果。本文以常见的6种葡萄叶部病害(白粉病、褐斑病、霜霉病、灰霉病、黑痘病、炭疽病)为研究对象,采用传统计算机视觉技术和深度学习技术,对自然条件下葡萄叶部6种病害进行识别和诊断的研究。6.1总结本论文的主要内容如下:(1)阐述了农作物病害识别技术这一研究课题研究的背景,人民生活水平和生活方式发生改变,葡萄酒产业迅猛发展,葡萄日益规模化、集约化种植给葡萄病害防治带来新的挑战。为了控制病虫害问题,确保葡萄质量和生态环境安全,避免病虫害给果农造成损失扩大和促进增收,发展以机器视觉技术为基础的病害识别和诊断技术具有重要的现实意义。通过探讨本论文的目的与意义,说明病害识别在现代农业中重要作用,并详细介绍了国内外在图像病害分割和识别领域国内外研究状况和目前主流方法;(2)从传统机器学习分类技术和深度学习两方面,介绍了图像识别与机器视觉技术的理论基础,以及常用的卷积神经网络模型。在传统机器学习部分,简要论述了常用在分类识别任务中的分类器,如决策树、K-近邻分类器、支持向量机和集成学习等;然后又对深度学习中AlexNet、Vgg-16、Vgg-19、GoogLeNet、ResNet50以及FasterR-CNN模型做了简要介绍;51 甘肃农业大学2018届硕士学位论文(3)介绍了采集图像数据所使用的设备、图像样本的采集方法、实验所需数据集A、B的制作方法以及样本不足时采用的拓展数据集的方法等。首先对采集的葡萄病害叶片图像进行数据增强处理,在不改变研究对象的属性和类别的前提下,采用镜像翻转、随机裁剪、添加颜色扰动和噪声等方法扩充样本数量,解决数据集样本数量不足问题和提高机器学习分类器的泛化能力;(4)手动截取包含病害边缘信息的病斑区域作为实验样本,分别使用22种传统分类器和CNN方法对葡萄常见的6种病斑样本进行病害识别测试;首先根据6种葡萄病害在颜色、纹理方面特征差异提取特征,测试了22种传统机器分类器,并根据各种分类器的识别精确度选择出识别率最高、最适合于葡萄病害分类的分类器,实验结果表明,传统分类识别方法中的BaggedTrees分类器对于基于色度的彩色纹理特征的葡萄病害图像有很好的识别效果,相比较其他分类器,该分类器对葡萄病害识别有较高的识别率和鲁棒性;(5)本文尝试了3种病害全自动识别方法。首先通过FasterR-CNN检测图像的叶片区域,根据FasterR-CNN输出的带有各类病害标签的检测框的数目和面积来实现自动识别病害种类,效果不佳,但为后续实验提供思路。方法二,利用FasterR-CNN先检测叶片区域,然后从叶片区域检测病斑区域作为实验样本,数据集C,自动提取彩色病斑样本的颜色和纹理特征并使用传统分类器BaggedTrees进行识别。方法三测试了AlexNet、Vgg-16、Vgg-19、GoogLeNet、ResNet50等5种深度学习网络,实验样本来自数据集C。实验结果表明,传统分类技术对包含复杂背景的染病叶片样本的分类性能未有显著提高,正确识别率为73.74%,而Vgg-16则表现出优越性,正确识别率为87.38%。该方法对炭疽病、灰霉病、褐斑病、白粉病、黑痘病的识别效果较好,正确识别率均高于90%,其中白粉病的识别率达99.62%。改进后的目标检测基础上的识别方法,有效的避免了由于原图中有大量的无效区域(叶片外的区域),在检测器对病害建议区域打分时,部分的背景区域在卷积特征上与病害区域相似,即检测器错把背景区域当作病害的弊端,有效的降低了复杂背景因素和无效区域干扰造成的误检测与误识别。52 甘肃农业大学2018届硕士学位论文6.2展望随着科学技术的迅猛发展,用于深度学习的图像目标识别算法日臻完善,针对本文中的问题和不足,可从以下几个方面着手:(1)本文在使用传统机器学习方法对葡萄常见的6种病斑种分类时,仅在颜色、纹理方面特征差异进行数字图像分析,提取特征时也仅提取了颜色和纹理两个维度的特征,对于外观区别较大的病害分类效果良好;但当单张样本中目标病害种类较多,且目标病害的颜色非常相近或相似时,本文采用的方法不能很好区分,此时应考虑提取病斑其它特征提高分类器的识别率;(2)在使用FasterR-CNN对完整病害原图检测,由于原图中有大量的无效区域(叶片外的区域),在检测器对病害建议区域打分时,部分的背景区域在卷积特征上与病害区域相似,即检测器错把背景区域当作病害,采用基于目标检测的分类方法效果误差较大。在叶片检测结果中将各个叶片区域提取出,将它们分别输入到病害检测器中,即将单个叶片作为独立图像输入到检测器,可以放大叶片及病害区域尺寸,提高病害检测精度高;或者在检测出的叶片位置构建叶片掩[86]膜,将整幅掩模图像输入到病害检测器,对一幅图像只需进行一次病害检测,较大提升检测速度;(3)实现软硬件的结合,将现有的葡萄病害识别算法通过Java语言,嵌套到安卓开发的手机APP中,实现在线病虫害诊断和识别,或者开发病虫害智能[87-89]诊断机器人,农业采摘机器人等等,方便农民及时发现、预防和控制农作物病虫害问题,正确合理的选择和喷洒农药,确保农作物植株生长过程的免受病虫侵害,保证农产品质量和农业生态环境安全,促进农业增产增收,避免资源浪费和农药污染。53 甘肃农业大学2018届硕士学位论文致谢本学位论文受到国家自然科学基金项目“61461005(项目编号:61461005)”资助。从前不知毕业论文后面致谢的意义是什么,直到自己毕业临近,才明白毕业论文以及致谢,记录了三年时光,关于学习、生活的点点滴滴和足迹,承载了三年的回忆。趁着热情还未退却,认真的写这篇致谢,为三年的研究生生活存些余温,以便将来回忆时有迹可循。这是一个春水初生的三月正午,独自坐在504实验室,春天在朋友圈里,窗外的兰州依旧沉睡在烟灰色的薄暮里,春天似乎迟迟不肯醒来。在研究生学习和学位论文创作的3年中,我是幸运的,我得到了很多很多的领导、老师和同学还有亲人的关怀和帮助。在学位论文即将定稿之际,我在此衷心地向他们表达最诚挚的谢意!首先我要由衷地感谢我的导师冯全老师,谢谢我的恩师!从确立基于机器学习的葡萄病害识别方法为研究方向、查阅文献了解作物病害诊断识别研究现状、研究开展、论文写作投稿返修发表以及学位论文创作修改到定稿,每个环节都得到了冯老师的细致关怀和指导。冯老师是至今我所有老师中最为博学谦恭的一位,他严谨的治学态度、实事求是的科研精神以及励精勤勉的职业操守让我敬佩。从冯老师身上我学到的是淡泊名利、高屋建瓴的科研工作者,“师者,所以传道授业解惑也”,冯老师在传授我知识,教导我学习和获取知识的方法的同时,对我的世界观人生观价值观的影响非常巨大。师恩如辉,高山仰止!我要衷心感谢,我实验室的同门,三年来对我学习和生活上的帮助和指导。感谢我的师兄,504实验室的师兄师姐杨森和赵金阳,在两年相处中有问必答,帮助我在图像处理和机器视觉方面启蒙和入门。感谢我的同门赵晓刚,在我的实验过程中的程序方面的指导以及毕业前的赠言,难得的诤友。感谢我的同级热情严谨执着的李凯,虽然两年来在一起学习的时间不多,但是从远在北京的他身上学到的为人处事,钻研学术,拼搏执着,影响着我未来的人生态度,从他身上,我理解了一个道理,“怕什么真理无穷,近一寸有一寸的欣喜”。我还要感谢我可54 甘肃农业大学2018届硕士学位论文爱的学弟学妹们,知识渊博,涉猎广泛,计算机软件无不精通,做事耐心沉稳的赵兵;开朗健谈,做事认真踏实,热心周到的乔虹和刘洋,感谢他们在我研究生三年中对我的影响和帮助。我还要特别感谢在学术上给予我最多帮助,风里雨里三年陪伴的基友刘阗宇,是他教会我“知行合一”的道理。我还要感谢我最可爱的室友们,李晓含,王菲,王雅云,感谢她们三年来对我所有的包容和关爱。最后,我要感谢我的父母对我的关心,对我一如既往的支持。我深知,我所有的岁月静好背后,是我的父母在替我负重前行。感谢他们用亲情和爱鼓励我永不言弃和奋勇前行。三年来对我学习和生活上的帮助和指导过的领导和老师们,我一定要像你们一样,怀着一颗感恩的心满腔热忱地去服务和回馈社会。随着年龄和时间的增长,经历过多次毕业,热情消退和回归平静,看着那些停在通讯录里不再跳动的窗口,越发明白遗忘是多么可怕。木芙蓉一季开过一季,等到有一天,过往不来惊扰三更的清梦,人和事像被夕阳拉长的影子,不再被记清。而曾经珍惜的人会像是流感一样悄无声息地侵入我们的生活,影响着我们,于是,世界就像被移动过的复写纸,发生了一处处细微但不可挽回的变化。然后,我们的一生都带着这些深深浅浅的变化独自行走在路上。很庆幸认识来到这里,很感激遇到我亲爱的导师,同门以及同学们。念研是我到如今最不后悔的决定,这三年对于我多么重要,大家对我的影响多么巨大。也许有一天,当我不经意的场景注意到自己身上的变化,就算记不清这些改变是谁带来的,却依然可以告诉我曾经有一群人出现过并且对我很重要。毕竟,那些或深或浅印记的背后都曾经涌灌过我最热的血,来自我最真的心。谨以此文,致三年来对我学习和生活上的帮助和指导过的领导,老师和同学。祝大家未来的日子里,扶摇直上,晴空万里。55 甘肃农业大学2018届硕士学位论文参考文献[1]亓桂梅,李旋,赵艳侠,等.2017年世界葡萄及葡萄酒生产及流通概况[J].中外葡萄与葡萄酒,2018(1):68-74.[2]张陆阳.中国葡萄种植面积超越法国[J].中外葡萄与葡萄酒,2015(5):64-64.[3]柴阿丽.基于计算机视觉和光谱分析技术的蔬菜叶部病害诊断研究[D].中国农业科学院,2011.[4]刘志华,程鹏飞,黄瓜侵染性病害图像处理及特征值提取方法的研究[J].山西农业大学学报:自然科学版,2006,26(4):351-354.[5]YutakaSasaki,TsuguoOkamoto,KenjiImov,etal.Automaticdiagnosisofplantdiseaserecognitionbetweenhealthyanddiseasedleaf[J].JournalofTSAM,Japan,1999,61(2):119-126.[6]El-HellyM,El-BeltagyS,RafeaA.Imageanalysisbasedinterfacefordiagnosticexpertsystems[C]//ProceedingsoftheWinterInternationalSynposiumonInformationandCommunicationTechnologies,TrinityCollegeDublin,2004,1-6.[7]SammanyM,MedhatT.Dimensionalityreductionusingroughsetapproachfortwoneuralnetworks-basedapplications[A].RoughSetsandIntelligentSystemsParadigms[M].Heidelberg:SpringerBerlin,2007,639-647.[8]MohantySP,HughesDP,MarcelS.UsingDeepLearningforImage-BasedPlantDiseaseDetection:[J].FrontiersinPlantScience,2016,7.[9]RamcharanA,BaranowskiK,MccloskeyP,etal.DeepLearningforImage-BasedCassavaDiseaseDetection.[J].FrontiersinPlantScience,2017,8.[10]赖军臣,李少昆,明博,等.作物病害机器视觉诊断研究进展[J].中国农业科学,2009,42(4):1215-1221.[11]陈佳娟,纪寿文,李娟,等.采用计算机视觉进行棉花虫害程度的自动测定[J].农业工程学报,2001,17(2):157-160.[12]张长利,房俊龙,潘伟.用遗传算法训练的多层前馈神经网络对番茄成熟度进行自动检测的研究[J].农业工程学报,2001,17(3):153-156.56 甘肃农业大学2018届硕士学位论文[13]徐贵力,毛罕平,李萍萍.差分百分率直方图法提取缺素叶片纹理特征[J].农业机械学报,2003,34(2):76-79.[14]徐贵力,程月华,毛罕平.基于遗传算法的番茄缺素叶片图像特征选择[J].计算机工程,2003,29(11):129-131.[15]毛罕平,徐贵力,李萍萍.番茄缺素叶片的图像特征提取和优化选择研究[J].农业工程学报,2003,19(2):133-136.[16]刘志华,程鹏飞,崔艳丽,等.温室植物病害的图像处理及特征值提取方法的研究(一)——基于图像预处理的特征值提取方法的研究[C]//2005年中国农业工程学会学术年会.2005.[17]王克如.基于图像识别的作物病虫草害诊断研究[D].中国农业科学院,2005.[18]田有文,李天来,李成华,等.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180.[19]田有文,牛妍.支持向量机在黄瓜病害识别中的应用研究[J].农机化研究,2009,31(3):36-39.[20]王守志,何东健,李文,等.基于核K-均值聚类算法的植物叶部病害识别[J].农业机械学报,2009,40(3):152-155.[21]管泽鑫,唐健,杨保军,等.基于图像的水稻病害识别方法研究[J].中国水稻科学,2010,24(5):497-502.[22]刘鹏,屠康,徐洪蕊,等.基于支持向量机的甜柿表面病害识别[J].现代食品科技,2011,27(3):349-353.[23]邓继忠,李敏,袁之报,等.基于图像识别的小麦腥黑穗病害特征提取与分类[J].农业工程学报,2012,28(3):172-176.[24]贾建楠,吉海彦.基于病斑形状和神经网络的黄瓜病害识别[J].农业工程学报,2013(S1):115-121.[25]许良凤,徐小兵,胡敏,等.基于多分类器融合的玉米叶部病害识别[J].农业工程学报,2015,31(14):194-201.[26]郭青,王骊雯,董方敏,等.基于方向一致性特征的小麦条锈病与白粉病识别方法[J].农业机械学报,2015,46(1):26-34.[27]孙俊,谭文军,毛罕平,等.基于改进卷积神经网络的多种植物叶片病害识别57 甘肃农业大学2018届硕士学位论文[J].农业工程学报,2017,33(19):209-215.[28]MitchellTM,曾华军,张银奎.机器学习[M].北京:机械工业出版社,2003.[29]周志华.机器学习[D].清华大学出版社,2016.[30]QuinlanJR.Inductionondecisiontree[J].MachineLearning,1986,1(1):81-106.[31]BreimanL.Introductiontreeclassification[J].Classification&RegressionTrees,1984.[32]JainAK,DubesRC.Algorithmsforclusteringdata[J].Technometrics,1988,32(2):227-229.[33]毋雪雁,王水花,张煜东.K最近邻算法理论与应用综述[J].计算机工程与应用,2017,53(21):1-7.[34]FrancoisChollet.DeepLearningwithPython[M].ManningPublications,2017.[35]CortesC,VapnikV.Support-vectornetworks[J].MachineLearning,1995,20(3):273-297.[36]克里斯等.支持向量机导论[M].电子工业出版社,2004.[37]周志华,王珏.机器学习及其应用[M].清华大学出版社,2007.[38]DietterichTG.AnExperimentalComparisonofThreeMethodsforConstructingEnsemblesofDecisionTrees:Bagging,Boosting,andRandomization[J].MachineLearning,2000,40(2):139-157.[39]BelongieS,MalikJ,PuzichaJ.Shapematchingandobjectrecognitionusingshapecontexts[C]//IEEEInternationalConferenceonComputerScienceandInformationTechnology.IEEE,2010:483-507.[40]KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[C]//InternationalConferenceonNeuralInformationProcessingSystems.CurranAssociatesInc.2012:1097-1105.[41]尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015(1):48-59.[42]贾庆超.基于稀疏表示和深度学习分类器的SAR目标图像的分割与分类[D].西安电子科技大学,2017.[43]KrizhevskyA,SutskeverI,HintonGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[C]//InternationalConferenceonNeural58 甘肃农业大学2018届硕士学位论文InformationProcessingSystems.CurranAssociatesInc.2012:1097-1105.[44]孙俊,谭文军,毛罕平,等.基于改进卷积神经网络的多种植物叶片病害识别[J].农业工程学报,2017,33(19):209-215.[45]NohH,HongS,HanB.LearningDeconvolutionNetworkforSemanticSegmentation[C]//IEEEInternationalConferenceonComputerVision.IEEEComputerSociety,2015:1520-1528.[46]BallesterP,AraujoRM.OntheperformanceofGoogLeNetandAlexNetappliedtosketches[C]//ThirtiethAAAIConferenceonArtificialIntelligence.AAAIPress,2016:1124-1128.[47]张川.面向图像分类的深度残差网络优化结构研究[D].中国科学院大学,2016.[48]HeK,ZhangX,RenS,etal.DeepResidualLearningforImageRecognition[J].2015:770-778.[49]陆永帅,李元祥,刘波,等.基于深度残差网络的高光谱遥感数据霾监测[J].光学学报,2017,37(11):306-316.[50]GirshickR,DonahueJ,DarrellT,etal.RichFeatureHierarchiesforAccurateObjectDetectionandSemanticSegmentation[C]//IEEEConferenceonComputerVisionandPatternRecognition.IEEEComputerSociety,2014:580-587.[51]GirshickR.FastR-CNN[C]//IEEEInternationalConferenceonComputerVision.IEEEComputerSociety,2015:1440-1448.[52]RenS,HeK,GirshickR,etal.FasterR-CNN:towardsreal-timeobjectdetectionwithregionproposalnetworks[C]//InternationalConferenceonNeuralInformationProcessingSystems.MITPress,2015:91-99.[53]桑军,郭沛,项志立,等.Faster-RCNN的车型识别分析[J].重庆大学学报:自然科学版,2017,40(7):32-36.[54]黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,36(6):1225-1240.[55]李凯,袁鹤.植物病害生物防治概述[J].山西农业科学,2012,40(7):807-81059 甘肃农业大学2018届硕士学位论文[56]张创新,李俊,蔺锐,等.葡萄果实常见生理病害的识别与预防[J].西北园艺(果树),2017(4):31-33.[57]谭峰,马晓丹.基于叶片的植物病虫害识别方法[J].农机化研究,2009,31(6):41-43.[58]赵庆久,明广增.葡萄常见病害防治技术[J].植物医生,2017,30(6):40-41.[59]李凯,冯全,张建华.棉花苗叶片复杂背景图像的联合分割算法[J].计算机辅助设计与图形学学报,2017,29(10):1871-1880.[60]秦丰,刘东霞,孙炳达,等.基于深度学习和支持向量机的4种苜蓿叶部病害图像识别[J].中国农业大学学报,2017,22(7):123-133.[61]马廷淮,葛荐,王亚里.动作识别训练数据的扩展研究[C]//江苏计算机大会.2010.[62]田有文,李成华.基于图像处理的日光温室黄瓜病害识别的研究[J].农机化研究,2006(2):151-153.[63]杨燕,樊林庆.基于光照变换的Gabor小波人脸识别[J].计算机工程与应用,2016,52(5):220-224.[64]刘涛,仲晓春,孙成明,等.基于计算机视觉的水稻叶部病害识别研究[C]//全国青年作物栽培与生理学术研讨会.2014.[65]ZhangSW,ShangYJ,WangL.Plantdiseaserecognitionbasedonplantleafimage[J].JournalofAnimal&PlantSciences,2015,25(3):42-45.[66]杨森,冯全,杨梅,等.彩色叶片图像除尘算法[J].计算机辅助设计与图形学学报,2016,8,28(8):1224-1231.[67]华显立,许贵阳.数字图像中值滤波技术研究[J].电子设计工程,2014,22(11):191-193.[68]李冠林,马占鸿,王海光.基于图像处理的葡萄霜霉病单叶严重度自动分级方法[J].中国农业大学学报,2011,16(6):88-93.[69]田凯,张连宽,熊美东,等.基于叶片病斑特征的茄子褐纹病识别方法[J].农业工程学报,2016,32(s1):184-189.[70]陶华伟,赵力,奚吉,等.基于颜色及纹理特征的果蔬种类识别方法[J].农业工程学报,2014(16):305-311.60 甘肃农业大学2018届硕士学位论文[71]刘媛,冯全.葡萄病害的计算机识别方法[J].中国农机化学报,2017,38(4):99-104.[72]王丽爱,马昌,周旭东,等.基于随机森林回归算法的小麦叶片SPAD值遥感估算[J].农业机械学报,2015,46(1):259-265.[73]何东健,乔永亮,李攀,等.基于SVM-DS多特征融合的杂草识别[J].农业机械学报,2013,(02):182-187.[74]张永.基于模糊支持向量机的多类分类算法研究[D].大连理工大学,2008.[75]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.[76]田有文,程怡,王小奇,等.基于高光谱成像的苹果虫害检测特征向量的选取[J].农业工程学报,2014,(12):132-139.[77]刘阗宇,冯全.基于卷积神经网络的葡萄叶片检测[J].西北大学学报(自然科学版),2017,47(4):505-512.[78]王细萍,黄婷,谭文学,等.基于卷积网络的苹果病变图像识别方法[J].计算机工程,2015,(12):293-298.[79]孔英会,景美丽.基于混淆矩阵和集成学习的分类方法研究[J].计算机工程与科学,2012,34(6):111-117.[80]MaromND,RokachL,ShmiloviciA.Usingtheconfusionmatrixforimprovingensembleclassifiers[C]//IEEE,2010:000555-000559.[81]LeCunY,BottouL,BengioY,etal.Gradient-basedlearningappliedtodocumentrecognition[J].ProceedingsoftheIEEE,1998,86(11):2278-232.[82]SunY,WangX,TangX.Deeplearningfacerepresentationfrompredicting10,000classes[C]//ComputerVisionandPatternRecognition.IEEE,2014:1891-1898.[83]WenY,ZhangK,LiZ,etal.Adiscriminativefeaturelearningapproachfordeepfacerecognition[C]//EuropeanConferenceonComputerVision,SpringerInternationalPublishing,2016:499-515[84]GirshickR,DonahueJ,DarrellT,etal.Richfeaturehierarchiesforaccurateobjectdetectionandsemanticsegmentation[C]//IEEEConferenceonComputerVisionandPatternRecognition.IEEEComputerSociety,2013:580-587.[85]RenS,HeK,GirshickR,etal.FasterR-CNN:Towardsreal-timeobjectdetection61 甘肃农业大学2018届硕士学位论文withregionproposalnetworks[J].IEEETransactionsonPatternAnalysis&MachineIntelligence,2017,39(6):1137-1149.[86]化春键,邓朝省,陈莹.基于双掩模图像差影的工业产品表面缺陷检测[J].传感器与微系统,2015,34(5):127-129.[87]戴建国,赖军臣.基于图像规则的Android手机棉花病虫害诊断系统[J].农业机械学报,2015,(02).[88]田磊,靳继红.面向无线传感器网络节点的脐橙采摘机器人定位研究[J].农机化研究,2018,40(4):53-57.[89]WangX,SampH,UniversityT.ResearchonAutomaticRecognitionSystemofPickingRobot——BasedontheMultipleInformationLabelsofEnglishAlphabet[J].JournalofAgriculturalMechanizationResearch,2018.62 甘肃农业大学2018届硕士学位论文导师简介冯全,男,1969年1月生,汉族,四川隆昌人,教授。1991年毕业于兰州大学物理系,固体电子学专业,获理学学士学位;2003年获兰州大学信息科学与工程学院“通信与信息系统专业”工学硕士学位;2010年获北京邮电大学信息与通信学院“通信与信息系统专业”工学博士学位。1991-1995年国营七四九厂,从事电子线路设计技术工作。1995年至今,在甘肃农业大学工学院(原机电工程系),从事电工、电子及信息处理教学,本科主讲课程《电路CAD与仿真》、《电工技术》、《电路理论》、《电磁场理论》,研究生主讲课程《机器视觉》、《现代测试技术》、《电路CAD》。现任电工电子实验室主任。研究方向图像处理、信息安全、电子技术。撰写科研和教学论文30余篇,作为主要完成人和参加人完成科研项目7项,获校、教育厅教学成果奖2项,获省科技进步二等奖2项,专利发明4项。近年来主持和参与专利:1.“免耕播种高抗尘排种监测器”,国家知识产权局,2006,发明专利。2.“一种确定生物认证系统的安全级别的方法和设备”,国家知识产权局,2006,发明专利,专利号:ZL2006101386160,4-4。3.“生物认证方法、系统和设备”,国家知识产权局,发明专利,专利号:ZL200710137291.9,1-4。4.“一种利用指纹细节特征点绑定/恢复密钥的方法”,国家知识产权局,发明专利,专利号:ZL200710063883.0,2-3。5.一种利用多项式保护指纹模板的方法和认证方法,国家知识产权局,2012发明专利。6、基于令牌的隐私保护型指纹认证方法和系统,国家知识产权局,2012发明专利。近年来主持和参与科研项目:1.2003年至2005年参与国家“863”项目农业重大专项“北方干旱内陆河灌区(甘肃张掖)节水农业综合技术体系集成与示范”(编号:2oo2AA2z419},负责2BFM-10/5型免耕播种机的电控系统设计。63 甘肃农业大学2018届硕士学位论文2.2006年至2008年参与北京邮电大学多媒体通信与模式识别实验室的与华为技术责任有限公司的合作项目“在开放网络上进行安全可靠的生物认证技术”的研究工作,为华为公司完成了给国际电联/国际标准组织((ITE/ISO)提案1项(TAI:TelebiometricsAuthenticationInfrastructure);作为实际发明人,为华为公司申报发明专利2项,为多媒体通信与模式识别实验室申报发明专利1项。3.2006年至2008年参与甘肃省农业厅项目“抗植物软磨料磨损新技术在制粒环模制造中的生产应用”。4.2008年至2010年,参与北京邮电大学多媒体通信与模式识别实验室的教育部科学研究重点项目“面向网络安全的生物特征模板保护”(项目号:108012)。5.2011年至2013年,主持国家自然基金“开放网络上隐私保护型生物认证方法的究”,项目编号:610620120。6.2014年至2018年,主持国家自然基金“自然条件下酿酒葡萄病害检测方法的研究”,项目编号:614610050。64 甘肃农业大学2018届硕士学位论文作者简介刘媛,女,1991年生,汉族,中共党员,江苏人,硕士研究生。2014年毕业于江苏师范大学,电气工程及其自动化专业,获工学学士学位。2015年到甘肃农业大学机电工程学院学习,所学专业为农业电气化与自动化。主要研究方向为图像处理,模式识别。在校期间发表论文:1.刘媛,冯全等.葡萄病害的计算机识别方法[J].中国农机化学报,2017,33(6):140-147.65 甘肃农业大学2018届硕士学位论文66

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭