基于支持向量机的玉米品种识别

基于支持向量机的玉米品种识别

ID:40450988

大小:761.50 KB

页数:15页

时间:2019-08-02

基于支持向量机的玉米品种识别_第1页
基于支持向量机的玉米品种识别_第2页
基于支持向量机的玉米品种识别_第3页
基于支持向量机的玉米品种识别_第4页
基于支持向量机的玉米品种识别_第5页
资源描述:

《基于支持向量机的玉米品种识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、****大 学毕业论文 题   目:******************学生姓名:******指导老师:******学院:******专业班级:******       完成时间:******基于支持向量机的玉米品种识别摘要:一个国家想要发展,其必须要农业作为后盾来支持,农业的发展又离不开优质的品种,因而品种的识别有重要意义.本文选取农大108、郑单958、辽单565三种玉米品种来作为研究对象,采用支持向量机的算法来进行识别.首先,在本文的开篇对支持向量机算法的历史及原理进行的一个简单的介绍.其次,要

2、想识别出玉米籽粒,就必须进行籽粒的特征提取,此处从玉米籽粒的数字图像中提取与玉米籽粒的形状、尺寸、颜色等有关的4个形态结构特征及1个与玉米籽粒的重量有关的质量特征.最后,运用支持向量机来对玉米品种进行识别.对于以上5个玉米籽粒特征,其中质量特征作为本文的一个创新部分,利用支持向量机(SVM)算法进行两次训练识别,第一次的训练识别包含上面的5个特征,第二次的训练识别包含除质量特征以外的4个特征.最后将两次训练识别的结果进行比较,结果表明含有质量特征的识别率更高.关键词:玉米籽粒;品种识别;支持向量机1引言农业是一国之本,是

3、社会中唯一生产人类赖以生存的食品的产业部门.其意味着农业必须存在并要不断发展.我国是一个传统的农业大国,农业的发展对工业的持续快速发展,人民生活水平的快速提高都具有至关紧要的作用.俗话说得好“春种一粒粟,秋收万颗子”,形象的表达出种子是最基本的农业生产资料.一粒好的种子,它会以高产量和高品质来回报农民一年的辛劳,给农民一年的期盼做一个完美的答复;而一粒坏的种子,却只会让农民一年的艰辛付诸东流,一年的希望变成失望.由此可以看出种子的选取在农业生产过程中尤为重要.选择什么样的种子,怎样选择是其关键问题,即种子品种的识别问题.

4、当今,种子检测方法[1]主要有种子形态鉴定法[2]、蛋白质电泳技术检验法、分子标记技术检验法.其中,种子形态鉴定法是根据种子形状、大小、色泽、质地、表面的光与毛以及种子外表各部位的特征来加以鉴别,以区分本品种与异品种.这种方法简单、经济、快速,但准确性较差,且随着现代育种科学的发展,不同品种间种子外观形态的差异越来越小,因此靠区别种子形态上的差异来鉴定种子纯度也变得越来越困难.对于蛋白质电泳技术检验法,它是指利用电泳技术对备检样品的种子或幼苗的蛋白质进行分离、染色,形成蛋白质电泳谱带的差异,并与标准品种相比较,从而鉴定品

5、种的真实性和纯度的一种方法.不同作物品种,基因不同,基因的直接表达产物——蛋白质在种类、数量、结构等方面亦不同.该法即是利用蛋白质的多态性来反映不同品种组成上的差异,从而进行品种鉴定.分子标记技术即是通过对品种的多态性即减基序列的差异进行分析,从而鉴别不同品种.其检测对象是种子的片段(基因),没有器官的特异性,不受环境的影响,有较高的准确性、稳定性和重复性.但是对于蛋白质电泳技术检验法和分子标记技术检验法来说,不仅在技术上程序复杂,而且费用昂贵.故在普及上比较困难.因此我们的重心必定会是去寻找另一种方法.在这条道路上的不

6、断摸索中,终于在后来发现可以使用支持向量机的方法来对种子进行识别.支持向量机是Vapnik等于1995年在统计学习理论的基础上提出的一种新的机器学习算法.该方法能从有限的训练样本中通过机器识别得到决策规则,且对于独立的测试样本集仍可保证较小的误差.其自动、快速、准确,既能减轻专业技术人员的劳动强度,又能防止误识导致的假冒劣质种子流入市场,坑农害农事件的发生[3].这里就以对玉米品种的识别来进行实验.2支持向量机的概念及其原理支持向量机[4](,)是在统计学习理论中维理论和结构风险最小原理的基础上发展而来的一种新的机器学习

7、方法,是当前国际机器学习界的研究热点之一.支持向量机基于结构风险最小化原理,将原始数据集合通过某种映射压缩到支持向量集合,从而得到分类决策函数.支持向量机的基本思想[4]是构造一个超平面作为决策平面,这个平面必须能够尽可能多地将2类数据点正确分开,同时也使分开的2类数据点距离分类面最远,其在二维情况下的示意图如图1所示.图1二维情况下线性支持向量机示意图图1中圆圈和方块分别代表2类样本,其中代表分类线,、分别为过各类中距离分类线最近的一个或多个样本且平行于分类线的一条直线,它们之间的距离叫作分类间隔[5](Margin)

8、.所谓最优分类线就是要求分类线不但能够使2类样本正确分开,而且能够使它们之间的分类间隔最大.前者是为了保证经验风险达到最小,而后者是为了保证其真实风险达到最小.在图中到和到的距离是完全相等的,在和上显然有一系列点来“支撑”这两条线,这些“支撑”的点即为支持向量(SupportVector).对于高维空间也可以此类推,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。