基于KNN算法的手写字母识别.doc

基于KNN算法的手写字母识别.doc

ID:57275235

大小:20.00 KB

页数:5页

时间:2020-08-08

基于KNN算法的手写字母识别.doc_第1页
基于KNN算法的手写字母识别.doc_第2页
基于KNN算法的手写字母识别.doc_第3页
基于KNN算法的手写字母识别.doc_第4页
基于KNN算法的手写字母识别.doc_第5页
资源描述:

《基于KNN算法的手写字母识别.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于KNN算法的手写字母识别作者:刘方舟来源:《全国流通经济》2019年第03期        摘要:数据挖掘是指通过多种算法从海量数据中搜索隐藏于其中有用信息的过程。在无序中寻找有序、在纷乱中发现规律,是数据挖掘的核心价值所在。它主要通过数理统计、在线分析处理、情报检索、机器学习、专家系统、模式识别等诸多方法来实现既定目标。本文利用数据挖掘中的K近邻算法(KNN),根据从大量手写英文字母图像中提取出的原始特征属性,对手写字母进行计算机算法自动分类,从而达到对手写字母识别的目的。这对于在电脑编辑大大多于手写文本的快节奏现实生活中,及时准确

2、识别出手写文献信息内容,具有重要意义。        关键词:数据挖掘;人工智能;KNN;手写英文字母识别        中图分类号:F062.9文献识别码:A文章编号:2096-3157(2019)03-0097-03        一、前言        在经济全球化、社会信息化时代,信息传播更多借助于网络,计算机技术越来越成为人们生活不可分割的一部分。秉笔传书的几率日益下降,而这一趋势的加快,客观造成了人们书写规范性的弱化,进而带来手写体识别难度的增加。但不论电脑能在多大程度上代替人的劳动,手动书写仍然在诸多工作、学习、生活领域占据

3、主导地位。上至文件的签署、领导的批示、高管的签字,下至课堂教学的板书、会议精神的速记、医生开出的药方,都面临如何快速准确识别的问题,因此,借助人工智能实现手写文书的识别,就成为当下信息交互迫切需要的应用性技术[1]。这就为数据挖掘技术在手写文献识别的运用提供了发挥的空间。        近年来,数据挖掘在多个领域显示了技术优势[2],如Siri声音识别、美颜相机人脸表情识别、情绪识别、智能安全监控系统行人姿态识别等,这对于实行精确化管理、快速侦办案件、多语种相互转换、疑难病理分析等,都带来了极大便利[3]。如今,在手写字母识别领域,人们也

4、进行了积极探索,取得了可喜进展。但与其他领域相比,还有太多的难题需要破解,关键是技术路径的选择和开发,急需创新突破。        二、研究内容        手写字母识别是计算机自动辨认手写体英文字母的一种技术,是光学字符识别技术的一个分支[4]。26个英文字母(A,B,C,…,Z)是构成英文单词、句子的最基本元素,在以英语为主要语言的国家的日常生活中十分常用。手写字母识别的研究通用性很强,如果能够研究开发先进的计算机数据挖掘算法,使得计算机能够自动识别人们手写的英文字母,对其进行分析鉴别,将具有重要的使用意义[5]。        在

5、人们的日常生活中,手写字母识别有着十分广泛的应用,例如,将该技术应用于信用卡签名,用计算机对信用卡签名进行自动核对,防止信用卡盗刷,大大提高其安全性。使用手写字母识别技术可以将历经艰险保存到现在的古代文献方便地录入至电脑中,安全地保存其数据,避免了传统方法中主要依赖于人力手工录入的弊端,大大节省了人力、物力和财力,防止数据随着原件的损坏而销毁。使用手写字母识别技术可以将纸上的文字录入至电脑中,方便了历史资料、文獻等纸媒体文字的保存,使后续的查阅与修改更加方便、快捷。手写字母识别还可以应用于电脑阅卷系统,通过将学生在考场上完成的英语作文录入

6、至电脑中,转换成标准电脑英文字体的文字,方便阅卷者进行判分,从而减少了由于学生自身能力之外的因素(如笔迹混乱,字体模糊,书写整洁度低等)给老师带来的阅卷体验的影响,增加了考试中的公平性。        三、研究方法        本实验的主要目的是利用数据挖掘方法[6],根据从大量手写字母图像中提取出的数个原始特征属性进行分类,从而达到手写字母识别的目的。目前最常用的分类算法是KNN算法[7]。        邻近算法,或者说K最近邻(KNN,k-NearestNeigh-bor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻

7、,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻居来代表。        KNN算法的核心思想是,如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法在类别决策时,只与极少量的相邻样本有关[8]。        KNN具体计算步骤如下:        1.计算每一个测试数据与所有训练数据之间的距离,这里距离的度量通常采用欧式距离以及曼哈顿距离;        2

8、.将所得到的所有距离,按照递增关系进行排序;        3.选取距离最小的K个样本;        4.确定前K个样本所述的类别标签;        5.返回前K个样本中出现频率最高的类别

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。