基于k近邻的手写数字识别

基于k近邻的手写数字识别

ID:35660223

大小:319.83 KB

页数:20页

时间:2019-04-07

基于k近邻的手写数字识别_第1页
基于k近邻的手写数字识别_第2页
基于k近邻的手写数字识别_第3页
基于k近邻的手写数字识别_第4页
基于k近邻的手写数字识别_第5页
资源描述:

《基于k近邻的手写数字识别》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、暑期生产实习报告题目基于K-近邻算法的手写数字识别学院电子工程学院专业智能科学与技术学生姓名学号指导老师提交日期摘要基于k-近邻算法对经典的手写数字集mnist中的测试数据进行分类。用MATLAB语言编写代码,将原始数据读入,形成三维矩阵,再通过k近邻算法计算出待测数据周围最近的k个数据,将待测数据分为k个数据中最多的类。本次实验只是用mnist数据中训练图像前6000张,测试图像前1000张。关键词:k-近邻算法,数据分类,手写数字集,mnist数据集目录一绪论51.1k-近邻算法的基本概念51.2mnist数据集5二k-近邻算法62.

2、1k-近邻算法的工作原理62.2k-近邻算法的算法步骤62.3k-近邻算法的优缺点6三k-近邻算法分类mnist的具体方法6四实验结果与分析74.1待测图像74.2实验结果94.3结果分析11五实验代码11六总结与展望166.1总结166.2展望16参考文献17一、绪论1.1手写数字识别的基本概念手写数字识别是图像识别的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写的阿拉伯数字。在整个OCR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而

3、在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。1.2手写数字识别的实际背景字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。这几年来我国开始大力推广的“三金”工程在

4、很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一事业的进展。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。1.3手写数字识别的理论意义手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:(1)阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国、各地区的研究工作者提供了一个施展才智的大舞台。在这一领域大家可以探讨,比较各种研究方法。(2)由于数字识别的类别数较小,有助于做深入分析及验证一些新

5、的理论。这方面最明显的例子就是人工神经网络,相当一部分的人工神经网络模型都以手写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。(3)尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。(4)手写数字的识别方法很容易推广到其它一些相关问题,一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。1.4基于手写数字识别的典型应用手写数字识别有着极为广泛的应用前景,这也正是它受到世

6、界各国的研究工作者重视的一个主要原因。下面我们将介绍基于手写数字识别的应用系统的特殊要求,以及一些以手写数字识别技术为基础的典型应用。(1)手写数字识别在大规模数据统计中的应用在大规模的数据统计(如:行业年鉴、人口普查等)中,需要输入大量的数据,以前完全要手工输入,则需要耗费大量的人力和物力。近年来在这类工作中采用OCR技术已成为一种趋势。因为在这种应用中,数据的录入是集中组织的,所以往往可以通过专门设计表格和对书写施加限制以便于机器的自动识别。目前国内的大多数实用系统都要求用户按指定规范在方格内填写。另外,这些系统往往采用合适的用户界面

7、对识别结果做全面的检查,最终保证结果正确无误。可以看出,这是一类相对容易的应用,对识别核心算法的要求比较低,是目前国内很多单位应用开发的热点。(2)手写数字识别在财务、税务、金融领域中的应用财务、税务、金融是手写数字识别大有可为的又一领域。随着我国经济的迅速发展,每天等待处理的财务、税务报表、支票、付款单等越来越多。如果能把它们用计算机自动处理,无疑可以节约大量的时间、金钱和劳力。与上面提到的统计报表处理相比,在这个领域的应用难度更大,原因有:1、对识别的精度要求更高;2、处理的表格往往不止一种,一个系统应能智能地同时处理若干种表格;3、

8、由于处理贯穿于整个日常工作之中,书写应尽量按一般习惯(如:不对书写者的写法做限定,书写时允许写连续的字串,而不是在固定的方格内书写),这样对识别及预处理的核心算法要求也提高了。(3)手写数字识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。