基于视频的人机交互技术研究毕业论文

基于视频的人机交互技术研究毕业论文

ID:23810406

大小:2.63 MB

页数:50页

时间:2018-11-10

基于视频的人机交互技术研究毕业论文_第1页
基于视频的人机交互技术研究毕业论文_第2页
基于视频的人机交互技术研究毕业论文_第3页
基于视频的人机交互技术研究毕业论文_第4页
基于视频的人机交互技术研究毕业论文_第5页
资源描述:

《基于视频的人机交互技术研究毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、毕业论文基于视频的人机交互技术研究摘要人机交互(Human-ComputerInteraction)主要研究人、计算机以及彼此之间互相影响的有关技术。视觉语言(包括手势和面部表情)作为一种自然的人-人信息交互的辅助方式,具有所见即所得、自然方便等优点,因此在新一代“以人为中心”的智能人机交互中得到了广泛的关注。此次课题就是在这一方面做的一些尝试和探索,其中选择了基于手势的人机交互方式做研究,由于手势具有多样复杂性以及时空的差异性,因此,基于视觉的手势识别是一个极富挑战性的多学科交叉难题。手势一般隐藏了一定的信

2、息,我们需要对手势进行识别,得到其表达的含义,从而控制人机交互的实施。本文实现了一个利用视频手势提取进行人机交互的原型系统,大致可分为四个部分:视频采集和分离、图像预处理、手势提取和识别、人机交互。其中的关键部分是手势的提取和识别,手势提取需要采用图像处理的方法,而手势势识别采用的则是决策树的方法,通过对手势几何特征的分析和决策来判定手势类型。采用以上方法对一段视频进行实时处理和分析,进而实现人机交互。其中主要的交互功能可以实现,实时性也较好,准确性也较高,不过该方法的鲁棒性不是很好,对光照强度较敏感。关键词

3、:人机交互,手势识别,图像处理,几何特征目录摘要1第一章绪论31.1人机交互概述31.2手势识别概述41.3国内外研究现状51.3.1国外手势识别领域研究现状51.3.2国内手势识别领域研究现状6第二章基于视觉的手势识别技术基础72.1手势建模72.1.1基于3D的手势模型82.1.2基于表观的手势模型92.2手势分割102.3手势分析102.4手势识别11第三章方案设计133.1总体框架设计133.2图像获取及预处理143.2.1视频采集和单帧分离143.2.2图像灰度化处理143.2.3图像平滑处理153

4、.2.4图像二值化处理173.2.5图像形态学处理193.2.6图像去噪203.3手势提取和识别213.3.1手势提取213.3.2特征提取223.3.3手势识别243.4人机交互26第四章方案实现和结果分析284.1程序运行环境284.2程序界面设计和主要功能294.3程序运行结果以及分析34总结和展望36参考文献37第一章绪论1.1人机交互概述人机交互(Human-ComuterInteracton)是研究人、计算机以及它们之间相互影响的技术,人机交互技术是当前信息产业竞争的一个焦点,世界各国都将人机交互

5、技术作为重点研究的一项关键技术,美国总统信息技术顾问委员会的“21世纪的信息技术报告”中[1]将“人机交互和信息管理”列为新世纪4项重点发展的信息技术(还包括软件、可伸缩信息基础设施、高端计算)之一,它的目标是研制“能听、能说、能理解人类语言的计算机”。我国国家自然科学基金会、国家重点基础研究发展计划(973)、国家高技术研究发展计划(863)等项目指南中,均将先进的人机交互、虚拟现实技术列为予以特别关注的资助项目。人机交互是随着计算机的出现应运而生的,它的发展经历着几个阶段:(1)手工作业阶段,采用手工操作

6、和依赖机器(二进制机器代码)的方法操控笨拙的计算机。(2)作业控制语言和交互控制语言阶段,这一时期计算机的主要使用者是程序员,他们一般通过批处理作业语言和交互命令语言的方式和计算机打交道。(3)图形用户界面(GUI)阶段,GUI的主要特点是采用了窗口、图标、鼠标、指针(WIMP)界面,具有简单,直接和所见即所得等优点。由于GUI简单易学,使得大量的普通用户开始接触计算机,促进了信息产业的空前发展。(4)网络用户界面阶段,以超文本传输协议HTTP和超文本标记语言HTML为基础的网络浏览器是网络用户界面的代表。这

7、类人机交互技术的特点是发展快、范围广,新的技术不断涌现,如聊天工具、搜索引擎等。(5)多通道、多媒体的智能人机交互阶段,以虚拟现实为代表的计算机系统的拟人化和以手持电脑、智能手机为代表的微型化、嵌入化是当前计算机发展的两个趋势,而以鼠标和键盘为代表的GUI人机交互技术是影响其发展的瓶颈。可以利用人的多种感觉通道和动作通道(如语音、手写、姿势、表情和视线等做输入),以并行的方式与计算机环境进行交互,提高了人机交互的自然性和高效性。总体而言,人机交互的发展历史表明其由以计算机为中心的复杂交互逐渐向以人为中心的简单

8、、自然交互转移。目前的多通道交互(Multi-ModalInteraction,MMI)技术已经取得了不少研究成果,有一部分也已经实现实用化、产品化,比如在文字识别、数字墨水、手势识别。语音合成和识别等方面都有不少研究成果和产品问世。同时现在的智能人机交互也面临着很多挑战,比如“无所不在的计算”,该名词最初由XeroxPARC的首席科学家Weiser于1988年提出,无所不在的计算强调把计算机嵌入到

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。