浅析计算机视觉研发和应用.doc

浅析计算机视觉研发和应用.doc

ID:28105738

大小:436.00 KB

页数:14页

时间:2018-12-08

浅析计算机视觉研发和应用.doc_第1页
浅析计算机视觉研发和应用.doc_第2页
浅析计算机视觉研发和应用.doc_第3页
浅析计算机视觉研发和应用.doc_第4页
浅析计算机视觉研发和应用.doc_第5页
资源描述:

《浅析计算机视觉研发和应用.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浅析计算机视觉研发和应用  近日,腾讯优图与《科学》(Science)杂志共同发布《Seeingisbelieving:R&Dapplicationsofcomputervision》(眼见为实:计算机视觉的研发和应用)主题报告,通过全球计算机视觉领域的专家访谈,为大众带来当下计算机视觉技术发展的全面解读,也为即将到来的计算机视觉峰会拉开序幕。    视觉是人类认知世界的重要组成部分,而计算机视觉作为人工智能的核心技术之一,近几年的发展现状如何?  在目前的人类生活中有这样的应用?是否已经超越人类的眼睛?未来又将有怎样

2、的发展前景?  近日,腾讯优图与《科学》(Science)杂志共同发布《Seeingisbelieving:R&Dapplicationsofcomputervision》(眼见为实:计算机视觉的研发和应用)主题报告,通过全球计算机视觉领域的专家访谈,为大众带来当下计算机视觉技术发展的全面解读,也为即将到来的计算机视觉峰会拉开序幕。以下为报告全文(中文译文版):  眼见为实:计算机视觉研发和应用  人工智能(AI)曾经只是一种存在于科幻领域的科技,而现在,研究实验室已经不断研发出了各种应用AI的日常产品。  AI技术的

3、进步很大程度上得益于计算机视觉的发展。计算机视觉技术关注的是构建能够收集和处理视觉信息的软件。应用计算机视觉可以识别照片中的人物、读取X光片、进行工厂机器人系统的智能升级,但它的影响范围远不止于此。  大多数人都对自己的视觉习以为常,殊不知要拿起叉子或接住球,我们的大脑要进行大量的运算。计算机变得足够快速、强大和小巧来实现计算机视觉的实际应用,不过是这几年的事情。  最先进的计算机视觉技术要运用到深度学习,而深度学习是AI的一大领域,灵感来自于人脑。深度学习算法使用的人工神经网络(ANN),是指能够分析并相互传递信息的

4、互相连接的节点层,与神经元的通信机制类似。  如果我们向神经网络展示一张自拍照,一层神经元将会识别类似于面部轮廓的粗线条;另一层神经元会关注五官之间的区域,例如眼睛到嘴巴的距离;还有其他神经元会负责观察耳朵的形状。藉此,该算法可判断出这是不是一张人物照片,甚至看出这人是谁。  “在大多数计算机视觉任务当中,神经网络都能轻而易举地生成最佳算法,”腾讯优图实验室杰出科学家贾佳亚说道。腾讯总部位于中国深圳,是互联网服务和产品、娱乐及人工智能的全球领导者。  像人工神经网络一样,计算机视觉技术工程师也在试图模仿人类视觉系统的运

5、作机制。但是机器比人更有优势的一处是,它不需要像人类那样依赖可见光,还能使用传感器更清楚地看到世界。  “在人脸识别、图像分类等众多任务中,计算机视觉能比人类视觉完成的更优秀。但在其他需要推理的任务,计算机视觉还有很长的路要走。”贾佳亚表示,“人类能轻易明白物体彼此之间的关联,我们看到一张图就能编出一个故事。但计算机还远不能达到这种程度的理解能力和想象力。”  随着计算机视觉技术的不断发展,它将会带来更多新的发现。计算机视觉和AI都处于各自发展的初始阶段,还有很多东西值得探索。  计算机视觉技术的进步可能会推动AI的迅

6、猛发展,把科幻小说的情节全部变成现实——比如无人车、机器人管家,甚至远距离太空旅行。  在实践中学习:AI的工作原理  跟大多数AI系统类似,计算机视觉需要学习浩如烟海的数据。研究人员查阅数据并根据其特征仔细为数据添加标签,这些特征就是他们希望AI去理解的东西。  就计算机视觉的任务而言,研究人员会收集成百上千的照片用于分析。加标签的数据会成为范例,据此训练AI进行分类或寻找规律。为了测试AI的学习效果,研究人员会展示新的、未加标签的图像,测试其是否能够正确分类。  除了要在收集、标注和筹备庞大资料的工作中投入人力外,

7、另一个重要障碍就是运行训练算法需要的大量计算能力。  费用低廉的在线服务,让研究人员可以在云端训练算法,而无需为强大的计算机投入数千美元,不过,要得出训练结果仍需数小时甚至数日。  对着镜头微笑:图像和视频识别  人工神经网络领域最重要的进展之一出自ImageNet。ImageNet收集了1400万标签图像并于2009年发布。  ImageNet挑战赛要求参赛者设计一个能够跟人类一样对照片进行分类的算法,但一直没有出现获胜者。直到2012年,一个使用深度学习算法的参赛队伍取得了显著优于以往尝试的结果。  今天,人们与计

8、算机视觉产生交互的最常见的几种方式包括图像自动标记和拍照面部识别等,都是基于ImageNet获胜的技术。这些应用有助进行网上购物可视化搜索、自动标注社交媒体照片等特定任务。  除了图像识别外,这项新科技也推动了照片编辑技术的发展。图像分割算法是计算机视觉的组成部分,可以帮助机器将一张图片分成不同的部分,例如识别背景和前景中的人物。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。