DCT域上基于主颜色的图像和视频检索

DCT域上基于主颜色的图像和视频检索

ID:39101820

大小:2.27 MB

页数:57页

时间:2019-06-24

DCT域上基于主颜色的图像和视频检索_第1页
DCT域上基于主颜色的图像和视频检索_第2页
DCT域上基于主颜色的图像和视频检索_第3页
DCT域上基于主颜色的图像和视频检索_第4页
DCT域上基于主颜色的图像和视频检索_第5页
资源描述:

《DCT域上基于主颜色的图像和视频检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中山大学硕士学位论文:DCT域上基于主颜色的图像和视频检索thentheproposedalgorithmcanbeimplemented.ExtractthedomaincolorofeachIframe;mergethemintoadomaincolorserialasthefeatureofthevideo.Theexperimentalsodemonstratestheresultishighlysimilarashumanvision.KeyWord:JPEG}_MPEGimageretrieval,videoretrievalIIl中山大学硕士学位

2、论文:DCT域上基于主颜色的图像和视频检索1.1选题动机第1章引言随着计算机技术和国际互联网的飞速发展,包括图像、视频在内的各种多媒体数据的数量正以惊人的速度增长。使图像压缩成为标准的努力日益增长。联合图像专家组为通用的彩色静态图像制定了一个国际标准——JPEG。作为JPEG静态图像压缩的逻辑扩展,为运动的视频图像序列制定了运动图像专家组——MPEG标准,应用于数字视频发行和高清晰度电视[1】o随后,图像及视频的数字化技术越来越成熟,制作成本越来越低,导致越来越多的图像、视频、音频等以数字化的形式分布在世界各个地方。人们也越来越需要这种直观、生动的表达方式。信

3、息数字化技术给人们带来方便的同时,也面临着如何有效地在浩如烟海的多媒体数据里找到用户所需要的信息。由于计算机对多媒体理解起来非常吃力,使得这方面的需要实现起来非常困难。以图像为例,它在很多方面不同于文本,文本本身就可以说明内容,用户可以利用关键字来进行检索。图像则需要人们按照各自的理解来说明他们所蕴含的意义。所以图像本身并没有可以检索的部件,除非利用某种可以辨别颜色、形状和纹理的机制,实际上就是基于图像自身的内容进行检索。急剧增多的多媒体信息和巨大的用户需求,使得图像检索近年来引起图像处理、模式识别、计算机视觉和数据库等研究领域的广泛关注。基于内容的检索(Co

4、ntent.BasedRetrieval,CBR)是指媒体和媒体对象的内容及上下文联系在大型数据库中进行检索。1.2图像检索的发展历史图像检索自七十年代以来便成为一个非常活跃的研究领域,图像检索的推动力来源于两大研究团体:数据库系统和计算机视觉,它们从基于文本以及基于内容这两个不同角度,对图像检索进行了研究。事实上,人工智能及模式识中山大学硕士学位论文:DCT域上基于主颜色的图像和视频检索别领域的研究团体,也对图像检索中的分类问题、学习问题给予了很大推动。按年代和研究特点来划分,图像检索的研究可以分为三个阶段【2’3】。自1970年以来,研究者们在对图像库中的

5、图像进行文本标注的基础上,利用文本数据库管理技术(DBMS),对图像进行基于关键字的检索这种方法主要的问题是:人工标注的工作量过大,不同人对图像注解时存在各自主观性和非精确性而导致检索匹配失误。白1990年以来,由于大规模图像数据的出现,研究者们提出基于内容的图像检索,主要对于图像自身的视觉内容提取线索,直接对图像进行分析,抽取特征,如颜色、形状、纹理、轮廓等。检索过程是一个人机交互的过程,由用户给出查询实例,使用相似度匹配技术,逐步定位,通过用户的参与,提高检索系统的效率和精确度。显然,基于内容的检索有效的克服了传统方法的缺陷。1996年MPEG组织开始着手

6、制定MPEG--7(MultimediaContentDescriptionInterface,多媒体内容描述接口),将多媒体内容特征分为多层次的,最低层次的是计算机可以自动完成的物理方面的统计特征,最高层次是与内容相对应的类似文字描述的特征,语义层的特征在必要时还需要人工标注的方法来提供,这样就为图像/视频检索系统提供了标准的描述框架一I。九十年代中期以后,出现了一些典型的图像检索系统,下面做简单的介绍,详细的分析参见【5,6l,其中较为著名的有mM的QBIC(QueryByImageContent),它是第一个商业化的基于内容的图像系统,它的系统框架和技术

7、对后来的图像系统具深远的影响。QBIC支持基于例子图像,用户构造的略图、选择的颜色、纹理等查询。后来出现了由Virage公司开发的Virage引擎,与QBIC不同的是,它支持颜色、颜色布局、纹理和对象边界四个原子查询的任意组合。用户还可以调整它们的权重。由Excalibur公司开发的RetrievalWare在重点在于将神经网络用于图像检索中。另外还有Mrr媒体实验室开发的交互式工具Photobook,可以提取面部特征进行查询;哥伦比亚大学开发的面向视觉的VisualSeek和面向WwW的WebSeek,主要研究图像区域的空问关系查询和从压缩域中抽取视觉特征。

8、Nerea是UCSBAlexandri

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。