基于内容的多媒体检索技术

基于内容的多媒体检索技术

ID:40248931

大小:121.45 KB

页数:4页

时间:2019-07-29

基于内容的多媒体检索技术_第1页
基于内容的多媒体检索技术_第2页
基于内容的多媒体检索技术_第3页
基于内容的多媒体检索技术_第4页
资源描述:

《基于内容的多媒体检索技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于内容的多媒体检索技术摘要:基于内容检索是多媒体研究中的新兴热点,会逐渐在很多领域中得到广泛的应用,本文主要介绍了基于内容的多媒体信息检索的概念、特点、查询和检索过程、基于内容的检索、基于视频的检索以及基于内容的多媒体信息检索的研究方向。关键词:基于内容的检索;多媒体;图像检索;视频检索1.引言多媒体技术和Internet的发展将人们带入巨大的多媒体信息海洋,并进一步导致了超大型多媒体信息库的产生,光凭关键词是很难做到对多媒体信息的描述和检索的,这就需要有一种针对多媒体的有效的检索方式。如何有效的帮助人们快速、准确地找到所需要的多媒体信息,成了多媒体信息库所要解决

2、的核心问题。2.多媒体检索技术原理与方法多多媒体检索是一种基于内容特征的检索(CBR:content-based retrieval)。所谓基于内容的检索是对媒体对象的内容及上下文语义环境进行检索,如图像中的颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、响度、音色等。基于内容的检索突破了传统的基于文本检索技术的局限,直接对图像、视频、音频内容进行分析,抽取特征和语义,利用这些内容特征建立索引并进行检索。在这一检索过程中,它主要以图像处理、模式识别、计算机视觉、图像理解等学科中的一些方法为部分基础技术,是多种技术的合成。与传统的信息检索相比,CBR有

3、如下特点:(1)相似性检索:CBR采用一种近似匹配(或局部匹配)的方法和技术逐步求精来获得查询和检索结果,摒弃了传统的精确匹配技术,避免了因采用传统检索方法所带来的不确定性。(2)直接从内容中提取信息线索:CBR直接对文本、图像、视频、音频进行分析,从中抽取内容特征,然后利用这些内容特征建立索引并进行检索。(3)满足用户多层次的检索要求:CBR检索系统通常由媒体库、特征库和知识库组成。媒体库包含多媒体数据,如文本、图像、音频、视频等;特征库包含用户输入的特征和预处理自动提取的内容特征;知识库包含领域知识和通用知识,其中的知识表达可以更换,以适应各种不同领域的应用要求

4、。(4)大型数据库(集)的快速检索:CBR往往拥有数量巨大、种类繁多的多媒体数据库,能够实现对多媒体信息的快速检索。基于内容的检索体系通常如下图所示:Figure1基于内容的检索体系2.1基于内容的静态图像检索基于内容的图像检索必须要对图像进行基于内容的识别和解释,特征提取在图像检索中占有重要地位。图像检索所用到的基本特征有颜色、纹理、形状、图像的语义等等。2.2颜色检索颜色是描述一幅图像最直观、有效的特征,由于颜色具有一定的稳定性,所以是基于内容的图像检索中应用最广泛的特征。对颜色进行检索主要是利用颜色空间直方图进行匹配。颜色数据在查询时,颜色特征的提取主要有互补

5、颜色空间直方图、直方图交叉法、直方图距离比较法、二次型距离算法等。采用基于颜色分布的匹配将获得更接近于被检索内容的视觉效果。2.3纹理检索纹理是描述图像的另一重要特征,图像的纹理特征主要包括粗糙性、规则性、线条相似性、凸凹性、方向性和对比度。常用的检索方法有共生矩阵均值方差法、频谱分析和结构方法以及基于视觉模型的多分辨率分析、随机场模型等。纹理检索在图像分析和识别中起着重要的作用,它被广泛应用于气象云图、卫星遥测图像等。2.4形状检索形状是描述图像的本质特征之一,可用面积、离心率、圆形度、形状矩、曲率、分形维等全局和局部特征来表示,基于形状的检索对象可以分为基于二维

6、形状和基于三维形状的检索。形状检索的基础是图像边缘的提取,常用检索方法有针对图像边缘轮廓线进行的检索和针对图形矢量特征进行的检索。2.5基于内容的视频检索视频又称动态图像,通常包含了动画和影像,是一组序列图像按时间顺序的连续表现,其表示与图像序列、时间关系都有关。帧、镜头和场景是视频信息的基本组成部分,在视频播放中,多个图形按先后顺序快速而连续地出现和消失,而这些单个的图形就是组成视频的最小单元———帧,其中对动态画面起到变化、转折和决定作用的称为关键帧;镜头表示通过摄像机的移动操作形成一个事件或连续的动作,它由一系列连续的帧组成;场景包含了多个镜头的组合,完整的视

7、频是由一个或多个场景组成的。基于内容的视频检索就是要通过对视频数据中所包含的视觉内容进行分析和特征提取,查找到符合要求的相似内容片段。因此,其处理技术包括视频结构的分析、视频数据的自动索引和视频聚类。2.6基于内容的音频检索音频是另外一种重要的媒体。音频可以分为三种类型:波形声音、语音、音乐。波形声音是将模拟声音数字化后得到的数字音频信号,它可以代表语音、音乐、自然界和合成的声响;语音具有字词、语法等语素,语音经过识别可以转换为文本,文本也是语音的一种脚本形式;音乐具有节奏、旋律或和声等要素,是人声和乐器音响等配合所构成的一种声音,可以用乐谱来表示。音频信息检索

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。