基于样例的音乐检索

基于样例的音乐检索

ID:12700757

大小:632.03 KB

页数:22页

时间:2018-07-18

基于样例的音乐检索_第1页
基于样例的音乐检索_第2页
基于样例的音乐检索_第3页
基于样例的音乐检索_第4页
基于样例的音乐检索_第5页
资源描述:

《基于样例的音乐检索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第二部分表示级的音频检索21第3章基于直接匹配的音频样例检索方法EquationChapter3Section1表示级的音频样例检索是指从检索数据源中搜索与用户提交的查询输入音频片段具有“相似”内容的音频信息,它不识别、理解音频的具体内容细节,而是利用更一般的声学特征,按某种测度计算查询音频与数据源之间的相似度值作来为检索依据,可以检索任何类别的音频数据。音频数据的种类复杂多样,从技术上来讲很多音频数据无法识别其语义内容,甚至没有明确的语义信息,例如汽车发动机声、雨声、鸟叫声等,因而难以进行语义级检索,但却可以

2、进行表示级的音频样例检索。同时,在一些检索应用中也不需要识别音频的具体内容细节,例如检索重复播出的广告、节目开头曲、盗版影视作品等[1-6],此时表示级的音频样例检索技术因不涉及语义分析而具有明显的性能优势,可更好地满足应用需求。为叙述方便,以下将表示级的音频样例检索简称为音频样例检索或样例检索。本章介绍基于直接匹配的音频样例检索方法,主要有:基于分段的实时检索方法及MPEG-1压缩域模糊分类的检索方法。有关基于索引的检索方法将在下一章介绍。3.1基于分段的实时检索方法音频样例检索既可以应用于检索静态音频数据库

3、,也可以应用于检索实时音频流。相对而言,检索实时音频流难度更大、要求更高,算法需要更多地考虑资源开销和计算速度问题。实时音频流有其自身的特点:实时性强、流过的数据无法重现,且事先不能预知,例如实时广告监播应用中的电视信号数据。因此,检索必须实时地获取音频数据、计算特征、更新检索模型,然后进行匹配计算。由于实时音频流具有不可预知性,因此无法利用索引技术实现快速检索。实时音频流的实时性又要求检索速度必须足够快,以便能及时处理新到的数据。21在音频样例检索中,通常将检索目标的音频数据作为一个整体直接检索。在整体直接检

4、索方法中,当输入数据流中的样例模板发生部分缺失时会增加检出的难度,甚至无法检出。而在实时检索中,流过的数据又无法再现,一旦检索时错过,无法像静态音频检索那样重新检索。在基于向量序列匹配的整体直接检索算法中,计算代价往往随样例模板长度的增加呈线性增长。因此,当样例模板较长时,整体直接检索方法不能满足实时、快速的应用要求。同时,在实时音频检索中,必须实时计算音频特征以更新检索模型,因此不能使用计算复杂度大的数据模型。本节将介绍一种针对实时音频检索的分段式音频检索方法[5,6],它具有速度快、实时性强等优点,能较好地

5、解决上述问题。3.1.1片段划分分段式检索方法的基本思想如图3-1所示:将较长的样例模板划分成若干较小的片段,每个片段作为一个小目标独立检索。从输入音频数据流(待检数据源)中检索片段的出现情况,并结合片段间的时序关系,便可得到样例模板的检索结果。其中,片段的划分和检索窗的设定直接影响系统的性能。将样例模板分段时,片段的长度可以各自不同,但是第一段的起始点和最后一段的结束点应和样例模板的头尾对齐。设划分的片段总数为,片段的序号依次为1,2,…,,片段长为,片段i,j间的距离记为:(3-1)d(1,2)样例模板……

6、…片段相似度计算与检出判别输入音频数据流检索窗12kk+1…k+m–1…n特征提取…特征提取输入片段图3-1分段式音频检索方法示意图在分段检索方法中,为了简化算法可以采用等长等距的片段划分方式,即21,d(j-1,j)=D,,,L、D均为常数,并且。片段的间距越小越有利于估算检出的样例模板时间长度。片段数量太少不利于样例模板的检索,因此在样例模板片段划分时,限定片段数量最小值为,若样例模板长度太小,即如下不等式成立:(3-2)则按下式调整片段间距,然后再进行片段划分:(3-3)在片段划分时,为了使样例模板的第一

7、个片段和最后一个片段分别与样例模板的首尾对齐,可在保持片段长度不变的前提下,适当调整片段的间距。首先,采用下式计算片段划分的数量:(3-4)其中,表示向上取整。考虑到较短的样例模板如果划分的片段太少不利于检索,所以采用向上取整。然后,根据片段数量和片段长度,按下式调整片段的划分间距:(3-5)其中,为实际使用的片段间距。从而使第一个片段和最后一个片段能分别与样例模板的首尾对齐。考虑到静音帧比例(静音帧数/帧总数)较高的片段在检索时容易误检,因此在片段检索时,可根据静音帧比例的不同采用自适应的相似度阈值。3.1.

8、1基于检索窗的检索控制由于样例模板中的片段具有时序性,在检索时,序号小的片段应先于序号大的片段被检出。因此,在检索过程中可以设定一个称为检索窗的滑动窗,将可以参与检索的片段序号登记在其中,并且片段在检索窗中从左至右按照片段序号从小到大的顺序登记。在检索过程中,只从输入数据流中搜索检索窗中登记的片段,从而通过21检索窗可以限定每一时刻能够参与检索的片段及数量。将检索窗中所登记的片段个数称

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。