基于增量学习支持向量机的音频例子识别与检索.pdf

基于增量学习支持向量机的音频例子识别与检索.pdf

ID:54367417

大小:292.60 KB

页数:8页

时间:2020-04-29

基于增量学习支持向量机的音频例子识别与检索.pdf_第1页
基于增量学习支持向量机的音频例子识别与检索.pdf_第2页
基于增量学习支持向量机的音频例子识别与检索.pdf_第3页
基于增量学习支持向量机的音频例子识别与检索.pdf_第4页
基于增量学习支持向量机的音频例子识别与检索.pdf_第5页
资源描述:

《基于增量学习支持向量机的音频例子识别与检索.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第40卷第7期计算机研究与发展VoI.40,No.72003年7月JOURNALOFCOMPUTERRESEARCHANDDEVELOPMENTJuIy2003!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!基于增量学习支持向量机的音频例子识别与检索吴飞庄越挺潘云鹤(浙江大学人工智能研究所杭州3l0027)(wufei@cs.zu.edu.cn)摘要音频例子识别与检索的主要任务是构造一个良好的分类学习机,而在构造过程中,从含有冗余样本的训练库中选择最佳训练例子、节省学习机的训练时间是构造分类机面临的一个挑战,尤其是

2、对含有大样本训练库音频例子的识别.由于支持向量是支持向量机中的关键例子,提出了增量学习支持向量机训练算法.在这个算法中,训练样本被分成训练子库按批次进行训练,每次训练中,只保留支持向量,去除非支持向量.与普通和减量支持向量机对比的实验表明,算法在显著减少训练时间前提下,取得了良好的识别检索正确率.关键词增量学习;支持向量机;音频例子识别检索中图法分类号TP39l.4AudioClipRecognitionandRetrievalBasedonIncrementalLearningwithSup-portVectorMachineWUFei,ZHUANGYue-Ting,andPANYun-H

3、e(InstituteOfArtificialIntelligence,ZhejiangUniuersity,HangzhOu3l0027)AbstractTheprimarytaskofaudiocIiprecognitionandretrievaIistoconstructaweII-performancecIassi-fier-Iearningmachine.HowtochooseinformativetraininginstancefromredundanttrainingdatabaseandreducetrainingtimeofcIassifiermachineisachaII

4、engeduringtheconstructionofcIassifiermachine,espe-ciaIIyforaudiocIiprecognitionwithIargesizetrainingdatabase.Sincesupportvectoristhekeyinstanceinsupportvectormachine(SVM),anaIgorithmtotrainSVMwithincrementaIIearningisproposed.InthisaIgorithm,trainingdatabaseissegmentedintosub-databasesandeachsub-da

5、tabaseistrainedinbatch.Duringeachtrainingprocess,onIysupportvectorisreservedforfuturetrainingandnon-support-vectorisdiscarded.ComparedwithtraditionaIanddecrementaISVMs,thistrainingaIgorithmobviousIyreducestrainingtimeandobtainshighcorrectratesofrecognitionandretrievaI.KeywordsincrementaIIearning;su

6、pportvectormachine;audiocIiprecognitionandretrievaI频特征,然后观察不同音频类型之间所提取特征值1引言的不同,最后按照特征之间的差别对音频例子进行识别分类.如JohnSaunders[2]基于能量分布曲线和作为多媒体重要媒质之一的音频蕴涵了丰富语过零率特征,对商业电台广播内容进行分类,正确率义,从20世纪90年代中期开始的基于内容音频检达98%;MIT媒体实验室的EricScheirer等[3]用索研究就是要提取音频信息流中的语义,以方便对4Hz调制能量、频谱能量截止点、频谱中心和频谱流音频数据的识别检索[l]量等l3种特征组合起来区分语音和

7、音乐;MIT的.基于内容音频识别检索的一般流程是先提取音另一组研究人员[4]则应用最大后验概率方法对MeI收稿日期:2002-ll-l4;修回日期:2003-0l-22基金项目:国家自然科学基金(6027203l);浙江省自然科学基金(ZD02l2);教育部博士点基金(200l0335049);国家“十五”重大科技攻关项目(200lBAl0lA07-03);浙江省科技计划重点科研项目(2003C2l0l0)7

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。