【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf

【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf

ID:32020938

大小:2.27 MB

页数:78页

时间:2019-01-30

上传者:U-1863
【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf_第1页
【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf_第2页
【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf_第3页
【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf_第4页
【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf_第5页
资源描述:

《【硕士论文】GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

东北大学硕士学位论文GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现姓名:吴菁晶申请学位级别:硕士专业:通信与信息系统指导教师:张振川20051201 东北大学硕士学位论文摘要GSM系统中的语音编码算法研究及RPE-LTP编码系统的DSP实现摘要近几十年来,语音编码技术发展非常迅速。高速发展的DSP技术为语音信号处理提供了强有力的工具,使得实时实现各种各样的复杂算法成为可能。针对不同的应用,国际标准组织制定了一系列的语音压缩编码标准。其中,RPE.LTP语音编码算法是由英国、芬兰、原西德、法国、意大利、荷兰、挪威及瑞典等国组成的语音编码专家小组从最初提交的20多种语音编码方案中优选6种进行了测试,最后以MPE.LTP和RPE.LTP两种为蓝本,制定的码速率为13kbit/s的、带有长时预测环节的规则脉冲激励线性预测编码器。随黄超大规模集成电路技术上取得的突破进展,集成化的DSP数字信号处理器具有体积小、功耗低和运算速度快等诸多优点,因此非常适用于语音信号的压缩处理。目前的DSP芯片以其强大的数据处理功能而在通信和其他信号处理领域得到广泛注意,并己成为开发应用的热点技术。本文首先对当前语音压缩编码技术和标准进行综述,并对RPE-L1tP语音压缩编码标准做了介绍。然后研究算法原理,并对RPE—LTP算法的实现过程做了深入的分析。分析了TI定点DSP的结构特点。最后,实现了RPE—LTP编码器:(1)硬件平台的设计,主要完成DSP部分的设计,完成DSP部分的电路原理图和PCB图。(2)着重分析了语音压缩编码技术中最重要的几种实现技术:短时域处理技术、线性预测分析、矢量量化、合成分析等。(3)用C语言的方式,在TMS320C5409上部分的实时实现了RPE·LTP编码器。对实现过程中的存储器分配、指令选择、函数展丌、寻址方式选择和寄存器使用等方面的问题进行了分析和优化。测试结果表明,该编码器可以应用于多通道通信等对时延要求较高的领域。另外,对编码器系统软件设计作了分析和介绍,并给出了测试结果。关键词:语音编码,DSP算法开发,规则脉冲激励长时预测,实时实现 lii!查兰婴兰堂堡堕圭垒!壁坚!!●--_________-__-—-—_——-———●——————_—_——_—_—_——’——’___________________’_______,___-————J----__—————_———_一’TheStudyoftheVoiceCodingArithmeticinGSMSystemandRPE—LTPSystemonDSPAbstractInrecentdecades,thetechnologyofthespeechcodeisdevelopedveryfast.WiththerapiddevelopmentofDSPtechnology,itbecomesapowerfultoolinthespeechsignalprocessing,whichmakesitpossibletoimplementaLLkindsofcomplexalgorithmsinrealtime.Basedondifferentapplications,manystandardsofspeechcompresscodinghavebeenestablishedbydifferentintemationalstandardizationorgnizations.Thereinto,RPE—LTPvoicecodingarithmeticispresentedbyvoicecodingexpertgroup,whichisconstitutedbythescientistsfromEngland,Finland,Germany,France,Italy,Hotand,NorwayandSweden.Thevoicecodingexpertgroupchooses6schemesfrom20andteststhem.Finally.theyformulatetheRegularPulseExcitement—LongTimePredictivewith13kbit/sencodingspeedbasedonMPE—LTPandRPE-LTP.Withthegreatprogressesandaseriesofbreak—throughinVLSItechnologies,integratedDSPscameoutsoonafter.ItegratedDSPspossessmanyadvantages,suchascompactness,lowpowercost,andhighworkingspeedandSOon,whicboremostlysuitableinspeechsignalcompressing.PresentDSPsaregettingmoreandmoreattentionsintheinformationfield,duetoitspowerfulsignalprocessingability,becomingahot-pointtechniqueincommunicationandotherrelatingsignalprocessingareas.Thispaperfirstlydescribesthepresentspeechcompresscodingtechnologiesandstandards.AndthespeechcompresscodingstandardsRPE-LTPisintroduced.Secondly,thealgorithmprinciplesofRPE·LTParestudied.andtheimplementationprocessofRPE—LTPalgorithmisanalyzeddeeply.StructuresandpropertiesofTIfix—pointDSPareanalyzed.Finally,theRPE—LTPencoderisimplemented.(1)ttardwareplatformdesign,thisarticlemainlycompletestheportiondesignofDSP,completesthecircuitprincipiumchartofDSPandPCBfigure.(2)SeveralkindsofthemostimportanttechnologyofthespeechcodehavebeenintroducedinthisPaper,forinstance:ShortTimeProcess,LinearPreditionAnalyse,VectorQuantization,andAnalysebySynthesize,etc.(3)TheRPE—LTPeacdoerispartiallyimplementedonTMS320C5409inrealtimeinClanguage.Intheimplementationprocess,severalissuesareanalyzedandoptimized,whichincludeassignmentofmemories,selectionofinstructions,expansionoffunctions,selectionofaddressmodesanduseofregisters,etc.ThetestresultsshowthattheencoderCanbeappliedintherealmsrequiringlowdelaysuchasmulti—channeltelecommunications..,IlI.. 东北大学硕士学位论文AbstractInaddition,thedesignofthesystemsoftwareareanalyzedandintroduced,andthetestresultsaregiven.Keywords:speechcoding,thearithmeticdevelopmentofdigitalsignalprocess,RegularPulseExcitement·LongTimePredictive,real-timeimplementation.IV. 独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:夏禹南日期:咖“.『_6学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。(如作者和导师不同意网上交流,请在下方签名;否则视为同意。)学位论文作者签名:签字日期:导师签名:签字目期: 东北大学硕士学位论丈第一章绪论1.1引言第一章绪论语音是人与人之间进行信息交流最直接、最方便和最有效的工具,又是人与机器之间进行通信的重要工具。因此,语音通信也是最基本、最重要的通信方式之一。1876年电话的发明可以认为是现代语音通信的开端。随着信息技术和通信技术的高速发展,信道资源变得愈加宝贵。压缩语音信号的传输带宽或降低电话信道的传输码率一真是人们追求的目标。随着计算机网络等技术的飞速发展,语音编码技术得到了快速发展和广泛应用,尤其是最近20年,语音压缩编码技术在移动通信、卫星通信、多媒体技术以及lP电话通信中得到了广泛应用。语音压缩的目的是在保证语音质量的前提下,尽可能的降低编码比特率,以便在有限的传输带宽内让出更多的信道来传送图像、传真、文档、计算机文件和其它数据流,从而达到传输资源的有效利用和网络容量的提高。语音压缩编码在实现这一过程中担当着重要的角色。语音压缩编码~直是追求能在尽可能低的数码率下获得尽可能高的合成语音质量的矛盾中发展的。1.1.1语音压缩编码技术的发展概况随着信息社会和通信技术的高速发展,频率资源显得愈加宝贵。因此,压缩语音信号的传输带宽或降低电话信道的传输码率,~直是人们追求的目标。在数字蜂窝移动通信中,数字化的语音电信号首先要进行语音编码。语音编码是数字通信中一个相当关键的问题,它直接影响到通信质量、频率利用率和系统容量。压缩语音信号的传输带宽或降低电话信道的传输码率,一直是语音编码追求的目标。特别是在蜂窝移动通信中,若不采用语音压缩技术,通信信道效率将成倍下降。因此,语音压缩编码技术是当今数字蜂窝移动通信中所必备的。语音信号的数字化传输则是通信发展的主要方向之一,语音的数字通信与模拟通信相比,无疑具有更好的效率和性能,这主要体现在:①具有更好的话音质量;②具有更强的抗干扰性,并易于进行加密;③可节省带宽,能够更有效地利用网络资源;④更加易于存储和处理。最简单的数字化的方法是直接对语音信号进行模/数转换,只要满足一定的采样率和量化要求,就能够得到高质量的数字语音。但这时语音的数据量仍旧非常大,因此在进行传输和存储之前,往往要对语音进行压缩处理,以减少其传输码率或存储量,即进行压缩编码。语音编码的目的就是要在保证语音音质和可懂度的条件下,.】. 东北大学硕士学位论文第一章绪论采用尽可能少的比特数来表示语音信息。语音编码最初是由人们企图压缩通信频带而来。自从1876年贝尔rAlexanderGrahamBell)发明电话以来,电话通信发展很快。但是,在之后几乎半个世纪中,人们对电话系统了解甚少,在20世纪20年代,美国贝尔实验室开始研究电话信号,同时也对电话系统的理论进行研究。在半个多世纪的研究中,各国学者做出了大量的努力fI】,从人类发音机理和听觉机理出发,对语音的基本元素如声学特性、频谱特征和语意表达等做了大量的研究,建立了发音模型和听觉模型,在不同程度上逼近真正的语言过程,并取得了长足的发展,逐步形成了通信和信息处理科学的重要研究方向。自从i939年美国的HomerDudley发明声码器以东,语音处理开始了参数编码或模型编码的研究,它是以滤波器为主构造的通道声码器。20世纪60年代以前,研究出实用的共振峰声码器。Satoltakura(1966)和AtalSchroeder(1967)最早把“线性预测(LPC)”技术应用到语音分析和合成中。他们以线性组合模型满足均方误差最小意义下逼近原始波形的方法提取参数,研究出了自相关法、协方差法和格型法等实用快速算法。1966年,J.L.Flanagan提出了以瞬时频率为基础的相位声码器。1969年,A.VOppenheim提出了以倒谱为基础的同态声码器。在众多声码器中,LPC声码器最终因其成熟的算法和对参数的精确估计成为语音信号处理领域里最重要的研究成果,并逐步走向实用。1982年,美国国家安全局(NSA)公布了2.4kbit/s的LPC一10声码器标准(VS.1叭51;1984年,美国国防部制定了STU.III计划,采用2.4kbit/s的LPC,lOe增强型声码器,并于1986年正式投入使用。近年来随着第三代移动通信的发展,变速率语音编码技术相应得到发展。为了充分利用CDMA技术,Qualcomm于1993年提出了可变速率的CELP,通常称为QCELP【zJ。它有4个可供选择的传输速率(1,2,4,8kb/s),通过计算输入能量,并与三个闽僮能量比较来选择传输速率。这种技术已成为北美数字蜂窝通信标准(CTIA—is95)。1999年公布的第三代伙伴计划【31(3蹦GenerationPartnershipPro{ect)把自适应多速率(AMR)语音编解码作为主要技术。该技术有8种速率(12.2,10.2,7.95,7.40,6.70,5.90,5.15,4.75kbit/s)供选择,并采用语音激活技术(VAD)、舒适背景噪音(CNA)、源控速率(SCR)、重帧及误码消除(ECU)、抗稀疏处理等先进技术。它能根据信道质量选择不同的编码速率,通信质量接近或达到长途电话质量。变速率语音压缩编码理论上仍属于CELP,但在“变”上有新的研究,引入了相关的先进技术。随着网络的发展,语音IP(4】(VolP)对语音压缩编码的需求十分迫切。在H.323系列建议中规定了音频编/.2一 东北大学硕士学位论文第一章绪论解码算法符合ITU标准,如G.71l(A律或“律)、G722、G.723.1、G.728、G.729A等。另外,随着研究的深入,语音编码的研究也引入了新的分析技术,例如非线性预测、小波分析技术以及高阶统计分析技术等。预计这些技术更能挖掘人耳听觉掩蔽等感知机理.更能以类似入耳的特性作语音的分析与合成,使语音编码系统更接近于人类听觉器官的处理方式工作,从而在低码率语音编码的研究上取得突破。1.1.2语音编码算法的评价数字音频信号的压缩虽然可以降低传输速率,但同时会降低音质,增加复杂度、时延等。因此需要从音频质量、传输速率、算法复杂度和编解码时延【5】等方面综合评价数字音频编码算法的性能。(1)音频质量音频质量包括声音的可懂度、清晰度和自然度。若所统计的语言单位为有意义的语言单位,测试结果称为可懂度,如单词可懂度、单旬可懂度。当所统计的语言单位为意义不连贯的语言单位,则称清晰度,如语音清晰度、音节清晰度。自然度则反映语音的韵调特性。评定音频质量的方法包括客观评定法和主观评定法。客观评定法是通过测薰某些特性来评价解码得到的音频的质量。如测量信噪比、平均分段信噪比等。但客观评定法与人对音频的感知不完全一致。得到广泛应用的是主观评定法。如以平均主观意见打分(MeanOpinionScore—MOS)的方法来度量。它分为优(5)、良(4)、中(3)、差(2)和劣(1)五级。若察觉不到编码失真,可评定为5分;对于高质量语音,达到长途电话网的质量要求,可评为4.0~4.5分;当语音质量有所下降,但不足以妨碍正常通信,可评为3.5分。此外,值得注意的是,在很多应用场合中,音频信号有大量的背景噪声。雨且,在信号的传输过程中,信道失真也是不可避免的。这就要求解码器必须有足够强的容错能力。另外,级联以及不同的语种对音频编解码器的处理效果都有一定的影响。所有上述问题都是在设计和选用音频编解码器时必须考虑的。(2)传输速率如果数字音频信号的抽样频率为,,对每个抽样的幅度值用R位二进制编码表示,就得到了数字音频信号的传输速率(也可称为码率或比特率)I,即:,=^×R(1—1)此即为该数字音频信号在通信线路上每秒钟应传送的位数,或者保存一秒钟信号所一3. 东北大学硕士学位论文第一章绪论需占用的存储容量。单从数据压缩的角度看,传输速率常常是体现数字音频编码器压缩算法技术水平的最主要的指标。(3)算法复杂度数字音频编码器经常利用数字信号处理器(DSP)等硬件来实现。这些硬件的特性(复杂度)通常以计算速度(例如以每秒执行多少百万条指令,即MIPS来表示)、随机存诸器CRAM)及只读存储器(ROM)来描述。从系统设计者的角度来看,高复杂度意味着高成本和高功耗,因此,算法的复杂度是一个重要因素。如果数字音频编码器在整个系统的功率和费用中分担的份额较小(10%左右),那么在给定传输速率的情况下,选择音质最好的编码器,非常有意义。这时功率消耗或成本方面的变化,不会使编码器在整个系统中所占的百分比大幅度增加。如果这个份额较大,则必须进一步权衡。(4)编解码时延数字音频编解码器的时延主要由算法时延和处理时延两部分组成。在压缩音频信号之前必须把一帧有效数据存入缓存,这种时延称为算法时延,这是唯一的一种不能通过改变实现方法来减少豹时延。处理时延是编码器压缩音频信号和解码器重建音频信号所用的时间,它取决于编解码器的算法复杂度和实现编解码器的硬件的速度。算法时延和处理时延的总和称为单向编解码时延。一个完按的音频帧从编码器传输到解码器所需的时间称为通信延迟。单向编解码时延和通信延迟的总和称为单向系统时延。在实时通信中,系统时延对通话质量有很大影响。在没有回声的情况下,可以容忍的单向系统时延的最大值为400ms。然而,新的测试方法表明,如果通信上容易实现,单向系统时延最好低于200ms。如果有回声,可以容忍的单向系统时延的上限仅为25ms。因此,增加回声抑制功能通常是必要的。1.2用DSP技术实时实现语音压缩算法的需要近年来,由于超大规模集成电路(VLSI)工艺的进步和专用集成电路(ASIC,ADplicationSpecificIntegratedCircuit)的广泛使用,极大的推动了数字信号处理(DSP,DigitalSignalProcessing)技术的发展。各大芯片生产厂商纷纷推出各具特色的高性能数字信号处理专用芯片(DSP,DigimlSignalProcessor),如德州仪器公司(TJ,TexasInstruments)的TMS320系列DSP、Motorola公司的DSP56XXX系列、模拟器件公司(AD,AnalogDevices)的ADSPZl00系列、AT&T公司DSPl6系列等。为提高运算速度以满足实时数字信号处理算法的要求,当前的DSP都采用与通用微处理器(MCU)不同的结构,即放弃冯·诺依曼结构而采用哈佛结构。哈佛结构使得处理指令和数据可..4.. 东北大学硕士学位论文第一章绪论以同时进行,从而大大提高处理速率。DSP以其卓越的运算能力为数字语音信号处理领域的研究及刀+发提供了有力的工具。目前TI公司的TMS320系列DSP在国际国内使用的极为广泛,已占据全世界DSP器件市场60%的份额,品种最多。在本文中采用TMS320VC540916位定点DSP芯片的硬件平台来实时实现该语音编解码算法。1.3本文的主要研究内容语音信号生成数字模型的建立是参数编码理论的前提。本文首先搭建了系统的硬件平台,分析语音形成机理,构造出语音信号生成的数字模型,然后以RPE.LTP算法开发为例,详缅地给出了一个基带算法从提出、模拟仿真到平台实现的全部过程,实现了预处理、LPC分析、短时滤波等几个部分,在~定程度上去掉了语音信号的短时相关性,通过对编码语音进行解码,获得了较高质量的合成语音。并希望在基带算法开发领域积累更多的经验,为今后在整个移动终端领域的深入研究提供有价值的理论参考。由于本论文的研究只是基带算法研究与开发的一个开始,无论在理论知识的理解、硬件平台的设计,还是在算法的编程、算法可行性分析以及最终的性能测试方面都不是太成熟和完善,还需要相当长的时问进行工作总结和经验积累。但这个开始对于我们将是一个很大的进步。1.4本论文的结构第一章:绪论主要介绍语音编码技术的发展概况,语音编码技术在现代通信中的必要性,以及语音编码算法的评价参数。第二章:RPE-LTP语音编码算法研究本章主要论述低比特率的语音压缩编码理论,重点讨论了混合编码的编码原理和编码过程,并详细介绍了GSM手机语音编码器一一规则脉冲激励长时预测编码器(RPE.LTP)的开发过程,为本论文硬件所实现的算法提供了理论依据。第三章:RPE—LTP编码系统硬件设计首先通过分析我们目前的实验条件和研究现状提出设计用于开发数字移动通信手机基带算法通用平台的思想,然后根据当前数字移动通信手机硬件结构提出通用平台的芯片组成,最后结合实际项目开发经验,设计了用于移动通信基带算法开发的通用平台,并给出了各个器件连接的电路原理图。.5. 东北丸学硕士学位论文第一章绪论第四章:基于CCS的DSP系统软件设计本章主要进行语音编码算法——RPE.LTP算法的DSP编程工作,对开发DSP算法的全部过程进行了详细的讨论。从软硬件平台构成、算法运行环境设置、测试算法的数据获取,到算法编程都给出了全面的介绍,并通过具体开发RPE.LTP算法,分模块对算法进行具体编程。第血章:RPE.LTP编码器的测试及实现DSP算法开发并不是一个一蹴而就的过程,在丌发任何算法之前都要对算法进行模拟仿真,初步获取算法的可行性报告,可以说,算法仿真模型对算法实际开发至关重要。因此,本章先介绍了MATLAB调试辅助DSP软件的设计工作,然后将在CcS下运行的结果再做以详细说明。通过比较,得出本实验的算法编程的可行性。第六章:结束语对本论文的研究和开发工作做了概括性的总结,并对下一步工作给出了一些建议和设想。..6,. 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究2.1语音编码理论语音编码的目的是要在保持重建语音质量的前提下,降低数字信号的比特率。语音编码器总是包含一个编码器和一个解码器【61,编码器取来原始的语音信号,并产生低速率的比特流。这个比特流传送到解码器,它能够近似地重构原始语音信号。语音编码器在实现这一目标的过程中担当着重要角色。语音编码器就是压缩语音信号的数字表示而使表达这些信号所需的比特需求最小的算法。模数转换器的输出通常是脉冲编码调制(PCM)信号。要保证电话语音的高质量(带宽限制为300~3400Hz),则线性PCM信号必须具有8kHz的采样率和16biUs样品的分辨度,所得到的比特率为128biUs。这个比特率,能够作为未编码语音的参考比特率。语音传输或存储的近似比特率,依赖于传输和存储的代价、数字语音编码的代价和对语音质量的要求。在1980年以前,语音编码的高价格和低质量,使得语音编码很少被使用。由于数字信号处理硬件的效率猛增,加上语音编码研究的进展,已经明显改变了这种情况,现在语音编码已经大量使用了。在所有的语音编码器中,重构信号和原始信号是不会完全相同的。比特率的降低是由于用较低的精度表示语音信号,或者是用语音模型的参量来表示语音信号,也能从语音信号中,除去固有的冗余度而降低比特率(无损失编码)。但是,如果使用模型和参量,降低了精度就不会没有损失(有损失编码){71,使用降低精度的方法来表示一个标量或矢量的过程叫做量化。在重构语音信号时,由于量化而造成的失真称为量化噪声。通常,语音编码器的主要属性是:——比特率;——主观的语音质量;——计算复杂度和对存储器的要求;——延迟;——对于通道误码的灵敏度;——信号的带宽。语音编码器可以分为两类:波形编码器和参量编码器。由于合成——分析技术的广泛应用,人们又提出了混合编码器。由于混合编码器与参量编码器有很多相似之处,所以在这罩仍把编码器划分为两类来介绍。一7. 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究(1)波形近似编码器波形编码系统直接对语音时域或频域波形样值进行编码,产生重构信号,它用减少量化误差的方法,使重构语音朝着原始语音信号收敛。在波形近似编码器中,基本波形是要保留的,它的信噪比通常是正值,因此,其基本出发点是获得尽可能高的信噪比(sNR)。在编码器的编码过程中,要经常测量信嗓比以便对性能进行校验。由于这种系统保留了语音信号原始样值的细节变化,从而保留信号的各种过渡特性,所以其解码声音质量较高。但高质量解码语音需要系统具有比较高的编码速率,以保持语音波形中的各种过渡特性。传码率比较高、压缩比不大是此类系统最大的缺点。波形编码广泛应用于电路交换网。最近,对于波形编码器又提出了一些新技术,例如后滤波器、改进激励程序等,使得语音质量有比较大的提高。在波形近似编码器中,最典型的应该是速率为32kbit/s的自适应差分脉码调制(AD.PCM,ITU.TQ726)。还有子带编码(SBC,CCITTG722)等。(2)参量编码器参量编码又称声码器(Vocoder),其基础是人类语音的生成模型。在参量编码器中,语音信号是用一组模型的特征参量柬表示,它是由原始语音信号通过计算得到的,虽然也依赖于原始语音信号,但是它和原始语音的波形没有直接关系。它的信噪比有可能为负值,不能用信噪比来测量合成语音的质量,仅能作为一种参考。使用线性预测模型I8】的语音编码器,它也是先求出声道模型的特征参量,然后改变激励参量,使原始信号和重构信号之间的相似性最大,以便优化这些参量。所以在原理上,它接近波形近似编码器,称为混合编码器。参量编码器的模型,是建立在人的发声器官生理结构的基础上。因此,要验证声道的结构以及压力波从声带发出的机理,通常是可能的。但是,在实际的语音编码器中,发声器官生理结构和模型之间的等效性,并不太重要。主要注意点仍然是在语音编码器的属性上。在参量编码器中,最早,而且最具有影响的应该是基于线性预测的声码器(速率为2.4kbit/s的LPC.10e),但是,由于它的语音质量不好,目阿已经被新的编码器所替代。在这些编码算法中,使用合成——分析法是非常成功的一种,它更客观的模拟了激励源的特性,从丽使重构语音的质量具有本质性的提高。这样的编码器有i多脉冲激励线性预测编码器(MPE.LPC)及规则脉冲激励线性预测编码器(RPE.LPC),码激励线性预测(CELP)编码器,矢量和激励线性预测(VSELP)编码器,多带激励线性预测编码器(MBE.LPC)。最新的参量编码器有『F弦变换编码器,波形内插编码器等。.8. 查兰苎兰塑兰茎!燮一箜三主坚!:!!!堡童堡竺墨生堑垄2.2语音压缩编码标准介绍70年代以来,数字语音/ti.缩编码的各种国际标准集中反映了语音编码技术发展的水平。制定语音压缩标准的国际标准组织主要有以F几个:国际电信联盟(InternationalTelecommunicationuniomITu,即原CCITT)、欧洲电信标准协会(EuropeallTelecommunicationStandardsInstitute-ETSI)、北美蜂窝电话工业组织(CellularTelecommunications&InteractAssociation,CTIA)和国际海事卫星组织(INMARSAT)等。表2.1中列出了一些语音压缩编码国际标准。表2.1数字语音压缩编码国际标准———————————————Tabl—e2.1—The—inle—mati—o—n——a—l—s—t—a—n——d—a——r—d—s—.o——f—d——ig.—i—t—a—l—v——o—i—c——e——c—o—m———p—r—e—s——s—c——o—d—、ing————————标准编码算法数码率信号频带采样率用途kbit/skHz这些标准所采用的各种压缩技术,有的比较简单,为人们熟知,压缩比不高,有的十分复杂,压缩比高。下面对ITu常用的几个窄带语音(0.3~3.4kHz)编码标准作介绍。一9一 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究(1)G71l标准19JITU于1972年制定的G7n标准,采用标准的脉冲编码调制(PCM),采样率8kHz,用8比特进行非线性量化,传输速率为“kbi讹。G711标准己极为广泛地应用于数字通信,数字交换机以及一切语音数字化接口,从而使得PCM信号成为了许多语音压缩标准的输入信号。(2)G721标准【10】1984年ITU公布了使用自适应差分脉冲编码调制(ADPCM)的32kbi“s语音编码标准G721,并于1986年根据运行中出现的问题发布了修改版本。这一技术特点在于不把语音信号直接量化,而是对它和预测值的差值进行量化。同时根据编码的结果,调制线性预测系数。它不仅可以达到与PCM相同的重建语音质量,而且具有比PCM更优良的抗误码性能,广泛应用于卫星,海缆及数字语音插空设备以及可变速率编码器中。(3)G728标准【11]ITU在1992年9月制定了G728标准,算法采纳了由AT&T公司提出的16kbiUs短时延迟码激励线性预测(LD—CELP)语音编码方案。G728标准的语音质量与32kbit,S的G721标准基本相当。LD,CELP算法特点是语音短时谱与长时谱预测、增益因子预测等参数不是从输入语音中直接提取,而是用一个50阶长的预测器在后向来实现,传送的信息则只是激励矢量,这就压缩了传输比特率。G728标准以其较小的时延、较低的速率、较高的性能在实际中得到广泛的应用,例如:可视电话伴音、无绳电话机、单路单载波卫星和海事卫星通信、数字插空设备、存储和转发系统、话音信息录音、数字移动无线系统、分组化话音等。(4)G729标准{J2JG729是ITu.T第十五研究组(SGl5)在1996年公布的8kbiUs语音压缩编码标准。该编码标准采用共轭结构代数码激励线性预测(CS—ACELP)技术。同年通过了G729的附件A“减少复杂度的8kbidsCS.ACELP语音编解码器”。G729标准是基于码激励线性预测‘”1(CELP)编码模型。采样率8kHz,帧长为10ms(80个样点)。通过对语音信号的分析,提取CELP模型的参数(LPC参数、自适应和固定码本指标和增益因子)。所有这些参数被编码后传送。在解码端,这些参数用于恢复激励信号来重建语音信号。由于G729具有良好的语音通信质量,适中的复杂发和对不同应用的适应性,因此将成为今后相当长时期内的语音编码算法。广泛应用于个人移动通信、低c,N数字卫星系统、高质量移动无线通信、存储/检索、分组语音和数字租用信道等。.10一 东北大学硕士学位论文第二章RPE-L2"P语音编码算法研究(5)G723.1【“J】996年,ITU为多媒体通信传输制定了双速率的语音编码标准(/.723.1。该标准最仞是为可视电话设计,是目阿ITU公布的语音编码标准中速率最低的一种标准。G.723.1工作在双速率下,即5.3kbit/s和6。3kbit/s。其中高码率具有较高的重建语音质量,而低码率的计算复杂度较低。(3,723.1采用目前流行的码激励线性预测技术,在对激励信号进行量化时,高码率算法采用多脉冲最大似然量化(MP.MLQ)技术,低码率算法则采用代数码本激励线性预测(ACELP)技术。2.3规则脉冲激励线性预测声码器理论基础2.3.1语音模型的建立为了对语音信号进行数学处理,首先要建立一种能够精确描述语音产生过程和语音特征的数学模型。但是,语音的产生过程极为复杂,语音中包含着十分丰富和多样的信息,至今还没有一种理想的模型能够精细地描述语音的产生过程和语音的所有特征。】960年,Fant提出了~种线性预测模型【15J。该模型以人类语音的发音过程和语音信号的声学特性为基础,成功地表达了语音的主要特性,成为当今最为流行的语音信号产生模型。人的发声机理是,发音时由肺部收缩送出一股直流空气,经气管流至喉头声带开口处。在发声之扔。声带开口处的声带肌肉收缩,声带并拢(间隙小于1mm),这股直流空气冲过很小的间隙,使声带得到横向和纵向的速度,此时,声带向两边运动,缝隙增大(成年男性开到最大时,截面积约为20mm2),声带开口处压力下降,弹性恢复力将声带拉回平衡位置并继续趋向闭合,即声带产生振动,而且具有一定的振动周期。利用数字技术来模拟语音信号的产生称为语音信号的数字模型。发音器官能发出一系列声波,那么数字模型就能产生与此声波相对应的信号序列。这种模型是一种线性系统,它的一组参数选定之后就可以使得系统的输出具有所希望的语音性质,系统的这些参数是和语音产生过程有关的。综合考虑声带开口处的激励、声道和嘴唇辐射影响就得到如图2、1所示的语音发声的离散系统模型。它由声源和声道两部分组成。声源包括激励信号和增益控制。浊音的激励源为一串周期性的脉冲,脉冲周期即是基音周期:清音的激励源为随机噪声信号,丌关表示清/浊音判决。声源决定了话音信号频谱的精细结构。声道由时变数字滤波器组成,它决定话音频谱的包络特性。这样不断控制清/浊音开关、激励脉冲周期以及噪 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究声源强度,同时随着不同的发音改变滤波器特性,输出的信号就是所求的语音信号序列。图2.1语音产生的离散系统模型Fig.2.1Themathmodelofspeeehsignalgeneration语音信号可看作是激励信号uG(n)激励一个线性系统H(z)而产生的输出,其中H(z)是声道响应V(2)与嘴唇辐射模型R(Z)柱级联而成,酃://(z)=矿(z)·R(z)(2—1)对于浊音来讲,还可以把声门脉冲的影响也并到传递函数中,即:日(z)=G(z)·矿(z)·R(=)(2—2)在图2.1中,声门脉冲模型G(z1的作用是使浊音的激励信号具有声门气流脉冲的实际波形,它的传递函数为:∞)2F万南其中gl和92都接近于l。增益因子Av和Au分别用于调节浊1清音的幅度和能量。声道模型V(Z)给出了声道的传输函数,在大多数情况下示为:y(z):士∑a。z1J#O辐射模型R(z)一般可表示为:R(Z、=1一rz。其中r接近1。.12.(2—3)它是一个全极点函数,表(2—4)(2—5) 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究在上述语音信号产生的数学模型中,G(z)和R(z)保持0;变。矗、Av、Au、清/浊音激励、声道参数ai(i=0,1,⋯,p)是时变的。2.3.2规则脉冲激励线性预测声码器RPE.LPC(RegularPulseExcitation—LPC)是由Ed.EDeprettere和PeterKroon在1985年1EEEICASSP年会上首先提出来的。1986年K.HellwigR.Hojmann和PWaryR.J.Sluyter等人在EKroon提出的规则脉冲激励编码的基础上,将它简化成实时算法,并用3片DSP芯片(Mpd7720)实现了编译码器,编码速率是16kbit/s。以后他们与CGalaad,M.Rosso等人合作改进算法,加入了长时预测(LongTermPrediction—~LPc),并使速率降为13kbit/s,形成了长时预测规则脉冲激励(RPE-LTP)编码发案。它的特点是算法简单,语音质量达到通信等级,RPE.LTP在1988年被确定为泛欧标准全速语音编码方案,称为GSM标准。1982年起,欧洲蜂窝移动通信特别小组(GSM)开始研究制定900MHz泛欧数字蜂窝系统标准Il“。1985年lO月,由英国、芬兰、愿西德、法国、意大烈、荷兰、挪威及瑞典等国组成的语音编码专家小组正式成立,承担为泛欧蜂窝移动通信系统制定语音编码标准的任务。该小组从最初提交的20多种语音编码方案中优选6种进行了测试,最后以MPE+LTP和RPE.LTP两种为蓝本,制定了码速率为13kbit/s的、带有长时预测环节的规则脉冲激励线性预测编码器(RPE—LTP)。规则脉冲激励——长时预测编码器本质上是一种前向线性预测语音编码器。它用~组间距相等、相位与幅度优化的规则脉冲代替余量信号,以便使合成波形尽量接近原语音信号。在GSM方案中,直接用余量信号的3:1抽取序列作为规则码激励信号,认为几个可能的3:l抽取序列中能量最大的一个对原语音波形产生贡献最大,其它样点的作用较小可忽略。这就使所要传送的余量信号样点数压缩T2/3,大大降低了编码速率,同时这种算法非常简单,硬件易于实现。RPE.LTP的编码净比特率为13kbit/s,加上信道抗误码编码后为22.8kbit/s,当再加上其它信息码及保护间隔后,信道传送速率每话路为24.7kbit/s。其主观平均评分(MOS)达3‘8。GSM13kbit/s编译码方案抗误码性能较好,编译码延时约为30ms,再加上信道编码及其它一些处理,总延时约为80ms。RPE.LTP的优点在于运算量小,可以在TMS320C54XX定点DSP芯片上实现。虽然它的码率高达13kbWs,大大高于研究中的高质量低码率语音编码方案,但其易于集成且实现的计算量小,使它成为数字蜂窝移动通信标准中的一种优选编码方案。一13. 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究RPE—LTP不提取基因周期,而是用搜索出来的激励脉冲序列作为激励信号源。它的编、解码示意图如图2.2和2.3所示。型塑垫q玉稿规!b而匝垂亟寸·图2.2规则脉冲激励编码器原理框图Fig.2,2TheencoderoftheRPE·LTP图2.3规则脉冲激励解码器原理框捌Fig.2.3ThedecoderoftheRPE-IJP算法用语音信号经过P阶逆滤波器之后得到残差信号“n),v(n)表示激励序列,由残差《n)与v(n)的差输入到知觉加权滤波器A(z/r)。输出知觉加权误差e(n)优化的过程就是调整v(n),使e(n)在一定范围内取的平方和最小。2.3.3规则脉冲激励序列首先将一帧语音激励信号分为若干个子帧,用L表示激励子帧的长度。8kHz采样率时L的典型值是40个样点,相当于5ms。在一个激励子帧内,都采用间隔相同(设间隔为P一1个样点)的规则脉冲串作为激励信号fj”,按照这些脉冲串中第一个非零脉冲出现的位置,可以分为k种不同相位的候选激励信号,记为vk(n),k=0,⋯,(k一1);n=0,⋯,(L~1)。在vk(n)中有Q个等间距的非零脉冲,其余样点值是零,非零脉冲的问距p可选择为P[L/Q】(符号【·1表示取整)。例如在GSM中,L=40,Q=13,P=3,k=4,图2.4给出了每个激励子帧中4种可能vk(n)的相位示意图,图中竖线表示非零脉冲的位置,圆点表示零脉冲的位置。..14. 东北大学硕士学位论文第=章RPE—LTP语音编码算法研究V小)(o相位)l。。l‘。I‘。I小班,相位,·I··l··l··●1.·图2.4激励脉冲规则序列相位示意图Fig.2.4Theposturefigofregularimpulsionpulsesequence2.4长时预测规则脉冲激励声码器●I·GSM13kbiVsRPE.LTP语音编码器主要包括预处理、LPC分析、短时分析滤波、长时预测及规则脉冲激励码编码五大部分。图2.5给出了RPE.LTP语音编解码器的结构框图Ⅲ1。预处理预加重爪Sofl直流失调补偿。』LPC分析争陌订了晤翮竖竺Schur选代算法骂—钾熬恒掣塑当叁錾lLAR厂紊I编码器短时分析滤波LPC分析滤波器r’fd隰—TLAR’l畸LAR’1........。上LARI解码器LARl长时预测Ir—b弗l器r————争∈+妒l滤波嚣d斛长时参数解码器长时参数解码器瓢RPE编码r丽÷l相位选择●。。。’。’。‘●’’’。___‘_‘一fxmAPCM鼙化器兰Xm剐卜axc山’Ncn:面声l逆量化器图2.5RPE.LTP语音编码器原理圈Fig2.5ThespeechcoderschematicdiagramofRPE·LTP.15一lxm山RPE相位恢复.1I”.强●:|●1.1●●●lI●●●1l●●●lI●●.●l¨I●2●l●O)位付相23()盯胛(V 东北大学硕士学位论文第二章RPE-LTP语音编码算法研究2.4.1预处理在对语音信号数字分析处理之前,必须先进行语音信号的预处理。预处理包括模拟语音的抗工频干扰、反混叠滤波、模数转换、去均值及高频预加重。其中,抗工频干扰、反混叠滤波和模数转换由一块A/D芯片完成,数字语音信号的去均值和高频预加重则由编码器来完成。当语音信号有非零均值或有非常低的低频噪声出现时,对于安静段语音或低幅度清音语音段尤其麻烦。因此,移去输入信号s。(")中的偏移,以产生一个无偏移信号s。,(”),采用了陷波滤波器进行偏移补偿,其算法如下:%脚2如(”)--So(盯一1)+axs07(”一1)(2—6)口:32735×2一”=0.9989929然后采用一阶FIR滤波器进行高频预加重,得到信号s(")。在A/D变换后加一个6dB/倍频程的提升高频特性的预加重数字滤波器,其目的就是提升高频部分,使语音信号的频谱变得平坦,便于进行频谱分析或者声道参数分析。预加重过程如下:s(n)=%,(n)一卢×乳,∽一1),.1、\£/,P=28180×2一”=O85998532.4.2LPO分析线性预测分析㈣的基本思想是语音信号的每个取样值能够用过去若干个取样值的线性组合(预测值)来逼近。通过使实际语音信号取样值和线性预测值之间的均方误差最小,柬决定唯一的一组预测器系数。这里的预测器系数就是线性组合中所用的加权系数。线性预测分析是目前进行语音信号分析最有效和最流行的技术之一。它提供了一组简洁的语音信号模型参数,这组参数比较准确地表达了语音信号的频谱幅度,而计算量并不大。当线性预测分析技术用于语音编码时,利用模型参数可有效地降低编码比特率。线性预测分析一般借助于线性预测误差器来实现,线性预测误差器的传递函数a(z)由式(2~8)得到:一(z)=1-∑吒=“(2—8)f=l其中,P为预测器阶数,扛,}f=1.。为线性预测器系数,如图2.6所示口01。输出e(n)和输入sfn)满足如下关系.16. 东北大学硕士学位论文第二章RPE-LTP语音编码算法研究“Pe(月)=s(")一s(H)=s(门)一∑口,s(n~f)(2—9),=1“,其中s(")=∑口。s(n—f)称为s(n)的预测值af=1图2.6语音信号的线性顶测模掣Fig.2.6Thelinearpredictionmodelofvoicesignal由此可见,s(n)是由过去的一组样本值s(n.1),s(n-2),⋯⋯,s(n—p)线性组合而得,它是从s(n)的过去样本值来预测当前值s(n)的结果,故又称之为线性预测值。e(n)是原始信号s(n)和预测信号s(H)之差,称作为线性预测误差。线性预测分析实质上就是设计⋯个预测误差滤波器A(z),即求解hk,.,,使得预测误差e(n)在某个预定的准则下最小。线性预测分析的关键是求解下面的方程组:rr(/)一∑a,r(j—f)=0{:1【,(o)一∑口,,(f)=E,1≤j≤p(2—10)式中,E。是正向预测误差功率,哟)是待分析语音信号s(n)的自相关序列。r(j)=目s(月)s0一川(2--11)对于平稳遍历的随机信号,通常可以用时怕j平均来代替集合平均,语音信号具有短时平稳特性,只能从一段语音信号序列来估计自相关序列r(j),从而计算出相应的预测系数。因此浯音信号线性预测分析~般是按帧进行的,每帧的长度可取10~30ms之问。将s(n)每20ms(160个样点)分为一帧,LPC分析按帧进行,每帧计算出8个LPC反射系数。具体计算步骤为;(1)按(2--12)式求出信号s(n)的前9个自相关系数ACF(j)。ACF(j)=∑s(n)s(n-j)j20,l,⋯”,8(2—12)(2)推算方程(2-12)的解,最常用的方法是莱文逊一杜宾(Levinson—Durbin)递推算法,求出前8阶反射系数剐l。一17. 东北大学硕士学位论文第二章RPE—LTP语音煽码算法研究E。=ACF(O)t=aJ(。)[ACF(i)一∑岔j(i-t)ACF(i一州—————』=J_——————一1≤i≤pE,l=口』㈣+1日J_,㈣E,=(1一r2)EH1≤j≤i·1(2一13)aj(i)为j阶声道模型参数的第i个系数,Ei为i阶滤波器预测均方误差,滓1,2,⋯⋯,p表示预测器的阶。在软件编程时,是用Schur递归算法计算的反射系数,如流程图2.7所示。图2.7用Schur递归进行LPC分析Fig.2.7LPCanalysiswithSchurrecursionarithmetic.18.厂IfII,。、flllL 东北大学硕士学位论文第二章RPE-LTP语音编码算法研究(3)根据人耳的~些生理特点,将反射系数f转换成对数面积比参数LAR(i)。LAR(i):loglo(里)(2—14)l—r在实际运算中,为了简化对数函数的计算,以折线函数来近似对数函数,有:LAR(i)=tLAR(i)=sign(r,)×(2xIr,卜0.675)三爿胄(i)=sign(r,)×(8×川-6.375)Itlbj,则bq=3,i=3。这罩bj≤DLB(i)(i_O,i。2)代表量化器的精确电平,bq代表编码的增益,精度和量化电平如表2.4所示。表2,4LTP增蘸量化表Table2.4ArgumentquantificationofLTP解码规则:b,=舛B瓯),产O,⋯,3(2--27)其中DLBCi)(i=o,⋯,3)代表量化电平,b,代表增益解码值。(5)长时分析滤波器短时残差信号d(k)(k=O,⋯,159)被分成4个子帧,每帧40个样点,该d(kj+k)(k=0,⋯,39)表示短时残差信号,而矗”(kj+k)(k=0,⋯,39)表示残差信号的预测值,则长时残差信号可由式(2--28)计算得出:e(k,+k)=d(k。+七)一d”(七,+k)(2--28)其中,j-=0,⋯,3;k=O,⋯,39;kj=ko+j×40。在执行减法运算之前,先应计算出预测值d”(kj+k),d”是通过对重构短时残差信号d’调整和加权得到的。d”(≈,+k)=6:·d7(☆,+☆~Nj)(2—29)其中Ⅳ,和6,是经过编码再解码后的N,和bj值。(6)长时合成滤波器重构长时残差信号,分成4个子帧计算,每子帧40个取样点,在每子帧内,P。(kj+k)与预测值d”(kj+k)相2n,得到重建短时残差信号d7(kj+k)(k=0,⋯,39):d’(≈,+k)=P’(女,+≈)+d。(≈,+≈)(2--30)-23— 东北赶学硕士学位论丈第二章RPE-LTP语音编码算法研究其中e’(t,+k)是e(k,+t)经过量化编码再由译码还原的长时残差信号。2.4.5规则脉冲激励序列编码经过短时、长时预测之后得到的LP残差信号,在这里进行加权滤波、规则脉冲序列提取和量化编码。(1)加权滤波器运用FIR“块滤波”算法125I计算每子帧(40个样点)的c(k)与脉冲冲击相应h(i)的卷积,其中i=0,⋯,lO。具体响应见表2.5。表2.5加重滤波器的脉冲冲击响应Table25Thepulseresponseofmulti母filter54/63/72/8l/90,lO819257412054O.374.134lH(D=o)I=2.779(2—31)在常规卷积中,一个40点序列与11点脉冲冲击响应相卷积,将产生40+11—1=50个样点,而“块滤波”算法只产生常规卷积运算50个样点的40个中心样点。为了标记方便,每个子帧的“块滤波”结果用x(k)表示。10x(≈)=∑h(i)e(k+5-0(2—32)t=0其中k=0,⋯,39;当k+5--i<0和k+5--i>39使e(k+5--i)=0。(2)基于RPE坐标选取的自适应抽样对滤波信号x进行3:l的等间隔抽样,pAm=0,⋯,3为抽样起点,共出现四种抽样序列,每个序列含有13个非零样值:x。(i)=x(k,+m+3×i)(2--33)其中,i=0,⋯,12。根据RPE均方差准则,被选取的子序列应具有最大能量。即:12E,=max∑xm2(Dm20,1,2,3(2—34),;O选取能量最大的那个序列做为本子帧的规则码激励脉冲序列,这样40个长时余量信号被.24. 东北大学硕士学位论文第二章RPE-LTP语音编码算法研究4个13脉冲长的候选子序列中的一个代替,并将本子帧的格点位置M用2bit编码成M。。(3)被选取的RPE序列的APCM量化将选定的脉冲子序列x,(f)采厍JAPCM方式进行量化126]。由于每个RPE序列都由13个样点x。(f)组成,先找出x。(f)的绝对值k。(f)1中的最大值x。。,对x⋯用6bit进行量化,得到量化码x。。。,,对x。;。解码后得到x:。,x。。的量化表如表2.6ffr示。表2.6x。。量化表Table2.6Thequantificationof_)fm。_]fm“Xm雅X㈣X删Xm缸cX㈣0⋯3l3102048⋯230323033232⋯6363l2304⋯255925593364⋯959522560⋯281528153496⋯12712732816⋯3071307I35128⋯15915943072⋯3327332736160⋯19l19153328⋯3583358337192⋯22322363584⋯3839383938224‘。-25525573840···4095409539256·-·28728784096-t·4608460840288⋯31931994609⋯5119511941320⋯35l35I105120⋯563l563l42352⋯383383115632⋯6143614343384⋯415415126144⋯6655665544416⋯447447136656⋯7167716745448⋯479479147168⋯7679767946480⋯51151I157680⋯819l819147512⋯575575168192⋯9215921548576⋯639639179216⋯102631023949640⋯7037031810240⋯112631126350704⋯76776719¨264⋯122871228751768⋯8318312012288⋯133111331152832⋯8958952113312⋯143351433553896⋯9599592214336⋯153591535954960⋯102310232315360⋯1638316383551024⋯l151115l2416384⋯1843118431561152⋯127912792518432⋯2047920479571280⋯140714072620480⋯2252722527581408⋯1535l5352722528⋯2457524575591536⋯166316632824576⋯2662326623601664⋯1791179l2926624⋯2867128671611792⋯191919193028672⋯3071930719621920···204720473130720···327673276763—25— 东北大学硕士学位论文第二章RPE-LTP语音编码算法研究(4)归~化将13个样点分别除以最大值的解码值x:。,最后,归一化127]取样点z’(f)x,(f):掣i:o,⋯,12^m“按表2.7用3bit量化x’(f),得到Xrnc(f)。表27归一化RPE取样点的最化Table2.7ThequantificationofRPEsampleapproachingto1(2—35)(5)APCM反量化经过上述步骤产生的量化参数x。。。、z。。(f)和M。将分为两路,一路送到接收端用于恢复语音信号:另一路送到解码端用于产生长时余量信号,即先将x。。(f)和工⋯分别解码得到艽:(f)和x孟。,然后反归一化得到解码予序列z”(f)。x”(f)=x’。(i)×x:。。i=0,1,...,12(2--36)(6)RPE坐标定位量化后的予序列,按照格点位置M。对子序列x:(f)迸行插零值,最后得到长时余量信号。f一(≈,+女)=x”(f)k.Mc+3i{【∥(£.+k)=ok为其他值(2—37)2.4.6解码技术图2.9是RPE.LTP解码器的原理图,图中M。,z⋯,x。。,b。,N。,LAR。等表示解码器收到的信息码。解码器工作过程与编码器相反,先得到量化的规则脉冲序列P’,.26— 东北大学硕士学位论文第二章RPE—LTP语音编码算法研究再得到重建短时残差信号d’,然后让d’通过综合滤波器恢复语音信号,最后去加重。解码器主要由下面四部分组成,大部分的子块算法与编码器的相似,只有短时合成滤波器和去加重滤波器作为新的子块加到解码器中。合成滤波器也采用格型结构,只是分析滤波器是一个全零点系统,而合成滤波器是一个全极点的滤波器。解码预处理长时预测短时综合滤波去加重图2.9RPE.LTP解码器原理框图Fig.2.9ThechartoftheRPE-LTPdecoder(1)RPE解码长时合成滤波器的输入信号可通过RPE解码、去归一化和定位来完成。在此阶段,通过在一定的位踅插0,恢复信号的取样频率。(2)长时预测重建的长时残差信号c’被输入到长时合成滤波器,由此产生重建的短时残差信号d’,并把d’作为短时合成滤波器的输入。(3)短时合成滤波器图2.10短时合成滤波器的格形结构图Fig.2.10Shorttimesynthesizedfilter.27.ss(n) 东北大学硕士学位论文第二章RPE-LTP语音编码算法研究厂so(H)=d’(”)Jj,(胛)=J卜1(胛)一,’(9一力},卜.(胛一1)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭