基于麦克风阵列的声源定位技术的分析

基于麦克风阵列的声源定位技术的分析

ID:33076554

大小:4.69 MB

页数:67页

时间:2019-02-19

基于麦克风阵列的声源定位技术的分析_第1页
基于麦克风阵列的声源定位技术的分析_第2页
基于麦克风阵列的声源定位技术的分析_第3页
基于麦克风阵列的声源定位技术的分析_第4页
基于麦克风阵列的声源定位技术的分析_第5页
资源描述:

《基于麦克风阵列的声源定位技术的分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、电子科技人学硕士学位论文和Brandstein开始将其应用于声源定位中,用于确定和实时跟踪说话人的位置。目前麦克风阵列系统已有许多应用,其中在民用上包括视频会议‘2】【3】【41、语音识别【51、车载系统环境、大型场所的会议记录系统以及助听装置【6】等;军用上17】包括声纳系统对水下潜艇的跟踪及无源定位直升机和其他发声设备上。在国外,很多著名的公司和研究机构,如IBM,BELL等,正致力于麦克风阵列的研究和产品,而且已经有了一些初期产品进入市场。这些产品已经应用到社会生活的各个场合并体现出了极大的

2、优越性。遗憾的是,在国内,到目前为止还没有自主产权的麦克风阵列产品。因此,研究我国自主的基于麦克风阵列的语音处理算法和技术具有重要的意义。我国一些企业、研究所和高校做了大量的相关工作,但是目前对声源定位的研究才算刚刚起步。1.2麦克风阵列声源定位技术概述基于麦克风阵列的声源定位方法大体上可分为三类【9】:(a)基于到达时延(TDOA)的定位技术。该方法首先求出声音到达不同位置麦克风的时延,再利用这些时延求得声音到达不同位置麦克风的距离差,最后用搜索或几何知识确定声源位置;(b)基于可控波束形成的定

3、位技术。该方法对麦克风阵列接收到的语音信号进行滤波、加权求和,然后直接控制麦克风指向使波束有最大输出功率的方向;(c)基于子空间的定位技术。该方法利用求解麦克信号间的相关矩阵来定出方向角,从而进一步定出声源位置。1.2.1基于到达时延的定位技术基于到达时延(TimeDelayofArrival,TDOA)声源定位方法是应用最广泛的方法。它首先估计出声源到达麦克风阵列的各阵元的相对时延,再利用时延算出声源到达各阵元的距离差,最后用搜索或几何算法确定声源位置【lo】。基于TDOA的源定位一般分为两个步

4、骤进行【lI】:第一步,先进行时延估计(TDE)并从中获得麦克风阵列中相应阵元对之间的TDOA。TDE的方法大致可分为广义互相关(GeneralizedCrossCorrelation,GCC)法、LMS自适应滤波器法、线形回归(LinearRegression,LR)法和互功率谱相位(Cross.powerSpectralPhase,CSP)法四种。第二步,利用TDOA结合已知的麦克风阵列的空间位置进行定位估计,主要的方法有ML(最大似然)法、SI(SphericalInterpolation,

5、球形插值)法和LI(LinearIntersection,线性相交)法几种。2第一章引言在现有麦克风器阵列声源定位中,基于时间到达差的定位方法精度相对较高,计算量是三种方法中最小的,可以考虑在实际中实时实现。不过由于该方法的定位分为2个过程(时延估计和定位),在定位时所使用的参数是过去时间,因此该估计只是一个次最优的定位。同时该定位比较适合单声源的定位,对多声源的定位效果不是很好,房间的混响也会影响定位的准确性。1.2.2基于可控波束形成的定位技术在这三种定位方法中,基于可控波束形成的定位技术是出

6、现较早且已应用于实际的一种定位方法,较多的用于雷达、声纳以及移动通信的信号处理中。波束形成的基本思想是将各阵元采集信号进行了加权求和形成波束,进而通过搜索声源可能的位置来引导波束,修改权值使麦克风阵列的输出信号功率达到最大,波束输出功率最大的点就是声源的位置。文献【12】[t31是最早提出该方法的理论基础。基于可控波束形成的定位技术,主要分为延迟累加波束算法和自适应波束算法。前者运算量较小,信号失真小,但抗噪性能差,需要较多的阵元才有比较好的效果。后者因为加了自适应滤波,所以运算量大比较大,而且输

7、出信号有一定程度的失真,但需要的麦克风数目相对较少,在没有混响时有比较好的效果。可控波束形成技术本质上是一种最大似然估计,它需要声源和环境噪声的先验知识。而实际使用中,这种先验知识往往很难获得。同时进行定位估计是一个非线性优化问题,这类非线性优化的目标函数往往有多个极点,对初始点选取很敏感。用传统的梯度下降法往往容易陷于局部极小点,从而不能找到个局最优点,若采用别的搜索方法来找个局最优点,就会增加计算复杂度,不适用于实时系统。波束形成算法已经广泛的应用于基于麦克风阵列的语音拾取领域,但要达到稳健有

8、效的声源定位还十分困难。本文针对近场环境,对稳健的自适应波束形成算法进行了研究。1.2.3基于子空间的定位技术、:基于子空间的定位技术来源于现代高分辨率谱估计技术。子空间技术是阵列信号处理技术中研究最多、应用最广、最基本也是最重要的技术之一。该类声源定位技术是利用接收信号相关矩阵的空间谱,求解麦克风间的相关矩阵来确定方向角,从而进一步确定声源位置。子空间类方法主要分两类,一类是利用阵列自相关矩阵主特征向量(即信号子空间)的主分量方法,如AR参数模型主分量法,电子科技大学硕士学位论文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。