基于动态时间规整的孤立咳嗽声识别

ID：30641450

大小：20.43 KB

页数：9页

时间：2019-01-02

资源描述：

《基于动态时间规整的孤立咳嗽声识别》由会员上传分享，免费在线阅读，更多相关内容在应用文档-天天文库。

1、从本学科出发，应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性，便于研究生提出新见解，特别是博士生必须有创新性的成果基于动态时间规整的孤立咳嗽声识别摘要本文通过对咳嗽声特性的分析，在对咳嗽声进行预处理后，提取咳嗽的Mel频率倒谱系数作为特征参数，建立咳嗽模板库。采用基于动态时间规整算法的模板匹配方法对特定人的孤立咳嗽进行识别，实验证明，通过将咳嗽声的特性和语音识别方法的结合，动态时间规整算法在对孤立咳嗽声识别中有很好的准确性和可靠性。关键词特征提取；Mel频率倒谱系数；动态时间规整；咳嗽声识别咳嗽是机体的一种保护性动作，以消除呼吸道的分泌物、渗出物及侵

2、入呼吸道的异物[1]。多数患者未能完整对自身的咳嗽特征进行描述，比如咳嗽的症状、发作时间、频率等，影响了咳嗽的及时诊断和合理治疗。因此，有必要进行咳嗽的实时监测及其特征的识别。至今这种对咳嗽严重性的评估，主要依靠主观措施，如咳嗽反射敏感性、患者对自身症状的感觉、咳嗽可视模拟测评、生活质量问卷、咳嗽症状描述和患者的日记等[3]。从而使大部分的咳嗽监测器的诊断受到人为的影响较大。利用可靠的咳嗽检测算法可以减少大量需人工分析的数据，甚至可以做到去除人工分析的过程，因此，要提高咳嗽声识别系统的有效性，这就要求有一种算法能够识别出大部分在特定录音中的咳嗽声，同时又能够将它与其它的

3、具有相似特性的声音区分开来。文章在参考了国内外关于咳嗽声识别的研究课题份量和难易程度要恰当，博士生能在二年内作出结果，硕士生能在一年内作出结果，特别是对实验条件等要有恰当的估计。从本学科出发，应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性，便于研究生提出新见解，特别是博士生必须有创新性的成果现状，并比较了咳嗽声识别与语音识别的关系，提出使用动态时间规整算法作为本文咳嗽声识别的主要算法。咳嗽发生机制咳嗽表现为深呼吸气后，声门关闭，继而以突然剧烈的呼气，冲出狭窄的声门裂隙产生咳嗽动作和发出声音[2]。Mel频率倒谱系数[12](MFCC)频率f与Mel频

4、率B之间的转换公式为：(1)MFCC的提取及计算过程如图1所示。(1)原始咳嗽声信号y(n)通过预加重、分帧、加窗处理后，得到每帧的时域信号x(n)。(2)将得到的每帧时域信号进行离散傅立叶变换(DFT)。(2)其中，X(k)为线性频谱，N为DFT的窗宽。(3)线性频谱经过Mel频率滤波器组处理后为M(t)，然后对其进行对数能量处理，得到结果为d(m)。图1Mel频率倒谱系数(MFCC)提取过程图通过Mel频率滤波器组得到Mel频谱其中Mel频率滤波器组为在语音的频谱范围内设置的若干个带通滤波器，M为滤波器的个数。每个带通滤波器的传递函数为：(3)f(m)可以用下面的方

5、法定义：(4)其中，Ss为采样频率，而B-1为B的逆函数：，而滤波器的频率应用范围的最低频率为f=100Hz和最高频率为f课题份量和难易程度要恰当，博士生能在二年内作出结果，硕士生能在一年内作出结果，特别是对实验条件等要有恰当的估计。从本学科出发，应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性，便于研究生提出新见解，特别是博士生必须有创新性的成果=4000Hz，在实验中为了减少甚至消除交流电的影响，滤波器的个数取M=26，即可以得到26维的MFCC倒谱系数。考虑到让得到的结果对噪声和谱估计误差有更好的鲁棒性，将经过Mel滤波器组得到的Mel频谱取对数

6、能量，其传递函数为：(5)(4)将上述对数频谱d(m)经过离散余弦变换(DCT)变换到倒频谱域，得到Mel频率倒谱系数(MFCC)：(6)以上参数称为静态参数，为了描述咳嗽声帧之间的相关性，引入了动态参数一阶差分和二阶差分。2.模版匹配技术[12]模版匹配法是模式识别中最常用的一种相似度计算与匹配方法，把具有不同人的咳嗽声信号经过特征提取变换后作为不同的模版，构建一个基于模版匹配的简单的咳嗽声识别系统，如图3所示，是该咳嗽声识别系统的原理框图。图3基于模版匹配的咳嗽声识别原理框图相似度度量在基于模板匹配的咳嗽声识别系统中，对原始的咳嗽声信号进行训练得到一系列的特征模板，

7、将其存储于模板库中。而在识别过程中采用相似度度量来进行模板匹配，将特征模板库中的各个模板称为参考模板，用R来表示；在模板库建好后，又将待识别的输入咳嗽声信号通过预处理和特征提取得到特征矢量序列，称为待检测模板，用W表示[12]。参考模板用R＝{R(1)、R(2)、……、R(m)、……、R(M)}表示，其中M为参考模板所包含的咳嗽帧的总数，r为咳嗽帧的时序标号，R(r)为第m帧的咳嗽特征矢量。待检测模板用W＝{W(1)、W(2)、……、W(n)、……、W(N)}表示，其中N为参考模板所包含的咳嗽帧的总数，w为咳嗽帧的时序标号，W(w)为第n

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 9



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于动态时间规整的孤立咳嗽声识别

基于动态时间规整的孤立咳嗽声识别

相关文章

相关标签