模式识别4次作业汇总

模式识别4次作业汇总

ID:31926314

大小:1.86 MB

页数:37页

时间:2019-01-28

模式识别4次作业汇总_第1页
模式识别4次作业汇总_第2页
模式识别4次作业汇总_第3页
模式识别4次作业汇总_第4页
模式识别4次作业汇总_第5页
资源描述:

《模式识别4次作业汇总》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、北京工商大学模式识别作业汇总(2014年秋季学期)课程名称:模式识别专业班级:计研141班学生姓名:董文菲刘倩指导教师:于重重成绩:2015年1月20日第一次课的作业1.在Matlab环境下,利用第一题中给了matlab程序,尝试声音识别过程,并把程序流程图画出。解:程序实现了识别“kiss”与“love”两个声音的界面图。程序流程图如下:2.运行网址http://www.wcl.ece.upatras.gr/en/ai/resources/demo-emotion-recognition-from-speech上的javaapplet,了解声音识别的

2、过程。解:智能对话系统的测试点如下图所示,该智能对话系统可以通过语音交互获取信息,控制娱乐设备等智能应用。情感识别的构成如下图:情感识别依赖于先进的音频参数化技术,利用高斯混合模型训练情绪识别模型。目前负面情绪的识别得到了很好的结果。3.选择鸢尾花数据集(iris,网上下载),并尽可能多地使用《数据挖掘导论第三章》介绍的不同的可视化技术完成数据预处理(可参看第三章资料中的辅助ppt),形成报告。文献注释和该书网站提供了可视化软件的线索。解:(1)分类选择朴素贝叶斯分类器算法,训练选项选择交叉验证,即把数据集分成若干份,1份作为验证集,其余部分作为训练集

3、合。这样的方法保证了数据集的所有元素都被验证过。这里把数据集分为10份来进行训练。分类器运行的信息,分类器训练的结果,分类器验证验证的结果、准确性计算等信息如下:Visualize信息图,3种类别用不同颜色表示出来。可以从图中看出哪些属性的组合具有较好的区分度。(2)离散化(discretize):类weka.filters.supervised.attribute.Discretize和weka.filters.unsupervised.attribute.Discretize。分别进行监督和无监督的数值属性的离散化,用来离散数据集中的一些数值属性到

4、分类属性。unsupervised.attribute.Discretize:supervised.attribute.Discretize(2)规范化(Nomalize):类weka.filters.unsupervised.attribute.Normalize。规范化给定数据集中的所有数值属性值,类属性除外。结果值默认在区间[0,1],但是利用缩放和平移参数,我们能将数值属性值规范到任何区间。如:但scale=2.0,translation=-1.0时,你能将属性值规范到区间[-1,+1]。(2)标准化(standardize):类weka.fi

5、lters.unsupervised.attribute.Standardize。标准化给定数据集中所有数值属性的值到一个0均值和单位方差的正态分布。第二次课的作业请查一下这里列出来的所有方法,并用实例实现(并在软件中实施一下,任何软件环境都可以。)1.解:属性有四种类型:标称、序数、区间、比率。其中标称和序数属性统称分类的或定性的。区间和比率是数值的或定量的。1)众数一组数据中出现次数最多的数据就是这组数据的众数。2)x2检验亦称卡方检验。统计学中假设检验的方式之一。x是一个希腊字母,x2可读音为卡方,所以译为卡方检验。卡方检验主要用于定类或定序变量

6、的假设检验,在社会统计中应用非常广泛。卡方检验的步骤一般为:(1)建立假设,确定显著水平a与自由度df、查x2值表得到否定域的临界值;(2)由样本资料计算x2值;(3)将计算所得的x2值与临界x2值(负值都取绝对值)作比较,若计算值大于临界值,则否定Ⅱ0;反之,则承认Ⅱ0。计算卡方值的公式一般可表示为:x2=∑[(fo—fc)2/fc]式中:fo表示实际所得的次数,fc表示由假设而定的理论次数,∑为加总符号。x2检验对于定类与定类或定类与定序变量之间的相关检验应用较多。例:用卡方检验拟合优度:[h,p,st]=chi2gof(bins,'ctrs',b

7、ins,...'frequency',obsCounts,...'expected',expCounts)bin:有n组数值则:bin=0:(n-1);obsCounts:观测值expCounts:期望值h,p,st:返回值3)符号检验符号检验法:是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。具体地讲,若两个样本差异不显著,正差值与负差值的个数应大致各占一半。符号检验与参数检验中相关样本显著性t检验相对应,当资料不满足参数检验条件时,可采用此法来检验两相关样本的差异显著性。根据符号检验判断差异显著性时也要查表找出相应的临界值

8、。但特别应注意的是在某一显著性水平下,实得的r值大于表中r的临界值时,表示差异不显著,这一点与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。