计算机在生物学上的应用数量分类学资料.ppt

计算机在生物学上的应用数量分类学资料.ppt

ID:59808274

大小:903.50 KB

页数:67页

时间:2020-11-25

计算机在生物学上的应用数量分类学资料.ppt_第1页
计算机在生物学上的应用数量分类学资料.ppt_第2页
计算机在生物学上的应用数量分类学资料.ppt_第3页
计算机在生物学上的应用数量分类学资料.ppt_第4页
计算机在生物学上的应用数量分类学资料.ppt_第5页
资源描述:

《计算机在生物学上的应用数量分类学资料.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算机在生物学上的应用数量分类学数量分类学原理和方法1-2一·数量分类的基本概念(二)分类运算单位与分类性状分类运算单位(operationaltaxonomicunit,OUT)是数量分类学中一个抽象的基本运算单位,可以是一个个体、种、种群、群落、DNA序列、蛋白质的一级结构等等。分类性状(character)是作为分类依据以区分不同事物的特征或属性。OUT在每个性状上所呈现出来的状况或数值称为性状状态(characterstate)。不能再分解的性状称为单位性状(unitcharacter)。数量分类学原理和方法1-3一·数量分类的基本概念(二)分类

2、分析1、聚类分析运用数学方法研究OUT(或性状)之间的亲疏程度,以此为依据将一批OUT(或性状)聚合为若干OUT组(或性状组)。常用的方法有聚合法、分裂法、加入法、图论法、模糊法、动态法。数量分类学原理和方法1-4一·数量分类的基本概念(二)分类分析2、排序分析多数数量分类问题中,性状之间往往具有一定的相关性。利用这种相关性,可用若干综合指标去代替全部性状。为了使较少的综合指标尽可能全面地反映原来全部性状的信息,运用数学方法对性状进行压缩,并在压缩的空间中对OTU进行排序。这就是排序分析。常见的有主成分分析(principalcomponentsanal

3、ysis)和主坐标分析(principalcoordinateanalysis).数量分类学原理和方法1-5一·数量分类的基本概念(二)分类分析3、判别分析所谓判别分析是在已对若干样本划分类群的基础上,根据某一OUT的性状综合判别它应置于哪个类群之中。常用方法有距离判别(distancediscriminatory)、贝叶斯判别(Bayesdiscriminatory)等。数量分类学原理和方法1-6一·数量分类的基本概念(二)分类分析4、分类分析和统计分析的区别不是随机样本不随机取样数量分类学原理和方法1-7一·数量分类的基本概念(二)分类分析5、数量分

4、类学的优点(1)具有综合多种来源数据的能力;(2)大部分分类过程自动化,效能大为提高;(3)以数值形式编码,便于电子化管理和交流;(4)因为方法是定量的,故可提供更大示差判别且在划分类元上更为灵敏;(5)使用更多更好的性状,改善了常规分类质量;(6)是对分类学原理和分类目的的重新审查;(7)其研究结果导致了若干生物学概念的重新解释。数量分类学原理和方法2-1二·性状的选取与量化(一)性状选取的原则1、初选性状应尽可能地广泛采用各方面的信息;2、复选时,首先从初选性状中删掉无意义的性状;3、删除不稳定和极稳定的性状;4、对性状的相关性进行分析,删除逻辑相关

5、性状和无意义的经验相关性状;5、考虑性状选取的难易程度,及实验的可重复性。从生物学的观察记录直接得到的性状称为基本性状(fundamentalcharacter),从基本性状利用数学方法间接得到的性状称为导出性状(inducedcharacter)。数量分类学原理和方法2-2二·性状的选取与量化(二)性状编码1、编码类型1)二态性状2)定量多态性状(连续性状)3)定性多态性状(1)有序多态性状(2)无序多态性状a、转化为有序多态性状b、分解成二态性状数量分类学原理和方法2-3-1二·性状的选取与量化(三)数据标准化对m个OUT的n个性状全部编码赋值后,可

6、以排列成如下矩阵:x11x12…x1nx21x22…x2nX={xij}m*n=OTUi…………xm1xm2…xmnX称为原始数据距阵;行向量分别是同一OUT中不同性状的编码值;列向量分别是不同OUT中同一性状状态的编码值。数量分类学原理和方法2-3-2二·性状的选取与量化(三)数据标准化因为原始数据来源不同,代表的意义不同,所以度量的标准也不同。其差异导致量纲大的掩盖量纲小的。所以必须对性状进行重新标度,即对原始数据距阵进行标准化处理。标准化的主要方法有7种:1、总和标准化公式:yij=xij/∑xij每列元素之和分别除该列元素性质:∑yij=10<=

7、yij<=1数量分类学原理和方法2-3-3二·性状的选取与量化(三)数据标准化2、最大值标准化公式:yij=xij/MAXxij用每列最大值分别除该列元素性质:MAXyij=10<=yij<=13、极差标准化公式:yij=(xij–MINxij)/(MAXxij–MINxij)用每列的极差除该列元素与最小值之差性质:MAXyij=10<=yij<=1数量分类学原理和方法2-3-4二·性状的选取与量化(三)数据标准化4、模标准化公式:yij=xij/√∑xij2用列向量的模(每列元素平方和的平方根)除该列元素性质:∑yij2=10<=yij<=15、中心化

8、公式:yij=xij–(∑xij)/m用每列元素减去列向量的形心(均值)性质:∑

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。