数据分析方法及模型.ppt

数据分析方法及模型.ppt

ID:51560497

大小:826.00 KB

页数:67页

时间:2020-03-23

数据分析方法及模型.ppt_第1页
数据分析方法及模型.ppt_第2页
数据分析方法及模型.ppt_第3页
数据分析方法及模型.ppt_第4页
数据分析方法及模型.ppt_第5页
资源描述:

《数据分析方法及模型.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、分析技术及模型——贝叶斯网1贝叶斯网(BayesianNetwork,BN)贝叶斯网是一种帮助人们将概率、统计应用于复杂领域、进行不确定性推理和数据分析的有效工具它起源于20世纪80年代中期对人工智能中的不确定性问题的研究,已经成为人工智能的一个重要领域近年来在国际上的影响不断扩大,对众多其它领域也产生了重要影响贝叶斯网的主要应用是进行概率推理,即计算一些事件发生的概率主要介绍贝叶斯网的基本概念、贝叶斯网推理、贝叶斯网学习2图论的基本概念介绍贝叶斯网的定义之前,先引入几个图论中的基本概念父节点、子节点:在一个有向图中,如果从节点X到

2、节点Y有一条边,那么X为Y的父节点,Y为X的子节点邻居节点:一个节点的所有父节点和子节点称为它的邻居节点根节点:没有父节点的节点叶节点:没有子节点的节点ABEMJ祖先节点:一个节点的祖先节点包括其父节点及父节点的祖先节点根节点无祖先节点B、E、A都是J的祖先节点3图论的基本概念后代节点:一个节点的后代节点包括其子节点及子节点的后代节点叶节点无后代节点非后代节点:一个节点的非后代节点包括所有不是其后代节点的节点有向环:在一个有向图中,若某节点是它自己的祖先节点,则该图包含一个有向环有向无环图:不包含有向环的有向图4贝叶斯网定义贝叶斯网

3、是一个有向无环图其中节点代表随机变量,节点间的边代表变量之间的直接依赖关系每个节点都附有一个概率分布,根节点X所附的是它的边缘分布P(X),非根节点X所附的是条件概率分布P(X/Par(X))结构图蕴含了条件独立假设,即给定一个变量的父节点集,该变量独立于它的非子孙节点节点之间的连接关系代表了贝叶斯网络的条件语义5贝叶斯网定义贝叶斯网也可以从定性和定量两个层面来理解在定性层面,它用一个有向无环图描述了节点之间的依赖和独立关系在定量层面,它用条件概率分布刻画了变量对其父节点的依赖关系在语义上,贝叶斯网是联合概率分布的分解的一种表示:如

4、果网络中的变量为,那么的联合概率分布为各变量所附的概率分布的乘积,即其中当时,就是边缘分布6贝叶斯网定义贝叶斯网的联合概率分布分解降低了概率模型的复杂度,使知识的获取与表达得以简化,为概率计算提供了很大方便贝叶斯网的优点:是严格的数学语言,适合于计算机处理直观易懂,方便人们讨论交流和建立模型提供了人类推理过程的一个模型因为依赖和独立关系是人们日常推理的基本工具,而且人类知识的基本结构也可以用依赖图来表达7贝叶斯网与概率推理推理(inference)是通过计算回答查询(query)的过程使用概率方法进行不确定性推理就是:(1)把问题用

5、一组随机变量来刻画(2)把关于问题的知识表示为一个联合概率分布(3)已知某些变量的取值,计算另外一些变量的后验概率分布已知变量通常称为证据变量,记为(),它们的取值记为;需要计算其后验概率分布的变量称为查询变量,记为,()概率推理的根本任务就是给定证据变量集合后,计算查询变量集的概率分布,即:8贝叶斯网与概率推理由于和可以根据联合概率P(X)的边缘化而求得,因此要在一些随机变量之间进行概率推理,理论上只需要一个联合概率分布P(X)即可但是,直接使用联合概率分布P(X)进行不确定性推理的困难很明显,即它的复杂度极高一般地,n个二值变量

6、的联合概率分布包含2n-1个独立参数所以,联合分布的复杂度相对于变量的个数成指数增长。当变量很多时,联合概率的获取、存储和运算都变得十分困难,推理变得不可行9贝叶斯网与概率推理贝叶斯网的提出就是要解决推理的复杂性问题,构造贝叶斯网的主要目的就是进行概率推理从技术层面讲,贝叶斯网是一种系统地描述随机变量之间关系的语言,它利用变量间的独立关系将联合概率分布分解成多个复杂度较低的概率分布,从而大大降低了知识获取的难度和模型表达的复杂度,提高推理效率,使得人们可以应用概率方法来解决大型问题贝叶斯网是概率论与图论相结合的产物,它一方面用图论的

7、语言直观揭示问题的结构,另一方面又按照概率论的原则对问题的结构加以利用,降低推理的计算复杂度利用贝叶斯网可以完成因果推理、诊断推理、原因关联推理及混合推理10贝叶斯网与概率推理1.因果推理——是从原因到结果的预测推理已知R=t,计算P(W=t/R=t)2.诊断推理——是从结果到原因的预测推理已知W=t,计算P(R=t/W=t)3.原因关联推理——是对同一结果的不同原因之间的关联推理已知R=t和S=t都是导致W=t的原因,已知W=t后,对R=t的信度为P(R=t/W=t),如果又知道S=t,对R=t的信度为P(R=t/W=t,S=t)

8、4.混合推理——是上述3种类型的混合已知C=t和W=t,计算P(S=t/W=t,C=t)有因果推理,又有诊断推理11贝叶斯网与概率推理贝叶斯网推理算法包括精确推理和近似推理两类精确推理得到精确的概率值,近似推理得到近似的概率值常用的精

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。