贝叶斯分类ppt课件.ppt

贝叶斯分类ppt课件.ppt

ID:59466227

大小:1.15 MB

页数:56页

时间:2020-09-14

贝叶斯分类ppt课件.ppt_第1页
贝叶斯分类ppt课件.ppt_第2页
贝叶斯分类ppt课件.ppt_第3页
贝叶斯分类ppt课件.ppt_第4页
贝叶斯分类ppt课件.ppt_第5页
资源描述:

《贝叶斯分类ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘:朴素贝叶斯分类王成(副教授)华侨大学计算机科学与技术学院1.概率论基本知识确定事件:概念是确定的,发生也是确定的;随机事件:概念是确定的,发生是不确定的;模糊事件:概念本身就不确定。随机变量随机变量:随机事件的数量表示;离散随机变量:取值为离散的随机变量;连续随机变量:取值为连续的随机变量;频率和概率(概率的频率学派解释)频率:试验在相同的条件下重复N次,其中M次事件A发生,则A发生的频率为:fN(A)=M/N;概率:当N很大时,频率会趋向一个稳定值,称为A的概率:联合概率和条件概率联合概率:设A,B是两个随机

2、事件,A和B同时发生的概率称为联合概率,记为:P(AB);条件概率:在B事件发生的条件下,A事件发生的概率称为条件概率,记为:P(A

3、B);乘法定理:P(A

4、B)=P(AB)/P(B)。概率密度函数概率分布函数:设X为连续型随机变量,定义分布函数;F(x)=P(X≤x);概率密度函数:给定X是随机变量,如果存在一个非负函数f(x),使得对任意实数a,b(a

5、(A

6、B)反映了B发生之后,事件A发生的可能性大小,通常称之为后验概率贝叶斯公式P(cj

7、x)=P(x

8、cj)P(cj)P(x)先验概率P(cj)联合概率P(xcj)后验概率P(cj

9、x)先验概率P(cj)P(cj)代表还没有训练数据前,cj拥有的初始概率。P(cj)常被称为cj的先验概率(priorprobability),它反映了我们所拥有的关于cj是正确分类机会的背景知识,它应该是独立于样本的。如果没有这一先验知识,那么可以简单地将每一候选类别赋予相同的先验概率。不过通常我们可以用样例中属于cj的样例数

10、cj

11、比上

12、总样例数

13、D

14、来近似,即后验概率P(cj

15、x)即给定数据样本x时cj成立的概率,而这正是我们所感兴趣的P(cj

16、x)被称为C的后验概率(posteriorprobability),因为它反映了在看到数据样本x后cj成立的置信度贝叶斯贝叶斯(ThomasBayes,1701—1761),英国牧师、业余数学家。生活在18世纪的贝叶斯生前是位受人尊敬英格兰长老会牧师。为了证明上帝的存在,他发明了概率统计学原理,遗憾的是,他的这一美好愿望至死也未能实现。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立

17、了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。1763年发表了这方面的论著,对于现代概率论和数理统计都有很重要的作用。贝叶斯的另一著作《机会的学说概论》发表于1758年。贝叶斯所采用的许多术语被沿用至今。贝叶斯思想和方法对概率统计的发展产生了深远的影响。今天,贝叶斯思想和方法在许多领域都获得了广泛的应用。条件概率在实际问题中,往往会遇到求在事件B已经发生的条件下,事件A的概率这时由于附加了条件,它与事件A的概率P(A)的意义是不同的我们把这种概率记为P(A

18、B)条件概率考虑一个医疗诊断问题,有两种

19、可能的假设:(1)病人有癌症。(2)病人无癌症。样本数据来自某化验测试,它也有两种可能的结果:阳性和阴性。假设我们已经有先验知识:(1)在所有人口中只有0.008的人患癌症。(2)此外,化验测试对有癌症的患者有98%的可能返回阳性结果,对无癌症患者有97%的可能返回阴性结果。条件概率上面的数据可以用以下概率式子表示:P(cancer)=0.008P(无cancer)=1-P(cancer)=1-0.008=0.992P(阳性

20、cancer)=0.98P(阴性

21、cancer)=1-P(阳性

22、cancer)=1-0.98=0

23、.02P(阴性

24、无cancer)=0.97P(阳性

25、无cancer)=1-P(阴性

26、无cancer)=1-0.97=0.03假设现在有一个新病人,化验测试结果为阳性,是否将病人断定为有癌症呢?在这里,Y={cancer,无cancer},共两个类别,这个新病人是一个样本,他有一个属性阳性,可以令x=(阳性)。条件概率我们可以来计算各个类别的后验概率:P(cancer阳性)=P(阳性

27、cancer)*p(cancer)=0.98*0.008=0.0078P(无cancer阳性)=P(阳性

28、无cancer)*p(无cance

29、r)=0.03*0.992=0.0298P(阳性)=P(cancer阳性)+P(无cancer阳性)=0.0078+0.0298P(cancer

30、阳性)=P(cancer阳性)/P(阳性)=0.0078/(0.0078+0.0298)=0.207P(无cancer

31、阳性)=1-P(癌症

32、阳性)=1-0.207=0.7

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。