人工智能(六)知识发现与数据挖掘.ppt

人工智能(六)知识发现与数据挖掘.ppt

ID:62763736

大小:328.00 KB

页数:49页

时间:2021-05-23

人工智能(六)知识发现与数据挖掘.ppt_第1页
人工智能(六)知识发现与数据挖掘.ppt_第2页
人工智能(六)知识发现与数据挖掘.ppt_第3页
人工智能(六)知识发现与数据挖掘.ppt_第4页
人工智能(六)知识发现与数据挖掘.ppt_第5页
资源描述:

《人工智能(六)知识发现与数据挖掘.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、人工智能ArtificialIntelligence北京信息科技大学计算机学院李宝安2知识发现与数据挖掘3数据库技术和计算机网络已经成为当前计算机应用中的两个最重要的基础领域,触及到人类生活的各个方面。目前,全世界数据库和因特网中的数据总量正以极快的速度增长。虽然简单的数据查询或统计可以满足某些低层次的需求,但人们更为需要的是从大量数据资源中挖掘出对各类决策有指导意义的一般知识。数据的急剧膨胀和时效性、复杂性远远超过了人们的手工处理能力,人们迫切需要高性能的自动化数据分析工具,以高速、全面、深入、有效地加工数据。知识发现(Kn

2、owledgeDiscovery)与数据挖掘(DataMining)技术正是在这种背景下产生的,而其中表演重要角色的是机器学习中的发现学习技术。4知识发现与数据挖掘定理发现数据挖掘数据库及网络中的知识发现5定理发现发现在科学发展过程中起着举足轻重的作用。例如,在天文学、物理学、化学等领域中的早期科学研究中,经验公式的发现就占据很大的比例。一个著名的发现学习系统是由兰利(P.Langley)等设计的BACON系列。BACON系统试图再现人类在天文、物理、化学等领域发现定理和规律的过程,从而找出发现的机理。系统设计的本意也在于对人

3、类思维的探索。系统是以英国科学哲学家培根(1561-1626)命名的。6BACON系统从1978年的BACON1开始,至1982年发展到BACON5。BACON1只是一个简单的通用规则归纳器,用来求解序列预测问题及发现一些简单的定律。BACON2增加了启发式规则去处理序列信息,使系统能预测递归的符号序列及发现较复杂的多项式函数(如Bode定律)。BACON3则有较大的发展,系统用不同的描述层次(从低到高)来表示数据,最低层的是直接观察到的数据,最高层的描述则是较复杂的定律及解释已知数据的假说。这种逐层扩展的表示方式使系统可以把

4、下层发现的假说作为上层观察的数据,并可递归地应用启发式规则。BACON3重新发现了理想气体定律、开普勒第三定律、库仑定律、欧姆定律及伽利略单摆和匀加速度等定律。7尽管BACON系列中使用的方法各有差异,但都结合了类似的数据驱动型启发式来指导搜索有趣的定律。这正好与其它的发现系统,如里南(D.B.Lenat,1976)的AM,巴查纳(B.G.Buchanan)的META-DENDRAL的理论驱动发现技术相反。BACON4的重点是通过发现学习,把数据集合描述成某种简洁的形式,当然还包括了收集数据、形成解释性理论和实验预测等。BAC

5、ON4是一个发现经验公式的产生式系统,用于产生不同层次的信息描述。高层次的描述归纳低层次的描述。系统采用一组启发式来寻找符号(名词)型或数值型数据的规律,即数据中的不变性和趋势性,以期形成假说及按数据规律去定义推理项。启发式是用OPS5语言表示的产生式规则。BACON4也可扩展为数据驱动型通用的发现学习系统。下面就BACON4中假说的形成、推理项的确定及符号型变量固有性质的提出等几方面加以讨论。81、形成假说标准的科学分析方法把世界划分成数据(观察事实)和假说(定律)二部分。假说是对这些数据的解释和归纳。BACON4用一个统一

6、体实现这种二分法,在这个统一体中信息用不同层次的描述来表示,最低层的描述信息就是数据,而最高层的称为假说,在中间层次的则是这二种概念的混合。因此就某一层描述来说,比它低一层的描述是它的数据,而比它高层的描述是它的假说。9考虑某些服从理想气体定律的数据。这个定律可以描述为:PV/nT=8.32, 式中P是气体的压力,n是克分子量(摩尔数),T是温度,V是气体的体积。   假设给定BACON4系统的数据项是P=1,n=1,T=300,V=2496.0。如果前三项是在系统控制下的变量,则可以把它们的值看成是数据项V(因变量)取值的条

7、件。现在假定系统又搜集了另一些数据,在这些数据组中T、n保持不变,则BACON4发现总有PV=2496.0。这就形成了第二层假说,其归纳了所有具有类似条件的第一层观察描述(数据)。同时第二层的假说又可以看成是第三层假说依赖的观察描述(数据)。如果系统又可生成另一个第二层假说(通过变动T),这二个第二层假说(即描述)结合在一起又可导致第三层描述,可归纳出当n=1时,有PV/T=8.32。依此类推,当达到第四层描述时,系统就回到了理想气体定律。10为指导观察描述的逐层归纳,系统采用了经典的归纳推理启发式,如下:IF在L层上存在一组

8、描述,且这些描述中的因变量D具有相同的值V;THEN生成一个L+1层的描述,其指出D取值为V,且把L级的那组描述中的所有公共条件作为D取值为V的条件。   这个启发式指导寻找因变量取值相同的一组描述,因变量的值既可为数值也可为符号。BACON4系统容许待处理的数值数据中包含小

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。