基于k-近邻算法与决策树的数据流分类算法-论文.pdf

基于k-近邻算法与决策树的数据流分类算法-论文.pdf

ID:57924223

大小:410.16 KB

页数:2页

时间:2020-04-14

基于k-近邻算法与决策树的数据流分类算法-论文.pdf_第1页
基于k-近邻算法与决策树的数据流分类算法-论文.pdf_第2页
资源描述:

《基于k-近邻算法与决策树的数据流分类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯实用第一智慧密集..。。.。。。。,.⋯。。。。.。。...。基于k一近邻算法与决策树的数据流分类算法朱俚治(南京航空航天大学信息中心,南京210016)摘要:将k-近邻算法和决策树这两种算法结合在一起形成一种新的分类算法,提出的数据流分类算法具有某些方面的智能性,能够在一定程度上识别已知和未知的数据流。关键词:决策树;后一近邻算法;数据流在网络中的各种数据流中既存在相似的属性也存在不同的‰≈分别表示两个训练实例,两个实例属性之间的差值属性,因此,数据流

2、分类的过程就是将不同的数据流属性匹配广—————————一的大小可以使用距离公式a(x,xj);、f(()-ar(x,))来计的过程。在这一匹配的过程中存在数据流属性相似程度强与相似程度弱的问题。如果两种数据流的属性相似程度强,则未知算_l_引,y=d(,≈)公式表示实例施与分类属性之间的距离,数据流属于已知数据流的范围,如果数据流的属性相似程度弱,为了找到与实例她的属性最为接近的实例%则这时需要使用则这时数据流的属性匹配不成功。事实上在数据流属性匹配的距离公式计算出实例所有分类属性与实例的属性距

3、离,过程中。某些未知数据流的属性与已知数据流的属性相似程度如果找到了筏最为接近的,,这时实例甄与达到最邻近值。可能强,可能弱.因此数据流属性的匹配是一个模糊的概念。1.2k一近邻算法距离公式在一近邻算法是实体分类的算法。一近邻算法对实例进行代表要求分类的实例,该实例有n个属性。‰表示实分类时必须根据已知实例。该算法在识别数据的属性时,必须例A进行分类时的能够起到分类作用的属性,B表示储存器提取待分类实例的各种属性.再将该实例的各种属性分别与已中一个的实例。实例曰具有的属性b。知实例的各种进行逐一比

4、较fI】。在最终的比较结果中如果有k个d。表示Ⅱ。与b之间的距离,表示0与b之间的距离,实例与待分类的实例属性相同,那么就将这个待分类的实例与以表示。与b,之间的距离⋯⋯表示o。与b之间的距离。k个实例分为一类【lJ。该算法在实体的相似性匹配的过程中,求在下的分析和讨论中:得的距离存在较优的解,优解,更优解,最优解的等级。di或都表示实例A某个属性值与实例某个属性b决策树是基于一种机器寻找最优解的分类算法。决策树值的距离。分类算法对实例进行分类时,必须根据已有的知识,使它与当d~>d/或dI>时,

5、函数y=l厂()=1-手l表示的含是di偏离已知的知识之间的误差最小。由于通过一近邻算法求得解的的程度或者偏离di的程度。因此有以下的讨论:属性存在较为优的解,优的解,更优,因此通过决策树的算法将一近邻算法求得的解进行分类,最终找到最优的解,最(1)’d/,>1,fe(1,3⋯5⋯.2n+I),/∈(2,4,6⋯⋯2n)终使得未知数据流和已知数据流得到较好的匹配结果。在将未知数据流和已知数据流称为实体。①y=I1-值越大,的值就越小。当d~-dj的差值越大lk一近邻算法时,则选择解的属性优于d。基

6、于实例的学习方法中的最基本的是一近邻算法。这个算法假定所有的实例对应于n维空间中的点。一个实例的最②=I一I值越小,这时一aI的差值就变小,但又di>d/,近邻是根据标准欧氏距离定义的。更精确地讲把任意的实例因此这时d『的解优于。表示为下面的特征向量口1。(2)‘dI,(q(),(x),⋯()),f∈(1,3’5l1.⋯2n+1),_,∈(2,4,6⋯⋯2)其中,嘶()表示实例的第r个属性值。那么两个实例托和间的距离定义为d(%),其中【1:①y=1-值越大,dl的值就越小。当d一的差值越大压■—

7、———一,(下转第88页)d(x,)1Y/∑(口,(Xt)一aj.(rel基金项目:北京航空航天大学软件开发环境国家重点实验室1.1距离公式开放基金资助项目(SKLSDE一2013KF一02)。压■————一[1-31(t,xj)z1f∑(()一aAxjP作者简介:朱俚治(1980一),男,本科,工程师。收稿日期:2015一叭一l4

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。