基于否定选择变异算法的电子邮件过滤器

基于否定选择变异算法的电子邮件过滤器

ID:5262944

大小:379.26 KB

页数:5页

时间:2017-12-07

基于否定选择变异算法的电子邮件过滤器_第1页
基于否定选择变异算法的电子邮件过滤器_第2页
基于否定选择变异算法的电子邮件过滤器_第3页
基于否定选择变异算法的电子邮件过滤器_第4页
基于否定选择变异算法的电子邮件过滤器_第5页
资源描述:

《基于否定选择变异算法的电子邮件过滤器》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、万方数据第26卷第10期2006年10月计算机应用ComputerApplicationsV01.26No.10Oct.2006文章编号:1001—9081(2006)10—2304一03基于否定选择变异算法的电子邮件过滤器傅明,任贤,陈曦(长沙理工大学计算机与通信工程学院,湖南长沙410076)(fuming@csust.edu.cn)摘要:为提高智能邮件过滤系统的识别能力和抗欺骗能力,设计并实现了一种基于否定选择变异算法的电子邮件过滤器。其机理是应用人工免疫算法使得过滤系统具有自学习、自适应能力,同时采用双层过滤方式来提高系统过滤准确性。试验表明该过滤器在正确率、漏报率、误报率三方面具

2、有良好的性能,达到了预期目的。关键词:电子邮件过滤器;否定选择算法;变异中图分类号:TP309;TP393.098文献标识码:AApplicationofnegatiVeselectionmutationalgorithminE-mail6lterFUMing,RENXian,CHENxi(cD比弘矿cDmpu抛ro蒯cDmmun池如H魄i船e一增,c地,l伊地№而e瑙毋矿&据Me口nd死c^加妞拼吼。邶^o执耽n410076,吼im)Abstmct:InordertoenhaIlcetheidentmcation蛐darIti-fhudcapabilitiesoftheintellige

3、mE—mailmaIlagementsystem,aknd0fE-mailfilterbasedonnegativeselectionmutationalgoritllmwasdesignedandimplementedinthjspaper.Theapplicationoftheartificialimmunology叫nciplemakestheE—mailfilterhavethecapabilitiesofsemstudying蚰dsemadapfing.Meanwhile,theveracityoft11esystemisimpmvedbyad叩石ngthedoubledeck矗

4、lfdngmethod.neexpedmentalreslll协showthatthisfiheringsystemh鹊betterpe面珊粕ceinacc哪cymte,false—positivesrateand跚se_negatiVesrate,锄dachievesexpectedaims.Keywords:E—mailfilter;negativeselectiona190甜瑚;mutationO引言基于内容的电子邮件过滤技术是当前的一个研究热点。文献[1,2]等采用的贝叶斯算法以其极高的准确率在过滤技术中具有重要地位,但贝叶斯模型对于未知样本,特别是对已有样本的变异样本和利用贝叶斯

5、模型生成的垃圾邮件样本的分类结果不佳。文献[3]采用神经网络技术来实现邮件过滤,但是这种方法有效的控制模型的复杂度和数据过拟合问题。文献[4,5]设计了一种遗传算法和神经网络相结合的过滤器,它相对前面的几种过滤系统在各方面都有一定程度的改进,但还是没能解决对于变异样本的过滤问题。文献[6]利用克隆选择变异算法来实现垃圾邮件过滤,其结果说明基于人工免疫原理的邮件过滤器能够获得较好的过滤结果。本文以提高邮件过滤系统的识别能力和抗欺骗能力为目标,构造了一种基于否定选择变异原理的双层邮件过滤模型。试验证明该过滤系统在准确率、漏报率、误报率方面性能良好。1基于否定选择变异原理的垃圾邮件过滤器在人类免

6、疫系统中,淋巴细胞的作用是区分“自我”和“非自我”。“自我”是指人体自身的细胞,而“非自我”是指病原体、毒性有机物和内源的突变细胞或衰老细胞。淋巴细胞能对“非自我”成分产生应答,以消除它们对机体的危害;但对“自我”成分,则不产生应答,以保持内环境动态稳定,维持机体健康。1.1邮件过滤器的模型利用人工免疫原理,将基因库生成、否定选择、遗传变异应用到邮件过滤系统中,根据它们各自的特点,改进成熟检测集的准确性,采用双层过滤模式提高邮件过滤的准确性。图1邮件过滤器结构本文设计的过滤器工作机理为:通过对基因库中随机生成的染色体进行否定选择,生成初始的检测集

7、sⅣ。设计两个自身集合s,

8、s1,其中s用

9、来检测随机生成的初始抗体和经过了遗传交叉变异等过程生成的新抗体是否属于自身正常细胞;.s1则为一个大小为£(L不能过大)的自身集,它的作用是在过滤邮件时作为第一轮过滤时的检测集,引入的原因是:在某段时间内人们收到的邮件可能具有更多的共性,尤其是一些公函,它们的格式固定,内容也基本相近,因此,通过这么一个容量不大的自身检测集可以迅速判断出这些邮件的性质,而减少与容量大的垃圾邮件检测集进行否定选择的待过滤邮收稿日期:2006

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。