垃圾邮件过滤算法的研究与应用.doc

垃圾邮件过滤算法的研究与应用.doc

ID:53450209

大小:400.36 KB

页数:41页

时间:2020-04-03

垃圾邮件过滤算法的研究与应用.doc_第1页
垃圾邮件过滤算法的研究与应用.doc_第2页
垃圾邮件过滤算法的研究与应用.doc_第3页
垃圾邮件过滤算法的研究与应用.doc_第4页
垃圾邮件过滤算法的研究与应用.doc_第5页
资源描述:

《垃圾邮件过滤算法的研究与应用.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、垃圾邮件过滤算法的研究与应用摘要Internet的问世带来了电子邮件业务的出现,电子邮件以其快捷、方便、低成本的特点广泛普及和繁荣,成为了信息交流的重要渠道,也是人们信息获取的重要途径。然而,随之而来的大量垃圾邮件占用了有限的存储、计算和网络资源,甚至威胁到系统安全。垃圾邮件的处理耗费服务器提供商和用户大量的时间和财力,影响用户的正常工作、生活和学习。垃圾邮件带来的诸多问题已严重干扰电子邮件的正常应用,如何有效治理垃圾邮件已成为现代社会迫切关注的话题,同时也是目前互联网上亟待解决的问题。因此提出一套行

2、之有效的垃圾邮件过滤算法并设计出高效率的垃圾邮件过滤系统有着重要的现实意义。本文首先对垃圾邮件进行了概述,并对当前垃圾邮件过滤技术进行综合介绍。其次,在全面系统地学习了国内外反垃圾邮件领域的最新成果的基础上,总结了各种垃圾邮件过滤技术的优点和不足,并得出一般的垃圾邮件过滤步骤。垃圾邮件过滤本质上是文本分类的问题,而贝叶斯算法是目前最受欢迎的文本分类算法,因此贝叶斯算法在垃圾邮件过滤领域可以有着良好的应用。接着对贝叶斯算法及国内外贝叶斯算法在垃圾邮件过滤系统中的应用情况进行了深入研究和全面分析,将其运用

3、在中文垃圾邮件过滤系统中,并设计了基于贝叶斯算法的中文垃圾邮件过滤模型。在此基础上,本文基于SSH框架、JQUERY和MYSQL数据库等设计并开发了基于贝叶斯算法的邮件过滤系统。为了适应中文邮件的处理,引入中文分词机制,并结合了基于邮件地址的黑白名单过滤,弥补邮件的误判,提高了系统的过滤效率、正确率和时空效率。同时,黑白名单过滤允许用户手动添加,提高了系统的灵活性。整个过程对用户来说是透明的,不会影响用户的正常网络行为。经过测试,系统的正确率为95%。垃圾邮件制造和垃圾邮件过滤本身就是一对矛盾,双方都

4、在不断的发展。在功能上没有永远完美的垃圾邮件过滤技术。所以,在最后本文对垃圾邮件过滤技术今后的研究方向进行了展望。关键字:垃圾邮件,过滤,黑白名单,贝叶斯算法,中文分词ResearchandapplicationofSpamfilteringalgorithmAbstractTheadventofInternethasbroughttheemergenceofe-business,e-mailwithitsfast,convenientandlowcostcharacteristicwidesprea

5、dpopularizationandprosperity,hasbecomeanimportantchannelforinformationexchange,alsoanimportantwaytopeopleaccessingtoinformation.However,thesubsequentlotsofSpamoccupiedthelimitedstorage,computingandnetworkresources,eventhreateningthesystemsecurity.Proces

6、singofSpamcostserverprovidersandusersalotoftimeandmoney,affectsnormalusers’work,theirlifeandlearning.Spamhascausedmanyproblemsseriouslyinterferingwiththenormale-mailapplication,howtocontrolspamhasbecomeatopicofpressingconcerninmodernsociety,butalsoprese

7、ntproblemstobesolvedontheInternet.Thereforeproposinganeffectivespamfilteringalgorithmanddesigningahighlyefficientspamfilteringsystemhasimportantpracticalsignificance.Thispaperprovidesanoverviewofspam,andspamfilteringtechnology,thecurrentoverview.Secondl

8、y,onthebasisofsystematicstudyofthelatestspamfilteringachievementsinthefieldoftheanti-spamathomeandabroad,thispapersummarizesthestrengthsandweaknessesofvariousspamfilteringtechnology,anddrawgeneralspamfilteringstep.Spamfilteringis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。