垃圾邮件的防范与过滤

垃圾邮件的防范与过滤

ID:43948454

大小:37.50 KB

页数:7页

时间:2019-10-17

垃圾邮件的防范与过滤_第1页
垃圾邮件的防范与过滤_第2页
垃圾邮件的防范与过滤_第3页
垃圾邮件的防范与过滤_第4页
垃圾邮件的防范与过滤_第5页
资源描述:

《垃圾邮件的防范与过滤》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、垃圾邮件的防范与过滤关键词:垃圾邮件;防范方法;过滤技术;过滤软件;随着Internet的迅速普及,电子邮件以其快捷、方便、低成本的特点逐渐成为人们进行信息交流的主要媒介之一,但垃圾邮件也越來越泛滥。企业资源和个人信息正在不断被其攻击和侵犯。用户如何防范垃圾邮件,减少垃圾邮件的干扰,已经成为社会和邮件使用者关心的焦点问题。木文由垃圾邮件的丿力史、定义、现状及其危害出发,提出了切实可行的防范措施,讨论了电子邮件的过滤方法以及一些常用的技术,对目市场上前沿的反垃圾邮件技术介绍和分析。1垃圾邮件1.1垃圾邮件的历史垃圾邮件并不是在电子邮件技术出现后就马上出现的。从其产生的历史过程中

2、,可以看到互联网是如何从一个学术和交流的平台逐步变为商业工具的。1978年,DEC公司的一位营销人员突发奇想,认为直接通过ARPANET邮件的方式来推销他们的计算机是一种很好的方法。于是他和公司里的其他人收集了ARPANET用户的地址,并将广告信向所有这些用户发送,这就是历史上第一封真正意义上的垃圾邮件。Internet取代ARPANET后,在20世纪80年代和90年代早期,网络上一些人则开始收集和贩卖邮箱地址。1995年8月,第一次有人公开贩卖20万个邮箱地址;……到2001年8月,已经有内含2.1亿个邮箱地址的列表在出售了。各种垃圾邮件网站和组织也开始出现。1.2垃圾邮件

3、的种类中国反垃圾邮件中心2005年公布,用户收到的垃圾邮件中,“网上购物”、“IT产品推销”、“情趣用品”、“政治种族”四种邮件,占到用户收到垃圾邮件的前四位。垃圾邮件的语言种类统计,中英文垃圾邮件比例占到97.45%,其他语言所占比例可以忽略不计。垃圾邮件的文件格式排名中,用户收到最多的是“HTML网页”格式的垃圾邮件,其次是“纯文本”邮件和“图片”邮件,占到用户收到垃圾邮件比例的83.4%01・3垃圾邮件的危害垃圾邮件是因特网带给人类最具争议性的副产甜,它的危害主要表现:1)占用网络带宽,降低网络运行效率。2)侵占信箱空间,侵犯收件人的隐私权,损害了他人的信誉。3)劳动生

4、产率下降。每年浪费在处理垃圾邮件上的时间高达15亿小时。4)传播病毒,被黑客利用。5)严重影响ISP的服务形象。6)宣传邪教,蛊惑人心,传播谣言及色情等内容,。7)窃取密码,骗人钱财,对和谐社会造成了危害。2垃圾邮件的防范防范垃圾邮件的传播,主要从以下6各方面,其效果是立竿见影。1)设定好记但难以猜测的电子邮件账号2)不要随便公开你的电子邮件地址3)尽量采用转发的方式,转发到你的ISP的本地信箱4)尽量使用免费邮箱口分类使用5)不要回复垃圾邮件6)不要订阅非正式及不健康的电子杂志3过滤技术对抗垃圾邮件最重要的技术是过滤技术,过滤技术在过滤垃圾邮件主要基于以下三种方法:3.1基

5、于IP层的垃圾邮件过滤方法基于IP层的垃圾邮件过滤方法,其屮冇黑名单、白名单、实时黑名单和实时白名单等。黑白名单过滤:黑白名单是一个简单有效而最为常用的过滤方法,黑名单原理是把已知垃圾邮件制造者的域名或IP地址整理成列表,以此为依据,拒绝任何来自列表的邮件;白名单是黑名单的反义词,规定邮件接收者只接受自己信赖的邮件发送者所发送的邮件。其优点是对垃圾邮件处理能力的要求较低,它能够节省大量的带宽、存储容量和处理时间。缺点黑名单是基于用户的投诉和采样的枳累而建立的,当垃圾邮件制造者快速改变邮件地址时,处理效果将大幅下降,忽略垃圾邮件和过滤掉止常邮件的错误将相对增加。而対白名单来说,

6、如果以前获得批准的用户改变了邮件地址,用户必须再次将新地址列入白名单,否则将收不到该用户的电子邮件。3.2基于规则的垃圾邮件过滤方法就是在邮件标题和内容中寻找特定的模式,设置一些过滤规则。这些规则通常有信头分析、群发过滤、关键词精确匹配以及邮件内容中的其它特征。通过查找已有的垃圾邮件的匹配模式來过滤垃圾邮件,这需要依赖开发商不断的更新邮件规则。优点是规则较易理解和修改、易推广和共享。其缺点由于规则是静态,是由人来编写的,更新速度慢和时效性差便是它的软肋,,所以在规律性不明显的应用领域效果较差。其中最著名的规则过滤方法Z—是决策树方法,该方法通过按照某种属性的顺序自顶向下地生成

7、一棵树,树的每个节点是属性名,而每条边是属性值,从树根到树叶的一条路径便対应一条规则,使用决策树来过滤垃圾邮件,得到垃圾邮件过滤的正确率和召回率在88%左右.3.3基于统计过滤方法是对邮件内容统计分类的过滤方法,正确率高,速度快,是垃圾邮件处理技术中很受欢迎的一种方法,有广泛的应用前景。如贝叶斯,SVM,KNN等。3.3.1贝叶斯分类贝叶斯分类基于贝叶斯定理,理论基础是:在已知的垃圾邮件中,一些关键词出现的频率较高,而在非垃圾邮件中另一些关键词的出现频率较高,通过特定算法,建立垃圾邮件和非垃圾邮件关键词

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。