p2p流量监控分析服务系统研究与实现

p2p流量监控分析服务系统研究与实现

ID:34125588

大小:3.81 MB

页数:35页

时间:2019-03-03

p2p流量监控分析服务系统研究与实现_第1页
p2p流量监控分析服务系统研究与实现_第2页
p2p流量监控分析服务系统研究与实现_第3页
p2p流量监控分析服务系统研究与实现_第4页
p2p流量监控分析服务系统研究与实现_第5页
资源描述:

《p2p流量监控分析服务系统研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、蔺铮,虫害P2P流量监控分析服务系统研究与实现兰州大学硕士学位论文第二章相关技术主要介绍与P2P流量监控分析服务子系统相关的三项技术:P2P流量识别、网络爬虫和用户兴趣。其中,P2P流量识别技术为P2P监控系统的基础;网络主题爬虫通过采集P2P内容,便利了网内用户和运营商管理;用户兴趣提取对于内容热点服务具有极大的指导意义。2.1P2P流量识别现在的主流P2P应用有:提供文件共享服务的BT,EMule和迅雷,提供及时通信服务的ICQt61,QQ[71和Sk),pe[81,提供流媒体服务的PPlive[91,PPStreamtl01和Q

2、QLive[111。随着P2P结构[12-141的不断变换,特别是P2p文件共享‘151,P2P流量识别技术也不断更新。在端口上,从采用固定端口发展到使用可变端口进行数据传输;在传输内容上,从使用明文传输发展到对传输数据进行加密处理【16】;在应用上,L7.filter[17】和Cisco的NBAR等P2P过滤器【181的不断涌现。以下主要针对四种典型的识别技术进行讨论,包括端口识别技术、特征码识别技术、流量特征识别技术和连接模式识别技术。1)端口识别技术众所周知,端口紧密绑定于一些特定的服务。通常这些端口明确表明了某种服务,不可再重

3、新定义于其它对象。在P2P应用前期,大多数采用的都是固定端口技术。比较著名的有Gnutella的6346.6347端口,BT的6881.6889端口。在这种情况下,对其流量的识别方式与识别普通应用分组的方式完全相同:在需要监测的网络中被动收集分组,然后检查分组的运输层首部信息,如果端口号与某些特定的端口号匹配,则说明该分组即为P2P流量分组,可以按照预设的动作对其进行处理。这种识别方法最大的优点就是简单易行,它不需要进行复杂的分组处理即可得出结论。在P2P应用出现的初期它显得十分简单有效,但是随着P2P技术的发展,该方法的适用度也越来

4、越低。2)特征码识别技术随着端口识别技术的适用度降低,特征码识别技术的应用得到了普及。其识4萄嗣叶矢萼P2P流量监控分析服务系统研究与实现兰州大学硕士学位论文别方法是分析数据包的应用层信息,即对TCP或UDP的有效载荷进行检查,以判断是否符合P2P应用协议的特征码。文献【19,20]提出了一种利用应用层特征的方式对P2P流量进行识别。通过对常见的P2P协议(Kazaa,EMule,Gnutella和BT)的特征分析,提取出其特征信息,然后根据特征信息对收集到的分组进行模式匹配操作,从而判断出该分组是否属于某一类P2P应用分组。L7.f

5、ilter[211在应用层上实现了P2P协议特征码识别。常见P2P协议特征码如表2.1所示:表2.1常见P2P协议特征码P2P协议特征码Kazaa58ZD4B617A6161EMuleE3或CS或D(头两字节)Gnutella676e7574656c6e61BT2070726f746f636f6e该方法的优点为:1)能够识别可变端IEI的P2P流量:2)准确度和效率较高,实验结果表明,一般情况下,该方法的识别错误概率低于5%。其缺点在于:1)扩展性差,每出现一种新的P2P应用,就需进行修改;2)无法识别密文P2P协议。3)流量特征识别

6、技术为解决P2P流量的扩展性和加密型问题,从P2P流量的统计学特征出发,从流的角度进行识别,这就是流量特征识别技术‘22’23】。该技术记录每条流的信息,根据P2P流的内在特征,从而有效地对P2P流量进行识别和控制。P2P流量的常见特征为:i.P2P通信的上下行流量基本相当。有别于传统C/S模型的流量特征。相对于网页浏览、邮件、流媒体等传统业务,下行流量远大于上行流量。P2P通信时不仅要获得数据,同时也为提供数据,因此它的流量更多体现为上行下行基本对称的模型【24】;ii.P2P通信流量持续时间长、平均速率较高、总传输字节数大。这从表

7、2.2可以明显看出。这与文件传输如FTP等应用有些类似,但是该类应用可以很方便的通过端口号识别出来。另外,根据流所包含的字节数,筏埘虫害P2P流量监控分析服务系统研究与实现兰州大学硕士学位论文可以很容易将普通W曲流量同P2P文件共享流量区分开【251。表2.2常见协议流量特征协议持续时间平均速率总传输字节Http短高由低到高Games长低高Streaming长中高1、eJnet长低中P2P/Ftp长较高高该方法的优点在于:(1)扩展性好。并非针对特定的P2P协议,而是基于P2P流量特征,因此使用性广,扩展性高。(2)加密报文识别号。不

8、需要对分组内部用户数据进行检查,因此不受数据是否加密的限制。其缺点在于:(1)精度较差。由于其精髓在于P2P流量统计特征,不可避免地对识别引入了一些误差。(2)占用资源较大。由于需要记录每条流的信息,因此对内存空间以及处

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。