基于机器学习方法的网络流量分类研究

基于机器学习方法的网络流量分类研究

ID:24597889

大小:3.47 MB

页数:139页

时间:2018-11-15

基于机器学习方法的网络流量分类研究_第1页
基于机器学习方法的网络流量分类研究_第2页
基于机器学习方法的网络流量分类研究_第3页
基于机器学习方法的网络流量分类研究_第4页
基于机器学习方法的网络流量分类研究_第5页
资源描述:

《基于机器学习方法的网络流量分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、·分类号TP391密级UUUUUU基于机器学习方法的网络流量分类研究研究生姓名:邓河指导教师姓名、职称:阳爱民教授学科专业:计算机应用技术研究方向:智能信息处理湖南工业大学二00九年五月三十日···-···-···-···摘要随着互联网络的日益发展和普及,网络流量数据正以惊人的速度增长,它在给人们带来方便的同时,也面临着如何有效地对这些海量数据进行分析,以提高互联网络服务质量以及促进互联网更快、更好的发展。这篇论文主要研究基于机器学习方法的网络流量分类以及相关技术。包括网络流量数据采集、特征产生、样

2、本标识、特征选择,以及应用机器学习方法对网络流进行分类等技术。在基于机器学习方法的网络流量分类研究中,网络流量样本,包括训练样本、测试样本的获取是非常重要的一步。首先我们通过Sniffer的方法捕获网络报文,然后将采集到的报文按五元组进行分类为流,再结合Packet-Level和Flow_Level两个层面上的信息,在报文属性(大小、个数、时间、标志位)、流的属性(时间)上做了认真的分析和研究,产生了37个网络流量统计特征,形成了表示网络流的特征向量。在网络流量样本的标识上我们结合了基于端口、基于有

3、效载荷,协议分解等多种方法,实现了样本的自动标识系统,标识的正确率高。在特征选择方面,运用特征距离以及遗传算法进行综合选择,这种方法可以有效地找到较好的遗传算法的初始群体。从而能在较少的迭代次数当中找到较优的特征子集,实验结果表明提出的方法可以减少特征的数量,减少学习和分类的时间,同时还因去掉不相关或冗余特征,提高了分类的准确性。在基于机器学习的分类研究中,运用了六种不同的机器学习方法,对常见的网络流量应用类型进行了分类研究,并给出了实验结果,实验结果表明基于机器学习方法的网络流量分类可以避免传统网

4、络流量分类方法的缺陷,能够很好地分类那些采用动态端口或者协议加密的网络应用流量类型。在上述研究的基础上,设计并实现了基于机器学习方法的网络流量分类系统(TrafficClassificationSystemBasedonMachineLearning,TCSBML),系统包含网络流量数据采集、网络流量数据分析以及分类等几大功能模块,具有一定的实用价值。关键词:网络流量分类,特征选择,机器学习,特征距离,遗传算法I···-···ABSTRACTWiththedevelopmentandpopulari

5、zationofinternet,networktrafficdatahasbeengrowingataremarkablerate,whichbringstheconveniencetothepeople,yet,makesthemtofacehowtocarryontheanalysiseffectivelytothesemassdataandimprovetheInternetQualityofServiceaswellaspromotingInternetintoaquickerandbet

6、terdevelopment.Thispapermainlydoesresearchintrafficclassificationbasedonmachinelearningmethodandrelatedtechniques,includingsnifferingthenetworktraffic,generatingthestatisticalfeatures,assigningtheflowexample,featureselection,andclassifyingapplicationty

7、peofnetworktraffic.Innetworktrafficclassificationsbasedonthemachinelearningmethod,gainingthenetworkflowssample,includingtrainingexampleandtestexample,isveryimportant,firstly,weobtainthenetworkpacketsbysniffering,andclassifythegatheringnetworkpacket’sin

8、tonetworkflowsaccordingtofivetuples,secondly,afterintegratingtheinformationfromPacket-LevelandFlow-Level,andanalyzingthepacket’sattributes(size,count,time,flag)andflow’sattributes(time),37statisticalfeaturesaregeneratedandthefeaturevect

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。