文本分类算法的研究与实现

文本分类算法的研究与实现

ID:35082912

大小:5.39 MB

页数:62页

时间:2019-03-17

文本分类算法的研究与实现_第1页
文本分类算法的研究与实现_第2页
文本分类算法的研究与实现_第3页
文本分类算法的研究与实现_第4页
文本分类算法的研究与实现_第5页
资源描述:

《文本分类算法的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、'■.--■->-V::;:/;;?‘>.>':.v:,r?.軒v...?’.:'r'.■:..:密级!保密期限:名A乂變硕±学位论文.吗'女本分类算法的研究与实现'.:鸣■ResearchandImplementationofTextClassi打cation敎乂Igorkhm、,I?.、.:.?’^■i?.学号E132010巧f姓名史森学位类别工学硕±计算机应用

2、技术aiiSi^.,三—指导教师刘锋.;完成时间2016年5月—'答辩委员会■M;]‘主席签名《^/?J|'手■■■1:-i'1'■^V‘.‘.'.r.■?,’-‘.…??‘!'.,..-t.V.?■???I*?'.A?-'■'?'、V..?';;I''?'’?.■-->,.'-\?.臺c:.1:.Iv;;i

3、,^‘.管/去式t说户元.说站产某斬"名'V啤I‘';,7?冷,乂二独创性声明本人声明所呈家的学位论文是本人在导师指导下进行的研究工作及取得的■L研究成果。据我所知,除了文中特别加X标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安徵大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均臣在论文中作了明确的说明并表示谢意。日-:节A年;月学位沧文作者签薄:签字期花曰学位论文版权使巧授权书、本学位论文作者完全了解安徵大学

4、有关保留使用学位论文的规定,有权.保留并向国家有关部口或机构送交论文的复印件和磁盘,允背论文被查阅和借亂本人授权安徽大学可レ乂将学位论文的全部或部分巧容编入有关数据库进行检L索,可义采用影印、缩印或扫描等复制手段保存、汇编学位论文《(保密的学位论文在解密后适用本授权书)'学位论文作者签遂:空餐导师签名:矣卷章I巧期曰签曰^ク^曰签字:年;月K字期:年j月安徽大学硕±学位±论文摘要摘要随着互联网技术的蓬勃发展及其普及应用,用户迈入了信息快速发展的时一一代。方面,如此庞大的信息库满足了用户对各

5、类信息的需求,而另方面,信息库中内容过于繁杂一,想要准确检索到所需信息己成为个难题。为了解决此类由信息过载引起的问题,,文本分类技术被提出文本分类是依据已标记类别的信息,判别新信息的类别,能有效处理和组织互联网上的海量信息,它可W让用户更加方便快捷地获得所需信息。目前,虽然己有很多针对分类性能改进的方法,但随着信息库的快速膨胀,执行分类算法时,面临着如何快速准确找出具备代表性数据的问题,特征选择和特征加权对该问题有着最直接的影响,因此,本文主要围绕送两个过程进行深入;基于蚁群算法的特征选择研究,并提出相

6、应的改进方法为,W及结合类别先验信息和特征项分布情况改进的加权方法。本文的主要工作可概括为:1.重点介绍了凡种典型的特征选择方法和特征加权方法,分析了它们的优势与不足。2.针对文本分类中初始特征空间维数过高及恃征冗余问题,结合蚁群算法和特征选择过思采用了基于蚁群算法的特征选择方法。该方法基于对评估函数、状态转移规则和信息素更新规则的研究设计,并引入局部搜索机制,由此可有效排除大量的关联特征和冗余特征。3TF-IDF.针对传统的特征加权方法只是单纯的考虑到特征项的词频,而忽略了类别先验信息及特征项

7、在整个训练集分布情况对分类结果的影响,本文分两--TF-IDFDFTFRF步对传统加权方法进行改进:首先结合町E加权方法和加权.方法-RFDF特F-IDF,提出TFI征加权方法RF加权方法的基础上,根;然后在T一据炯的概念,推出类内和类间信息分布摘的参数,由此提出种有效的加权方法一TF-RFIDFi?p,进步提离了特征项权呈的准确性。实验表明,改进后算法的查F一准率、查全率及测试值均比传统算法的值有所提离,从而进步证实了改进算法提高了文本分类的性能。TF-RF关键词:蚁群算法;特征选择;;信息分布煽;特征加

8、权I安徽大学硕±学位论文文本分类算法的研究与实现AbstractWiththeboomindevelomentoftheInternettechnoloandoularizationof

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。