信息检索系统算法库的研究论文

信息检索系统算法库的研究论文

ID:31979530

大小:1.57 MB

页数:49页

时间:2019-01-30

信息检索系统算法库的研究论文_第1页
信息检索系统算法库的研究论文_第2页
信息检索系统算法库的研究论文_第3页
信息检索系统算法库的研究论文_第4页
信息检索系统算法库的研究论文_第5页
资源描述:

《信息检索系统算法库的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文摘要伴随着万维同的发展,越来越多的人开始以网络进行生活、工作和学习。信息检索已经构成网络的一个不可或缺的因素。在进行信息检索时,用户希望能够检索出所有感兴趣的信息,这就需要滤掉不相关的信息,从而获得最有价值的信息。在这种情形下,Web数据挖掘应运而生。而挖掘算法种类繁多,每种算法都有其适用的情形。如何选择合适的算法进行数据处理成为人们面临的问题。本文针对上述问题及挖掘算法应用的普遍性,构建了算法库系统。该系统旨在为信息检索提供算法支持。我们给出了算法调用和管理的框架。通过映像和元对象协议实现算法

2、库的核心功能和系统控制功能的分离。这样,可以通过添加新的元对象来引入新的调用机制,而基本算法保持稳定。从而使系统具有良好的扩展性。在算法的选取中,考虑项目所要处理的数据特点,针对当前XML文档结构聚类算法的一些不足,提出采用段匹配的概念来计算两棵XML文档树中的路径相似性。在整个聚类过程中,算法还把一组相关文档与一个XML聚类代表相关联,并给出了聚类代表的计算方法。进而,通过比较聚类代表,发现新的聚类时更新聚类代表来完成文档的聚类。在上述工作的基础上,设计和开发了一个图形界面化算法库原型体统来实现算

3、法的示例调用和管理。关键词;Web数据挖掘文档聚类文档分类信息检索映像元对象协议ABSTRACTWiththerapiddevelopmentofWorldWideWeb,thewayinwhichpeopleacquireusefulinformationhasbeenchangingdrastically.MoreandmorepeoplebegintomakeuseofWebtolive,workandstudy.InformationRetrievalhasbecoll'leallevita

4、bleelementoftheWeb.Whensecxchinginformationwithsearchengine,peoplewanttogetthemostconcernedinformationbymeal略ofdiminatingtheirrelevant.Moreover,whattheyobtainshouldbemostvaluabletothem.AlltheseresultinthebirthofWebDataMining.Whel-easthere’他SOmanytypeso

5、falgorithmsandeachoneappliestoaspecificcase.Tochoosethebestonetoprocessingdatabecomesaproblem.Inthepaper,wedevelopanalgorithmslibrarysystemtoprovidealgorithmsupportfortheinformationretrievalsystem,whichprovidestheframeworkforfunctioncallandmanagement.B

6、asedOnreflectionandmeta-objectprotocol,Werealizetheseparationofspecificfunctionconcernsandsystem—controllingon嚣.Usingmeta-objectprotocol,wecanaddnewmeta-objeetsintothissystem.Suchasystemiseasytoexpand.Whenchoosingthealgorithmstoberealized,weanalizethec

7、haracteristicsofthedatatobeprocessedinOUrprojectandproposetheconceptionofsegmentmatchingagainstthedefectsofthemethodsinexistence.weusingthisconceptiontocalculatethesimilaritybetweentwo仃e鹤.Theninthewholeclusteringprocession,WeequipeachdusterwiIhanXMLclu

8、sterrcpl-嚣entative,whichsubsumesthemosttypicalstructuralspecificsofasetofXMLdocuments.Alsowegivethearithmeticforconstructingtherepresentative.Thenclusteringisacenmplishedbycomparingclusterrepresentatives.andupdatingtherepresentativesass

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。