欢迎来到天天文库
浏览记录
ID:33186369
大小:2.01 MB
页数:75页
时间:2019-02-21
《基于素数的多源模式匹配方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、燕山大学硕士学位论文基于素数的多源模式匹配方法的研究姓名:佟冰申请学位级别:硕士专业:计算机软件与理论指导教师:刘国华20051101摘要随着Internet的普及,出现了很多基于Web的可检索的在线数据库,其中隐藏了大量的信息,我们称之为“深NJ(DeepWeb)”。这些可检索在线数据库的出现给数据集成领域带来了许多新的问题,而模式匹配是数据集成过程中的一个关键操作。对隐藏的海量数据的集成首先要对各在线数据库源查询界面使用的模式完成匹配。本文对国内外关于模式匹配的研究现状进行了综合分析,从~个全新的角度对大规
2、模在线数据库查询界面进行匹配的模式匹配方法进行了研究。首先,介绍了多源模式匹配方法和一般模式匹配方法的异同点,深入分析了现有的两种多源模式匹配方法,指出了两种方法各自的优点和存在的不足。其次,在两种方法的基础上,提出了一种基于素数的多源模式匹配方法。将素数理论引入到模式匹配过程中,将属性间单纯的字符匹配转换成数学运算,提高了匹配效率,并保留了现有多源模式匹配方法的优点。该方法弥补了当前研究中无法完成复杂匹配的同时保留模式模型的不足,方便了后续元查询系统的设计。再次,分别提出了属性素数化算法、组属性挖掘算法、同义
3、词发现算法和匹配选择算法,同时提出了基于素数的多源模式匹配方法的具体实现算法,并给出了褶应的算法分析。最后,在四个领域200多个实际在线数据库源上进行了实验,分析了实验结果,证明了算法的正确性。关键词深网;多源模式匹配;数据集成;元查询系统;素数燕山大学工学硕士学位论文AbstractWiththepopularizationoftheInteract,alargenumberofretrievedonlinedatabasesbasedonWebhaveappearedwhich&recaHed‘'deepw
4、eb'’.Therearelargeamountsofinformationhiddeninthem.Theappearancesoftheseretrievedonlinedatabaseshavebroughtalotofnewproblemstoresearchfieldofdataintegration,andschemamatchingisakeyoperationduringtheprocessofthedataintegration.Whenamassofdatahiddeninthedeepwe
5、bareneededtobeintegrated,thefirststepistomatchtheschemaswhichareusedbyqueryinterfacesofdifferentretrievedonlinedatabases.Theactualityofthetechnologyaboutschemamatchingininternalandexternalisanalyzedsyntheticallyinthispaper,andschemamatchingmethodsforlargesca
6、leofschemasacrossthequeryinterfacesofdifferentretrievedonlinedatabasesareresearchedfromanewpointofview,First:ly,thesimilaritiesanddissimilaritiesbetweenmultipIeSOurCesschemamatchingmethodsandcoEnfllonschemamatchingmethodsareintroduced,thetwokindsofexistingmu
7、ltiplesourcesschemamatchingmethodsareanalyzeddee!:I取andthemeritsandlacksineachmethodarepointedout.Secondly,onthebasisofthetwomethods,amultiplesourcesschemamatchingmethodbasedo歉primenumberisproposed.Primenumberisintroducedtotheprocessoftheschemamatching,which
8、changesthecharactermatchingtothemathematicaloperator,theefficiencyofthematchingisimprovedobviously,andtheadvantagesoftheexistingschemamatchingmethodsarekept.Thenewmethodmadeupthedeficiencythatth
此文档下载收益归作者所有