基于素数的多源模式匹配方法的研究

基于素数的多源模式匹配方法的研究

ID:33186369

大小:2.01 MB

页数:75页

时间:2019-02-21

基于素数的多源模式匹配方法的研究_第1页
基于素数的多源模式匹配方法的研究_第2页
基于素数的多源模式匹配方法的研究_第3页
基于素数的多源模式匹配方法的研究_第4页
基于素数的多源模式匹配方法的研究_第5页
资源描述:

《基于素数的多源模式匹配方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、燕山大学硕士学位论文基于素数的多源模式匹配方法的研究姓名:佟冰申请学位级别:硕士专业:计算机软件与理论指导教师:刘国华20051101摘要随着Internet的普及,出现了很多基于Web的可检索的在线数据库,其中隐藏了大量的信息,我们称之为“深NJ(DeepWeb)”。这些可检索在线数据库的出现给数据集成领域带来了许多新的问题,而模式匹配是数据集成过程中的一个关键操作。对隐藏的海量数据的集成首先要对各在线数据库源查询界面使用的模式完成匹配。本文对国内外关于模式匹配的研究现状进行了综合分析,从~个全新的角度对大规

2、模在线数据库查询界面进行匹配的模式匹配方法进行了研究。首先,介绍了多源模式匹配方法和一般模式匹配方法的异同点,深入分析了现有的两种多源模式匹配方法,指出了两种方法各自的优点和存在的不足。其次,在两种方法的基础上,提出了一种基于素数的多源模式匹配方法。将素数理论引入到模式匹配过程中,将属性间单纯的字符匹配转换成数学运算,提高了匹配效率,并保留了现有多源模式匹配方法的优点。该方法弥补了当前研究中无法完成复杂匹配的同时保留模式模型的不足,方便了后续元查询系统的设计。再次,分别提出了属性素数化算法、组属性挖掘算法、同义

3、词发现算法和匹配选择算法,同时提出了基于素数的多源模式匹配方法的具体实现算法,并给出了褶应的算法分析。最后,在四个领域200多个实际在线数据库源上进行了实验,分析了实验结果,证明了算法的正确性。关键词深网;多源模式匹配;数据集成;元查询系统;素数燕山大学工学硕士学位论文AbstractWiththepopularizationoftheInteract,alargenumberofretrievedonlinedatabasesbasedonWebhaveappearedwhich&recaHed‘'deepw

4、eb'’.Therearelargeamountsofinformationhiddeninthem.Theappearancesoftheseretrievedonlinedatabaseshavebroughtalotofnewproblemstoresearchfieldofdataintegration,andschemamatchingisakeyoperationduringtheprocessofthedataintegration.Whenamassofdatahiddeninthedeepwe

5、bareneededtobeintegrated,thefirststepistomatchtheschemaswhichareusedbyqueryinterfacesofdifferentretrievedonlinedatabases.Theactualityofthetechnologyaboutschemamatchingininternalandexternalisanalyzedsyntheticallyinthispaper,andschemamatchingmethodsforlargesca

6、leofschemasacrossthequeryinterfacesofdifferentretrievedonlinedatabasesareresearchedfromanewpointofview,First:ly,thesimilaritiesanddissimilaritiesbetweenmultipIeSOurCesschemamatchingmethodsandcoEnfllonschemamatchingmethodsareintroduced,thetwokindsofexistingmu

7、ltiplesourcesschemamatchingmethodsareanalyzeddee!:I取andthemeritsandlacksineachmethodarepointedout.Secondly,onthebasisofthetwomethods,amultiplesourcesschemamatchingmethodbasedo歉primenumberisproposed.Primenumberisintroducedtotheprocessoftheschemamatching,which

8、changesthecharactermatchingtothemathematicaloperator,theefficiencyofthematchingisimprovedobviously,andtheadvantagesoftheexistingschemamatchingmethodsarekept.Thenewmethodmadeupthedeficiencythatth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。