基于语义相似度计算的deep web数据库检索方案研究

基于语义相似度计算的deep web数据库检索方案研究

ID:33567362

大小:1.84 MB

页数:58页

时间:2019-02-27

基于语义相似度计算的deep web数据库检索方案研究_第1页
基于语义相似度计算的deep web数据库检索方案研究_第2页
基于语义相似度计算的deep web数据库检索方案研究_第3页
基于语义相似度计算的deep web数据库检索方案研究_第4页
基于语义相似度计算的deep web数据库检索方案研究_第5页
资源描述:

《基于语义相似度计算的deep web数据库检索方案研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于语义相似度计算的DeepWeb擞据库●‘检索方案研究上海师范大学硕士学位论文研究生:夏海峰指导老师:陈军华专业:计算机应用技术研究方向:数据库技术中国,上海,上海师范大学信息与机电工程学院2014.4TheResearchOnDeepWebDatabaseBasedOnSemanticSimilarityCalculationADissertationSubmittedfortheDegreeofMasterCandidate:XiaHaifengSupervisor:ChenJunhuaMajor:ComputerApplicationTechno

2、logySpecialty:DataBaseTechnologyCollegeofInformation,MechanicalandElectricalEngineeringShanghaiNormalUniversity,Shanghai,ChinaApril2014上海师范大学硕士学位论文摘要摘要随着互联网行业的快速发展,我们正处在一个信息快速增长的年代,并且在海量增长的信息中往往蕴含着大量有价值的数据。虽然在日常生活中,我们可以通过各种搜索引擎解决我们的需求,但是有时候搜索出来的信息,往往在信息相关的程度和精度上,与我们期望的存在着差异,从而不能够

3、完全满足我们的搜索需求。通常我们使用的一些搜索引擎,比如Baidu、Google、Yahoo等等,往往都是通过网络爬虫技术,将相关的网站页面首先抓取到自身的服务器上。我们在对关键词进行搜索的时候,实际上是直接查询本地相关文件,反映给我们的往往也是一些静态的网页数据。日常范围内的搜索,我们很难通过关键词的简单查询完全获得DeepWebDB的数据,从而损失了海量有价值数据信息。本文提出了基于语义相似度计算的DeepWeb数据库检索方法,该方法的目的在于将语义相似度的计算方法运用于数据库检索当中去,最终将该方法同传统搜索引擎有效结合,更加满足用户搜索需求。本文

4、首先简要的介绍了几种常见的语义相似度的计算方法,最后结合各自的优点,将同义词词林(哈工大版)和知网(HowNet)有效结合,提出了一种改进的语义相似度的计算方法。通过计算关键词和属性词典对应属性列之间的相关联度,在基于阈值的匹配算法的基础上,确定当前关键词的查询的搜索范围,挖掘出潜在于DeepWeb数据库中与关键词有关联的信息。通过对DeepWeb数据库的相应查询,最终将查询的结果通过有效的形式反馈给当前用户。由于当前DeepWeb下中文测试数据库相对较少,我们采用的是某校信息管理系统的后台数据库作为数据源进行测试。实验部分举例验证和测试了本文中所提出的

5、方法的可行性和正确性,不仅避免了数据库的全表扫描的代价,同时也尽可能的精确当前关键词的查询范围,并且后期通过与搜索引擎的无缝集合,提供给用户高效、稳定的查询体验。关键词:深度万维网;同义词词林;知网:语义相似度:属性词典上海师范大学硕士学位论文AbstractWiththerapiddevelopmentoftheIntemet,weareinanerathattheamount..f-information,whichoftencontainsahugepotentialofknowledge.Althoughmanyengineshavefounda

6、partialsolutiontosolvetheproblemofresources,itisfarawayfromsatisfactorybecauseofthepoordegreeoftherelationandaccuracyoftheinformation.Somesearchengines,suchasBaidu,Google,Yahoo,etc.,oftenusethecrawlertechnologytocrawthewebsitewhichrelatedtothekeywordstotheirownservers.Whenwesearc

7、hthekeywords,wesearchthelocalfiles,wegetsomestaticpagesofdata.ItisdifficultforUStoobtainthedatahiddenbehindtheDeepWebdatabase,asaresult,weloseavastofvaluabledata.Thispaperpresentsamethodofdeepwebdatabasequerybasedonsemanticsimilaritycalculation,themethodaimstOcombinethesemanticsi

8、milaritycalculationwiththetraditionalsea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。