基于语义的数据库关键字检索优化技术研究

基于语义的数据库关键字检索优化技术研究

ID:33730653

大小:2.29 MB

页数:61页

时间:2019-02-28

基于语义的数据库关键字检索优化技术研究_第1页
基于语义的数据库关键字检索优化技术研究_第2页
基于语义的数据库关键字检索优化技术研究_第3页
基于语义的数据库关键字检索优化技术研究_第4页
基于语义的数据库关键字检索优化技术研究_第5页
资源描述:

《基于语义的数据库关键字检索优化技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东南大学硕士学位论文基于语义的数据库关键字检索优化技术研究研究生姓名:塞堕盔导师姓名:全运壬塾撞申请学位级别王堂亟±学位授予单位峦直太堂一级学科名称i土篁扭抖堂与撞盔论文答辩日期2Q!Q生鱼月!!目二级学科名称i土簋扭座用撞苤学位授予日期2Q!Q生鱼月目答辩委员会主席衄渣旦评阅人2010年6月ResearchonOptimizingSemantic·-basedKeywordSearchoverDatabasesAThesisSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofScienceBYLIUSenSup

2、ervisedbyProfessorJINYuan—pingSchoolofComputerScience&EngineeringSoutheastUniversity,Nanjing,P.R.China2010.06东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:东南大学学位论文使

3、用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。研究生签名:堑!12惑导师签名:研究生签名:堡!_

4、《壬导师签名:El期:2Dh6,¨摘要摘要数据库系统和信息检索系统在处理数据的方法上有很大的差别,数据库系统通过复杂的查询语言搜索结构化数据,其结果集完整精确;信息检索系统通过关键字搜索非结构化数据,其结果集通常

5、是不精确和不完整的。传统的关系数据库查询采用SQL语言,而由于其结构复杂、难以学习,不能适应大众用户;而且,人们很难从含有大量文本数据的数据库中得到准确的结果。于是,用关键字搜索关系数据库逐渐成为研究热点。在信息检索中,搜索引擎所检索到的信息仅局限于爬虫程序所能找到的浅层网页(SurfaceWeb),而对于大量存储在网络数据库中的深度网络(DeepWeb),由于搜索引擎同数据库间接口的不一致而无能为力。如果数据库本身提供关键字检索机制,允许使用简单的关键词自由的检索数据库,挖掘其中的信息和知识,信息资源的利用效率将得到很大提高。本文提出了一种基于无向图的数据库关键词检索方法SBK

6、S。首先,以元组为节点,元组间的主外键联系作为边构造元组数据图,然后依据此图的结构计算任意元组间的语义联系,以此为边构造数据库的语义关系图,作为系统的检索模型。处理查询时,使用聚类的方法查找出相互语义联系紧密的关键节点集作为查询结果,并参照DISCOVER2和SPARK的评分方法提出一种适合本文查询结果的评分标准。最后经过实验证明SBKS的正确性,并且在合理的选取阀值参数的情况下,SBKS将取得良好的性能效果。关键词:关键字检索;关系数据库;语义;聚类;无向图AbstractAlthoughbothdatabaseandinformationretrievalsystemsfoc

7、usonsearchingdata,methodstosolvetheproblemaleverydifferent.Databasesystemssearchstructureddatawithcomplexquerylanguages.Itsresultsaresoundandcomplete,andallresultsareequallygood.Informationretrievalsystemssearchunstructureddatabykeywords.Itsresultsareusuallyimpreciseandincomplete,andsomeresul

8、tsaremorerelevantthanothers.Traditionally,SOLlanguageisusedtoqueryrelationaldatabases.However,itisinappropriateforend—users,sinceitiscomplexandhardtolearn.What’Smore,it’Sdifficulttogetexactlyresultsformthedatabasethatcontainsalargeamountoftex

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。