基于本体的Deep Web语义分类研究.pdf

基于本体的Deep Web语义分类研究.pdf

ID:52209760

大小:480.06 KB

页数:7页

时间:2020-03-25

基于本体的Deep Web语义分类研究.pdf_第1页
基于本体的Deep Web语义分类研究.pdf_第2页
基于本体的Deep Web语义分类研究.pdf_第3页
基于本体的Deep Web语义分类研究.pdf_第4页
基于本体的Deep Web语义分类研究.pdf_第5页
资源描述:

《基于本体的Deep Web语义分类研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第25卷第2期山东建筑大学学报Vo1.25No.22010焦4月JOURNALOFSHANDONGJIANZHUUNIVERSITYApr.2010文章编号:1673—7644(2010)02—0l18—07基于本体的DeepWeb语义分类研究吕强,宋玲。,马军。,秦英林(1.国家电网技术学院,山东济南250002;2.山东建筑大学计算机科学与技术学院,山东济南250101;3.山东大学计算机科学与技术学院,山东济南250100)摘要:针对目前DeepWeb分类研究中所采用的Post—query查寻探测方法缺乏语义支持的问题

2、,提出一个基于本体的语义查询探测分类方法。主要思想如下:首先针对一个DeepWeb数据库集合,提取查询接口中的属性及其实例,半自动建立领域本体,并且通过领域本体来表示类别特征;然后利用领域本体中的概念以及相应的实例构造语义查询集;最后对待分类的DeepWeb数据库利用语义查询集进行查询探测,计算查询探测返回的结果文档在领域本体中的信息覆盖量,并以此对DeepWeb进行分类。实验表明:这种语义查询探测分类的方法和以往的方法相比,在准确率、查全率和F1值上有一定的提高。关键词:DeepWeb分类;本体;语义;查询探测中图分类号:

3、TP301文献标识码:AResearchonDeepWebsemanticcategorizationbasedonontologyLUQiang,SONGLing2,MAJun,eta1.(1.StateGridTechnologyCollege,Jinan250002,China;2.SchoolofComputerScienceandTechnology,ShandongJianzhuUniversity,Jinan250101,China;3.SchoolofComputerScienceandTechnology,

4、ShandongUniversity,Jinan250100,China)Abstract:InviewoftheproblemoflackingsemanticsupportinthePost-queryresearchofDeepWebdatabasesclassification,thepaperdesignsanovelsemanticqueryprobingclassificationapproachbasedonontology.Themainideaisasfollowing:firstly,attribute

5、sandinstancesareextractedfromqueryinterface,whichareusedtobuilddomainontologiessemi—automatically,andcharacteristicsofcategoriesarerepresentedbydomainontologies.Thendomainqueryinstancesareconstructedfromdomainontologies,whichareusedasqueryprobingtoDeepWebdatabases.

6、Finallycoveragedegreebetweenreturnedresultdocumentsofaqueryanddomainontologiesarecomputed,withwhichtheDeepWebdatabaseisclassified.TheexperimentsshowthatsemanticqueryprobingclassificationmethodWeproposedhasimprovedalotinprecision,recallandF1.Keywords:DeepWebcategori

7、zation;ontology;semanticquery;queryprobing收稿日期:2009一O8—21基金项目:高等学校博士学科点专向科研基金(20070422107);山东省科技攻关计划项目(2007GG10001002)作者简介:吕强(1969一)男,山东平度人,副教授,硕士,主要从事计算智能电网、智能在电力系统中的应用研究.E-mail:sllshm@sina.t:om第2期吕强等:基于本体的DeepWeb语义分类研究词并进行不同的组合,用来对隐藏数据库进行探测,0引言并以此来确定某个隐藏数据库对于某领域的

8、相关度。近来研究表明网络上存在的大量DeepWeb数通过对未知的DeepWeb数据库反复地查询探据库只有通过用户提交一系列关键词给查询接口后测,对返回查询结果进行分析来判断一个DeepWeb才能动态生成查询结果,因此对用户来说这部分页数据库属于哪个领域,这就面临一个如何构造查询面是隐藏的,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。