基于本体的教育资源语义检索关键技术研究

基于本体的教育资源语义检索关键技术研究

ID:10144535

大小:33.00 KB

页数:9页

时间:2018-06-11

基于本体的教育资源语义检索关键技术研究_第1页
基于本体的教育资源语义检索关键技术研究_第2页
基于本体的教育资源语义检索关键技术研究_第3页
基于本体的教育资源语义检索关键技术研究_第4页
基于本体的教育资源语义检索关键技术研究_第5页
资源描述:

《基于本体的教育资源语义检索关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于本体的教育资源语义检索关键技术研究摘要:该文对基于本体的语义检索涉及的几个关键技术进行了深入探究,包括教育资源本体的构建、本体数据的存储等。并在此基础上设计出基于本体的自适应Web信息抽取模型和本体数据及实例数据存储模型。关键词:教育资源;本体;语义;检索;数据存储中图分类号:TP311文献标识码:A文章编号:1009-3044(2014)16-3872-04Abstract:ThispaperstudiesOntology-BasedofSemanticRetrievalKeyTechnologyofEducationalResources,whichincludesontologyof

2、educationalresourcesconstructionandontologydatastorage.Finally,thedesignsofadaptivewebinformationextractionmodelbasedonontologyandontologydataandinstancedatastoragemodelaredescribed.Keywords:Ontology;Semantic;Retrieval1概述9目前的搜索系统远不够智能,仍然需要大量的用户交互才能获得期望的搜索结果。研究并设计基于语义的垂直搜索引擎,其目标就是对搜索结果进行系统的知识整理,使每个用户

3、查询的关键词都能映射到知识库的概念上。搜索引擎开发涉及到多个关键技术,随着Hadoop和Nutch等开源技术的发展,可以解决分布式搜索引擎开发中的站点爬行、内容解析等问题。该文则主要从以下几个方面研究基于本体的教育资源语义检索涉及的关键技术,包括教育资源本体的构建技术、本体数据的存储、语义相似度算法等。2基本概念语义搜索对网页文档信息所蕴含的语义信息进行充分挖掘,同时把用户的检索要求转换成相应的语义表示,基于领域本体对其进行辨别和推理,从语义层面理解用户查询,并将基于本体推理的结果返回给用户。语义信息,从广义上讲,包括语义实体、语法关系、实体上下文特征、文本的结构特征等等,语义搜索引擎不仅给出

4、了相关网络文档作为查询结果,而且在本体中查询推理的相关资源也可以同时被给出,语义搜索引擎作为一个新的网络信息学研究热点,已经在国内外迅速展开。本体概念本是来源于哲学,最早只是一个哲学概念。古希腊哲学家亚里士多德是最早对本体进行解释和研究的。哲学领域对本体的定义为“对世界上客观存在物的系统地描述,即存在论”,是对客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。9本体具有良好的概念层次结构和对逻辑推理的支持,通过对概念的严格定义和概念之间的关系来确定概念精确含义,表示共同认可的、可共享的知识,其木质就是领域知识的共享和复用。本体作为一种能在语义和知识层次上描述信息系统的类模型建模工具,

5、可以在相对独立构建和管理的服务之间提供可重用性和互操作性。因此,基于本体技术可以解决教育资源在语义层次的检索问题。在此基础上实现的基于本体的教育领域语义搜检索,结合语义Web技术,使用领域本体元数据模型对用户的查询进行语义化规范,依据领域本体模式抽取文档中的知识,准确地表达了用户的查询语义和作为被查询对象的文档语义,可以大大提高检索的准确性和检索效率。3关键技术研究3.1教育资源本体的构建技术本体提供了关于某领域的通用的术语和概念,并对术语的含义以及术语间的关系进行了描述。本体在信总检索、信息管理、自然语言理解和问答系统等方面都有着重要的应用。9人工构述例典是最简单的方法,其中典型的有Word

6、Net和HowNet。人工构建词典的优点在于词典的质量高。缺点在于人工构建词典是非常耗时的,而且更新维护的代价非常高。为解决这个问题,科研人员展开众多本体自动构建的研究工作。我们根据知识来源的结构化程度,将本体的自动构建方法分为三类:基于文本的(无结构)、基于数据库的(结构化的),和基于Web的(半结构化的),该文提出了一个半自动构建教育资源本体库模型。具体流程如下:首先,根据教育领域的各种权威性的词表来构建领域本体,既可以根据词表中概念间存在的简单语义关系构建轻量级的本体,这种本体语义简单但优点是容易通过编写程序实现大批量的自动转化。可以选择《教育资源建设技术规范》(CELTS-41)作为元

7、数据方案,基于此定义出教育资源本体的核心类。具体实现可使用Protégé软件进行本体的构造,使用Protégé提供的OWLvizTal插件,这个插件可以通过图形的形式显示构建的教育资源本体中各子类的层次关系。在建立了教育领域本体的核心类之后,要确定本体概念间的属性关系。Protégé中到的属性关系包括两种属性:关系属性与数值属性。关系属性表示概念间的逻辑关系,如前驱关系(hasPrecursor)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。