基于语义推理的资源可视化研究与实现

(9页)

(此文档疑似侵权,无法预览全文,无法下载。)
'基于语义推理的资源可视化研究与实现'
基于语义推理的资源可视化研究与实现基于语义推理的资源可视化研究与实现刘毅1 宋文2 汤怡洁1 周子健1 杨锐11(中国科学院国家科学图书馆武汉分馆/中国科学院武汉文献情报中心 湖北 武汉 430071)2(中国科学院国家科学图书馆,北京,100190)[摘要摘要] 从语义推理和资源可视化两个方面入手,首先调研了国外相关技术和项目的研究现状。在理论研究的基础上,提出了语义可视化应用的设计方案,并介绍了具体的实现方法。最后,以中国科学院国家科学图书馆构建的专业领域知识应用环境(SKE)平台为例,展示了可视化实现效果。 [关键词关键词] 语义推理,推理机,可视化[中图分类号中图分类号] G250Research and Implementation of Resource Visualization Based On Semantic InferenceLiu Yi1 Song Wen2 Tang Yijie1 Zhou Zijian1 Yang Rui1 1(Wuhan Branch of National Science Library of CAS, Wuhan, 430071, China)2 (National Science Library of CAS, Beijing, 100190, China)[Abstract] Start from the semantic inference and resource visualization, this paper researches the related technologies and abroad projects firstly. On the basis of the theory, design and implement the semantic visualization application. Lastly, take the Subject Knowledge Environment (SKE) which developed by CAS for example, show the effect of visualization. [Keywords] Semantic Inference, Inference Engine, Visualization 1.引言随着信息化社会的发展,越来越多的资源利用网络进行传播,各种电子化数字化的信息源越来越庞大。人们在对海量数据进行浏览和检索的时候,更希望了解数据之间的相互关系,而不是一个个孤立的信息点。实际上,在这些数据背后包含着大量的隐性知识,如何将这些隐性知识挖掘出来直观的展示在人们面前成为了迫切的需求。基于语义网技术,通过知识组织体系将数据有效的组织成为知识,能够帮助机器理解 知识含义并计算相互间的关联关系。语义推理是由给定的知识获得相关的隐性知识,利用相关的推理机以及人工干预设定的推理规则充分挖掘知识内在联系。在与用户交互过程中,为了使知识发现的过程和结果易于理解,知识可视化也成为人们关注的方向。2国外研究现状2.1 相关技术研究在语义推理方面的相关技术研究主要集中在描述逻辑、推理算法以及推理机等方面。描述逻辑[1]能够提供可判定的推理,是一种基于逻辑的知识表示形式。基于描述逻辑语言ALC 的推理分为 TBOX 和 ABOX 两大类,主要支持概念蕴含推理、概念等同推理以及实例检验和一致性检验等。用于语义推理的推理算法很多,其中最为常用的算法包括 Tableau 算法和 Rete 算法。目前各种流行的推理机所使用的算法多为以 Tableau 算法[2-3]和 Rete 算法为基础的优化算法。当前已经出现了多种用于本体推理的推理机,如Racer、Pellet、FaCT++、Jena、Jess 等。其中 Jena 作为本体存储系统带有简单的推理功能,支持基于规则的简单推理;Pellet 基于 Tableau 算法支持 OWL DL 级的推理,可处理描述逻辑的本体。在知识可视化方面,视觉表征是可视化构成的关键因素。相关研究主要是概念图、思维导图、认知地图、语义网络和思维地图几种知识可视化技术上,其中概念图可以基于相关理论形成图形化知识表征,语义网络以图形的方式解释概念及概念间的关系,形成层次网状结构。通过视觉表征来促进知识的传播和创新是知识可视化的主要研究方向之一。2.2 相关项目研究在语义网和知识可视化技术方面的研究,欧美一直处于全球领先地位,许多关键技术经过研究阶段,正在逐步进入实际的社会化应用。在美国,很多大学院校以及科研院所都开展了相关方向的研究,例如美国国家科学基金会(NSF)资助的 SemDis 项目[4]由美国莱特州立大学、乔治亚大学和马里兰大学共同完成。这个项目主要的研究方向是通过设计、构建并验证 SemDIS(Semantic Discovery,语义发现)系统来发现语义环境中索引和检索复杂的知识间语义关联关系。该项目设置了SemViz 子项目,研究知识发现中的可视化呈现模型以及图形化查询表达等。由美国康奈尔大学、印第安纳大学、佛罗里达大学等大学院校和科研院所共同参与的 VIVO 项目[5]由 NIH资助,旨在建立科学家的关联关系语义网络。该项目利用语义网技术建立科学家的交流模式,并提供语义检索,方便发现相关研究人员和合作者。在 VIVO 项目的最新成果中,将人物关联关系可视化作为了一个新亮点,基于可视化技术实现了语义关联关系的科学家合作 网络。在欧洲,欧盟 FP7 框架支持的 CUBIST 项目[6]由来自英国、法国、保加利亚的 6 家研究机构和大学院校共同承担,项目将商业智能和语义技术相结合,处理各类结构化和非结构化数据的结合以及存储问题,利用语义技术提升商业智能能力并提供了可视化分析工具进行查询、导航等。芬兰坦佩雷理工大学的超媒体实验室[7](HLab)有专门针对知识模型和可视化方向的研究团队。研究组将数据挖掘、建模、可视方法与语义技术相结合,具体研究知识可视化,摘要信息模型以及内容的交互可视呈现技术。他们参与了多项合作项目,例如 OPAALS、DBE、Semogen、Sindi 等。3语义可视化应用设计可视化应用主要是针对人们对可视模式快速识别的自然能力,利用计算机对抽象数据进行可视表示,来增强人们对这些抽象信息的认知。资源可视化作为应用系统的表现层需要以底层知识库和数据处理做依托。因此,如何获取更多相关联的数据,如何深度挖掘资源内部的隐含关联性就成为了一个重要的问题。在这些需求的驱动下,可视化后台数据处理引入了语义的概念。利用底层知识库进行语义推理,通过推理机和推理规则发现知识,获取隐含知识。同时与知识关联度表进行比对,计算知识间的关联紧密程度,为可视化表现层提供数据支持。可视化应用整体框架设计如图 1 所示图 1 可视化应用框架图 3.1 知识库设计知识库是持久化存储各种知识组织体系和知识资源的,主要包括基于本体构建的知识组织体系和利用本体组织的各种资源。为了高效的操作 OWL 本体,采用 MySQL 作为持久化存储工具,利用 Jena API 将 OWL 的数据结构以三元组(主谓宾)的形式存储到数据库中。3.2 语义推理模块设计语义推理模块用于深度挖掘知识库中知识的内在关联关系,在底层为可视化呈现提供更丰富的知识资源。系统采用外挂 Pellet 专业推理机的形式实现 OWL DL 级别的推理, 同时利用 Jena API 实现用户自定义推理规则的语义推理。为了更好的达到知识挖掘的效果,系统底层为人物关系图谱可视化模块定制了十几条推理规则支持可视化呈现。自定义推理规则主要包括:在同一研究所、发表同一篇论文、同一研究小组成员等,每条推理规则都设定具体的推理条件。以发表同一篇论文和在同一研究所为例,具体说明推理规则的条件设定方法:?IF T(论文 A, ?作者, 科研人员 A) AND T(论文 A, ?作者, 科研人员 B) THEN T(科研人员 A, ?发表同一篇论文, 科研人员 B)?IF T(?研究组 1, ?(研究组成员 or 研究组组长), 科研人员 A) AND T(?研究组 2, ?(研究组成员 or 研究组组长), 科研人员 B) AND T(?研究组 1, ?上级机构, 实验室 A) AND T(?研究组 2, ?上级机构, 实验室 B) AND T(?实验室 A, ?上级机构, 研究所) AND T(?实验室 B, ?上级机构, 研究所) THEN T(科研人员 A, ?在同一研究所, 科研人员 B)3.3 系统接口设计为了确保系统与其他平台之间的互操作性,系统设计了基于 Web Service [8]标准的接口供第三方系统调用。第三方系统可以通过对接口的调用,获取系统中的知识并在此基础上进行二次开发。系统提供的接口主要包括知识实例获取接口、知识实例检索接口等。Web Service 接口采用开源框架 xfire [9],通过 WSDL 实现接口的发布和使用。这里提供的各种Web Service 接口为受限接口,在调用时需要进行身份认证,通过用户名和密码控制接口访问权限。3.4 可视化模块设计可视化模块是整个应用的最终表现形式,将获取的知识按定义好的形式进行图形化展示。这里以人物关系图谱为例介绍可视化模块的具体设计,人物关系图谱是利用可视化图形界面直观的展示人物之间的关系及关联紧密度。系统根据推理规则设计了体现关联关系 紧密度的关联度表,为每条推理规则设置关联度参数,以保证可视化模块呈现完整的关联知识和真实的知识关联紧密度。关联度表采用 xml 格式为基础,以每条推理规则为节点,利用推理规则的唯一标识符与具体的关联度参数进行关联。在可视化图谱上主要提供以下几个方面的功能操作,点击图谱内任意节点,则显示以该节点为中心节点的合作者网络;鼠标移至节点与节点之间的连线时,可以显示出两者之间具体的合作关系属性;鼠标移至节点上时,可以显示知识点的具体详细信息。在技术实现方面,主要采用了 Flex 技术支持可视化模块的开发。4应用具体实现根据整体设计和功能设计,可视化应用分为四个主要功能模块。这里主要针对语义推理模块和可视化模块的实现过程进行分析。4.1 语义推理模块实现语义推理模块结合自定义规则和 Pellet 完备的 OWL DL 的推理功能。首先使用 Pellet 作为底层推理,对知识库建立基于标准公理的推理机模型,使用 Pellet 的 PelletReasoner 接口,该接口的 bind()函数可以把初始的数据模型绑定为推理模型 InfModel,我们这里将InfModel 命名为 Pellet Model。创建 Pellet 模型的关键代码如下Resource conf = cModel.createResource();conf.addProperty( ReasonerVocabulary.EXT_REASONER_URL, cModel.createResource( "http://localhost:8081" ) );DIGReasonerFactory drf = (DIGReasonerFactory)ReasonerRegistry.theRegistry().getFactory( DIGReasonerFactory.URI );DIGReasoner r = (DIGReasoner) drf.create( conf );OntModelSpec spec = new OntModelSpec( OntModelSpec.OWL_DL_MEM );spec.setReasoner( r );在Pellet Model的基础上,使用Jena的推理子系统建立自定义规则的推理机。底层Pellet推理机能进行自主推理计算并把结果提交给上层Jena推理子系统,Jena可以把Pellet推理的结果作为源数据模型再次进行自定义关系的演算。知识库自定义规则按Jena标准规则语言规范 [10]书写,具体规则表示如下:(?x http://www.las.ac.cn/skeontology#paper_author ?y),(?x http://www.las.ac.cn/skeontology#paper_author ?z),notEqual(?y,?z) -> (?y http://www.las.ac.cn/skeontology#essay_cooperation ?z) 所有的规则集合以xml文件格式存储,用具体推理资源的所属类作为xml格式的节点。在创建Jena推理模型时,将xml格式的规则文件读取出来导入Jena推理子系统与之前利用pellet推理机创建的模型结合,最终获得完整的推理模型。创建Jena推理模型infmodel的关键代码如下,其中ruleStrs字符串是具体的推理规则,pelletmodel是底层Pellet推理机创建的模型。Reasoner reasoner = new GenericRuleReasoner(Rule.parseRules(ruleStrs));reasoner.setDerivationLogging(true);InfModel infmodel = ModelFactory.createInfModel(reasoner, pelletmodel); 根据表现层可视化的需要,确保能够让用户直观的发现知识之间的关联关系和关联度强弱,语义推理模块不仅要将具有关联性的隐含知识挖掘出来,还要计算这些具有关联性的知识之间的关联程度和紧密度。这里的关联度计算 [11]是针对之前自定义推理规则由人工进行干预设置的,不同推理规则推导出的知识关联度强弱不一。通过对推理规则的分析,提出了每条推理规则具体的关联度参数,参数以0.5为增量递增,最终将知识及其关联度作为底层数据支持提供给可视化组件调用。4.2 可视化模块实现可视化模块作为表现层应用,通过 Web Service 标准接口调用底层功能获取数据;同时解析数据生成图谱。首先在 mxml 文件中定义 Web Service 访问对象,<mx:WebService id="myService" wsdl="http://localhost/xservices/SKEService?wsdl" fault="Alert.show(event.fault.faultString), 'Error'"> <mx:operation name="returnInstanceByURI" result="resultCenterNode(event)"/> <mx:operation name="listMeAndRelatedInstance" result="resultHandlerRelatedOInstance(event)" /> </mx:WebService>通过 Web Service 的 WSDL 文件获取提供的方法名,利用 mx:operation 描述具体需要调用的方法。并且在 result 参数中指定方法调用完成后的委托方法,也就是调用 Web Service方法获取结果后的 Flex 解析。在获取数据集的基础上,需要进一步对资源可视化图谱的样式进行定义,可以根据各个应用的需要自己定义,我们这里构建了一个 Layouts.as 文件专门指定可视化图谱样式,针对节点、线的颜色,大小分别进行了控制。部分代码示例如下: data.nodes.visit(function(ns:NodeSprite):void { var temp:String = ns.data["instancename"];if(temp==null) {temp = instanceArray[0]["instancename"]var ts:TextSprite = new TextSprite(temp,textFormat);ts.horizontalAnchor = TextSprite.CENTER; ts.verticalAnchor = TextSprite.MIDDLE; ts.textField.background = false;ts.textField.backgroundColor = 0xff990022……}最后利用Flash Builder将Flex源码(.mxml和.as文件)编译为Flash字节代码(.swf)文件,客户端在需要嵌入可视化模块的页面加入swf文件并提供相应参数就可以调用可视化组件了。5语义可视化应用实例效果中国科学院国家科学图书馆构建的专业领域知识应用环境(SKE)平台 [12-13]集成了在用户科研工作流中不同阶段需求的各类数字信息资源,并且利用知识组织体系进行组织实现知识关联。在人员关联关系显示时,采用了人物关系图谱的形式。人物关系图谱是利用图形可视化组件直观的展示人物之间的关系及关联紧密度,具体展示形式如图 2 所示。图 2 SKE 环境中可视化组件实例 在图 5 中,以圆形为节点的人员“龚谦”是中心节点,其余所有节点都是与该中心节点有关联关系的人员记录,用矩形表示。关联人员用不同颜色标识,同种颜色表示具有同一种关联关系的人员。节点与节点之间的线为具体的关联关系属性,长短表示关联紧密度,线条越短则表示关联度越高。当鼠标移动到线上时,会出现具体的关联属性名称。6结语在知识经济时代,知识以数量级的速度增长,为了使人们更好的理解知识,发现知识之间的关联,知识的可视化越来越受到重视,人们对知识可视化的需求也越来越迫切。基于语义的可视化应用基础主要有两个方面,后台的知识推理与发现和前台的知识关联呈现。在下一步的工作中,进一步完善这两个方面的功能,在后台的知识推理方面,研究知识关联度的机器自动计算方面的问题,改进目前仍需要人工手动设置关联度的问题。在前台的知识关联呈现方面,需要进一步的设计各种展现形式,根据呈现知识的结构与特性,利用不同的展现方式进行呈现。通过对上述问题的改进完善,争取将基于语义的可视化组件推广到各种不同类型的平台中应用。参考文献[1] Description Logic [EB/OL]. [2011-10-13]. http://en.wikipedia.org/wiki/Description_logic[2] F.Baader, U.Sattler, An overview of tableau algorithms for description logics, StudiaLogica, 2001, 5-40[3] I.Horrocks, Optimising Tableaux Decision Procedures for Dscription Logics [PhD thesis], University of Manchester, UK, 1997[4] SemDis 项目 [EB/OL]. [2011-10-15]. http://knoesis.org/research/semweb/projects/semdis/[5] VIVO 项目[EB/OL]. [2011-10-15]. http://vivoweb.org/[6] FP7 CUBIST 项目[EB/OL]. [2011-10-16]. http://www.cubist-project.eu/[7] HLab knowledge modeling and visualization [EB/OL]. [2011-10-16]. http://matwww.ee.tut.fi/hypermedia/en/research/knowledge-modelling-and-visualisation/[8] 龚玲, 张云涛译. Web 服务:原理和技术[M]. 机械工业出版社. 2009.12[9] 拜文娟, 马思光. 基于 XFire 和 Axis 构建 Web 服务的研究与实践[J].计算机技术与发展,2010(8):120-123[10] Jena 2 Inference Support [EB/OL]. [2011-07-01] http://jena.sourceforge.net/inference/[11] 王志愿,夏士雄,张磊,周川祥. 语义驱动的关联规则挖掘算法研究[J].计算机工程与设计,2011(3):936-939[12] 黄金霞,宋文,刘毅等.中国科学院专业领域知识环境的建设与应用[J].图书情报工作,2010(增刊).[13] 中国科学院专业领域知识环境[CP]. [2010-09-15]. http://ske.las.ac.cn/
关 键 词:
基于 语义 推理 资源 可视化 研究 实现
 天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:基于语义推理的资源可视化研究与实现
链接地址: https://www.wenku365.com/p-18760186.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给天天文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 https://www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开