基于本体的智能电网文本知识获取模型.pdf

基于本体的智能电网文本知识获取模型.pdf

ID:52481037

大小:476.50 KB

页数:9页

时间:2020-03-28

基于本体的智能电网文本知识获取模型.pdf_第1页
基于本体的智能电网文本知识获取模型.pdf_第2页
基于本体的智能电网文本知识获取模型.pdf_第3页
基于本体的智能电网文本知识获取模型.pdf_第4页
基于本体的智能电网文本知识获取模型.pdf_第5页
资源描述:

《基于本体的智能电网文本知识获取模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第34卷第5期东北电力大学学报Vo1.34.No.52014年lO月JournalOfNortheastDianliUniversityOct..2014文章编号:1005-2992(2014)05—0060—09基于本体的智能电网文本知识获取模型曲朝阳,范旭东,于华涛,曲楠2(1.东北电力大学信息工程学院,吉林吉林132012;2.江苏省电力公司检修分公司,江苏南京210000)摘要:针对智能电网知识的共享与重用问题,本文提出了一种基于本体的智能电网文本知识获取方法。首先,以《电力主题词表》和《中国

2、分类主题词表》为基础,基于Prot6g6构建一个初始种子本体,用Jena对此本体进行解析,生成概念树;然后,利用ICTCLAS进行中文分词,生成概念词集;最后,提出基于HowNet的GSS匹配算法,并将概念词集与概念树进行匹配,将获取到的概念和属性添加到种子本体中,完成一次知识获取。通过抓取智能电网领域相关网页进行实例验证,获得了较好的效果。关键词i本体;智能电网;知识获取;自然语言处理;语义相似度算法中图分类号:TP182文献标识码:A智能电网是未来电网的一个主要发展方向,被认为是2l世纪电力系统的

3、重大科技创新和发展趋势。智能电网是影响我国经济发展等诸多方面极为重要的一个领域,建立一个可共享、复用的智能电网领域本体知识库对于智能电网的发展是极其有必要的,将会在设备故障诊断、智能故障修复、快速决策、语义检索、电力企业员工培训等方面发挥重大作用,为建设坚强智能电网提供强有力的支持1-4]。而作为知识库构建技术中的三大关键技术之一,知识获取技术直接影响着知识库的推广与应用,因此知识获取就成为了构建知识库的瓶颈问题。本体作为当前最为流行的知识表示方法,势必在知识库构建中发挥重要作用[5-7]。传统的电网

4、知识获取大多是通过手工方式来完成的,这就需要众多领域专家的频繁参与,耗费巨大地人力物力,自动化水平比较低,极大地延缓了构建知识库的速度J。所以,如何实现电网知识获取的自动化或半自动化,提高电网知识获取的效率,是当前智能电网领域亟待解决的一个重要问题,具有重大的研究意义。本文提出一种基于本体的智能电网文本知识获取方法,它是一种半自动的知识获取方法,可以大大地降低人力物力的耗费,经验证它有效提高了知识库的构建速度。1基于本体的智能电网知识获取模型的设计结合本体、知识获取、智能电网知识表示等相关理论与技术,

5、本文提出基于本体的智能电网知识获取模型,见图l。1.1智能电网种子本体构建模块构建一个智能电网领域的种子本体来将知识获取范围锁定在智能电网领域,该种子本体中包含了一些基本的智能电网领域概念及其之间关系,其中的大部分概念和关系来源于《电力主题词表》和《中国分类主题词表》,然后运用Prot6g64.0本体构建工具完成种子本体的构建,并定义了相关属性和收稿日期:2014-08-15基金项目:国家自然科学基金资助项目(51077010);吉林省科技厅社发处重点科技攻关项目(20130206085SF)作者简介

6、:曲朝阳(1964一),男,吉林省吉林市人,东北电力大学信息工程学院教授,博士,主要研究方向:电力信息化、电网数据处理与建模.第5期曲朝阳等:基于本体的智能电网文本知识获取模型61文IWeb文档lI=概硝睢电义刘狱啾阿文l士I念概数文词念处据分—集提匹理·源词生取配成算一—法1..I.一厂智__、’智能电网利一予本体构建葛l蓉数充后能电r_、∞l———■-的满足网(电力主题词表概———●种木\念能—L.匹体及电太配加Prot~g6网体太/,系种解(中国分类主题词表提子析巴取太体循环迭代图l基于本体的智

7、能电网文本知识获取模型关系。1.2文本预处理模块本文的数据源是中文文本,包括Web文档、知识读本等,先将他们转化为纯文本文件,然后然后采用ICTCLAS分词算法进行中文分词,得到概念词集。1.3本体解析模块采用Jena来对种子本体进行解析。在对OWL模型进行解析时,主要用到本体模型(OntMode1)、文档管理器(DocumentManager)、接口(OntClass)和基本本体类型(OntResource)这几个Java类和接口。通过这些类和接口,便可以将OWL本体文件解析成概念树的结构输出出来,

8、以便于与从领域文本中抽取到的概念进行匹配,从而完成领域本体知识的获取工作。1.4智能电网知识获取模块本模块的实现是本文的核心,这部分的效率直接决定了知识获取的质量。本文提出基于知网的GSS(GridSemanticSimilarity)匹配算法将种子本体解析得到的概念树与在文本预处理模块中得到的概念集进行概念匹配,最终获取到智能电网文本知识。2智能电网种子本体的构建2.1数据源利用《电力主题词表》和《中国分类主题词表》两大权威主题词表,二者互为补充,为智

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。