基於本體的專題知識庫智能檢索系統研究.doc

基於本體的專題知識庫智能檢索系統研究.doc

ID:57994480

大小:85.00 KB

页数:10页

时间:2020-04-06

基於本體的專題知識庫智能檢索系統研究.doc_第1页
基於本體的專題知識庫智能檢索系統研究.doc_第2页
基於本體的專題知識庫智能檢索系統研究.doc_第3页
基於本體的專題知識庫智能檢索系統研究.doc_第4页
基於本體的專題知識庫智能檢索系統研究.doc_第5页
资源描述:

《基於本體的專題知識庫智能檢索系統研究.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基於本體的專題知識庫智能檢索系統研究[摘要]以基於本體的張骞研究知識庫智能檢索系統開發為例,探討基於本體的專題領域知識庫智能檢索系統的框架結構、工作流程以及功能實現。系統采用語義Web技術和智能Agent技術,使用RDF模型對知識庫的Web頁面元數據進行描述,然後利用本體建模語言對張譽研究領域知識進行建模,根據所得到的本體對元數據進行基於語義的查詢,為用戶提供智能檢索服務[關鍵詞]本體知識檢索智能檢索知識庫[分類號1G250.61引言從本體論的基本概念出發,哲學上把本體論定義為“對世界上客觀事物所進行的系統描述”。將本體論引入信息科學,本體論是對概念化

2、對象的一種表示和描述,在計算機領域是指定義元數據及其相關關系的“規范”。由於本體具有良好的概念層次結構和邏輯推理的支持,因而在信息檢索,特別是在基於知識的檢索中得到瞭廣泛的應用。知識檢索也稱語義檢索,是把信息檢索與人工智能技術、自然語言技術相結合的檢索,它從語義理解的角度分析信息對象與檢索者的檢索請求,是一種基於概念及其相關關系的檢索匹配機制。知識庫是事實、規則和概念的集合,從存儲知識的角度來看,以描述型方法來存儲和管理知識的機構叫做知識庫。張骞是中國近代著名實業傢、教育傢,他是清末最後一位狀元,曾任民國政府實業總長,是一位探索強國之路的開路先鋒。他倡

3、導實業救國的思想,在經濟、教育、文化、城市建設、社會保障、地方自治等諸多領域創造瞭十多項全國第一,他創建瞭中國近代第一城一一南通(中國人自主規劃建設的第一座近代城市),研究張晝對於今天的城市經濟、教育、文化協調發展,實現科學可持續發展具有重要意義。張譽研究知識庫對張譽研究知識沉淀(包括南通大學檔案館、書館和博物館的張譽研究原始資料)進行數字化語義處理並在張譽研究領域專傢的指導下進行概念分類標註,組織到知識庫中,形成張賽研究領域概念集,組織存儲並實現Web服務功能2基於本體論的張骞研究領域知識庫智能檢索系統功能需求•實現對世界各地張骞研究領域用戶的查詢請

4、求分析本地表達化,使得要查詢的概念不存在模糊不清的地方,具體表現在用戶向系統提出查詢請求後,系統能將查詢請求中的本體取出來,然後進行基於本體的語義搜索•系統應能對用戶如何更好地利用已建成的張骞研究本體知識庫中的知識給予搜索提示,幫助用戶更好地使用本體進行查詢•系統應能找出查詢本體中隱含的語義,實現智能檢索,即系統能根據用戶的檢索條件,進行智能語義推理,可檢索出與檢索條件具有相同語義信息的知識3基於本體論的領域知識庫智能檢索系統結構和工作流程3.1基於本體論的領域知識庫智能檢索系統結構基於知識庫的語義Web環境下,知識庫的信息資源已進行瞭語義標註。在此環

5、境下,本系統應完成的任務是:自動抽取關於領域知識內容描述的元數據,並將這些元數據進行存儲;對用戶提交的關鍵詞進行語義匹配和語義相關性擴展,形成符合特定Ontology語言的查詢語句,通過對數據庫中存儲的領域知識庫元數據信息的查詢,得到高效的基於語義的領域知識檢索結果。上述任務可劃分為元數據收集、數據預處理、元數據存儲、基於Ontology的知識推理和用戶查詢、控制調度等6個主要功能。本文將整個系統框架劃分為6個部分,每個部分的功能由一類Agent實現,這6類Agent通過協同工作,共同完成整個檢索任務。本系統的總髏結構如1所示:系統中除瞭多個Agent

6、以外,還設置瞭領域知識庫、領域本體庫、本地信息庫、遠端信息在本地索引庫以及臨時文檔庫來存儲相關信息。領域知識庫除瞭存儲張骞研究數字化語義Web資源還存儲張賽研究領域用戶ID、mail等個人信息、搜索案例(用戶ID)、搜索ID、屬於的領域、關鍵字、返回的數據等、用戶偏好等;領域本體庫存儲張骞研究領域集、張骞研究關鍵字集以及張春研究本體的相關知識等;本地信息庫和遠端信息在本地的索引庫主要存儲遠端搜索Agent帶回的,並經過信息處理Agent處理過的搜索信息,臨時文檔庫存儲遠端搜索Agent從遠端數據源搜索到的相關信息3.2基於本體論的領域知識庫智能檢索系統

7、工作流程通過信息搜索Agent,對張骞研究知識庫中描述張骞研究領域知識內容的元數據(包括知識庫存儲的描述內容信息和帶描述信息的頁面WEB信息)進行信息提取和過濾,把收集到的元數據經過預處理Agent進行處理後交由存儲Agenh存儲Agent接收語義元數據,將這些元數據以合適的方式存儲到數據庫中,數據庫既可以是傳統的關系數據庫,也可以是專用的XML/RDF數據庫,利用描述領域知識的領域本體,由推理Agent對張骞研究用戶提交的查詢關鍵詞進行語義匹配和語義相關性擴展,將得到的基於張骞研究領域本體的查詢要求交由查詢Agent執行,由查詢Agent接受推理Ag

8、ent產生的針對Ontology的查詢要求,對存儲元數據的數據庫釆用基於知識的方式進行查詢,並

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。