基于多文本知识源的知识修正与获取

基于多文本知识源的知识修正与获取

ID:35063613

大小:3.42 MB

页数:48页

时间:2019-03-17

基于多文本知识源的知识修正与获取_第1页
基于多文本知识源的知识修正与获取_第2页
基于多文本知识源的知识修正与获取_第3页
基于多文本知识源的知识修正与获取_第4页
基于多文本知识源的知识修正与获取_第5页
资源描述:

《基于多文本知识源的知识修正与获取》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、I-’'.^'-:...巧>1^;義篇v^如巧;:;靖?;,.--:’-..—:"-;产..,.;:.主纔3若繁婿..1:.八.燕’巧.祭读r.片三兴货飞-'論朽讀乾六‘,八.^.护祭V;:暫话攀v沪.—J’‘、‘-心.:.V.苦中繁取号;TP391..:种品:密级;公蘇V齊辦鐵織.—;—皆、二::.、知二!掉:式巧i.巧彎;;.]布幾為;薄^、一户古‘門户六沪/.為打—:麵皆麟绞占蔡鸡^心'''^一—叫:.賊補;瓦,.養,;y媒據戚壓斋.心賴終乂參咽iiiW、馨硕±学位论文養謬胃胃

2、.基:;5鑽窮款遊萬:>寒攝義縫转%褲講马機議變議纖*^■-^V^-/V;v.&<-:\..-‘‘一’:批冷.’:’.:;’:.;.,.妊與屯;甚-.片■—-'安:’'|'-'^'::与;苗';:爷吁;巧W一;..:,;襄基于多文本知巧源酌知识修董写获取譯補''"^^-r<rz.--^?-、-,-…v.r*W、'>--—6-.:t-.知',:.iV,:.听..乾讀一''一..:..:...T'打扣^;;.货三寒其豁;蔡端為..研究生::陈娟指导教师;雷玉

3、霞11教授^麵^;麵傾麵-\胃胃胃HP^鮮科;计觀科学城术—lia:Hf_pf?,',、帛麵:神mu日,濡P答胃‘辩时间:2016年6月1日;、今礎-穀成病5轉鑛數片巧诘勢瑚;議.'.;:..请鱗纖…杳^'v;為滅:--.'.心...-..人7..^..:^^藝謹讀纖..‘黃‘苗;議誦'.''1'、:’辨.^V,-;—'■冷供气::'奋y乾.苗妃摘要摘要知识获取是知识工程中关键的一环,而从文本知识源中获取专业知识是一种重要而常用的途径。但从文本中获取知识并不简单,不管是手工获取还是机器获

4、取,领域专家所使用的概念都很难被识别和抽取出来。另外,由于自然语言的歧义性、非规范性和文本知识源的多样性,常常会产生知识不一致性问题。知识获取的途径主要有三种:第一种是将文本中的概念和关系直接自动的抽取出来的自动化知识获取方式;第二种是依靠人工操作进行知识获取的非自动化知识获取方式;第三种是人机交互合作的半自动化知识获取方式。通过对上述三种知识获取途径的分析,本文选取第三种方式进行知识的获取。知识获取与知识表示两者密不可分,知识获取的前提是采用合适的方法将知识表示出来。只有知识得到了合适的表示,才能更好的实现知识的获取和合理运用。本体作为一种形式化的、

5、概念化的知识表示方法,可以将概念间的语义关系通过层次结构很好的体现出来,而且通过对相同领域中概念的统一,可以实现知识的互通和重复利用。同时,框架表示法作为本体的一种描述语言,可以将概念中所包含的属性和属性值形象、直观的表示出来,有利于对不同知识源中的同一事物或概念进行分析和比较,实现知识不一致性的检测与修正。因此,本文采用基于本体的框架表示对知识进行获取。针对知识获取过程中的不一致性问题,本文首先提出了框架提取算法,实现了文本知识到知识框架的自动获取。其次,利用概念格对框架集的相关性进行分析,为知识框架的检测与合并奠定了基础。然后,对知识不一致性的类型

6、进行了分析和总结,如概念名称不一致、单位类型不一致和知识粒度不一致等,并在框架表示的基础上提出了相应的处理策略。最后,以历史事件知识为例,结合不一致性策略提出了合一算法。并基于Visualstudio平台进行实验验证,获取到了高精度和细粒度的历史知识,实现了知识的不一致性检测、修正与合并。通过实验证明了该方法的可行性和有效性,为下一步的知识服务奠定重要的基础。关键词:文本知识获取,知识表示,本体,不一致性检测与修正,框架提取算法,概念格,合一算法IAbstractAbstractKnowledgeacquisitionisthekeystepinkno

7、wledgeengineering,andacquiringspecialknowledgefromtextsisanimportantandcommonlyusedway.Neithermanuallearningnormachinelearningisasimplemethodtoacquireknowledgefromtext.Conceptswhichareusedbyspecialistsaredifficulttobeidentifiedandextracted.Inaddition,weusuallyfacetheproblemsofkn

8、owledgeinconsistencyduetotheambiguityandnon-nor

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。