基于HowNet的术语语义知识库构建技术

基于HowNet的术语语义知识库构建技术

ID:46603190

大小:409.55 KB

页数:7页

时间:2019-11-26

基于HowNet的术语语义知识库构建技术_第1页
基于HowNet的术语语义知识库构建技术_第2页
基于HowNet的术语语义知识库构建技术_第3页
基于HowNet的术语语义知识库构建技术_第4页
基于HowNet的术语语义知识库构建技术_第5页
资源描述:

《基于HowNet的术语语义知识库构建技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、文章编号:2095-1248(2016)04-0078-07基于HowNet的术语语义知识库构建技术1211王羊羊,陈刚,蔡东风,王裴岩(1.沈阳航空航天大学人机智能研究中心,沈阳110136;2.中航昌河飞机工业(集团)有限责任公司科技部,江西景德镇333000)摘要:领域知识库能够满足特定领域的自然语言处理系统对知识的需求,然而大部分领域知识库的构建方式为手工构建,效率较低。针对这一问题,分析已经手工构建的2300余条航空术语描述信息及其在构建过程中总结的规则,在此基础上,总结了200余条核心词框架,核心词以外的其他词,通过一种规则与统计相结

2、合的方法进行框架的自动填充,从而提高了构建术语语义知识库的自动化程度。最后,对构建的术语描述信息进行了相似度计算,取得了较好的结果。关键词:术语;规则;统计;语义知识库中图分类号:TP391.1文献标志码:Adoi:10.3969/j.issn.2095-1248.2016.04.014ConstructiontechniquesofterminologysemanticknowledgebasebasedonHowNet1211WANGYang-yang,CHENGang,CAIDong-feng,WANGPei-yan(1.HumanMach

3、ineIntelligenceResearchCenter,ShenyangAerospaceUniversity,Shenyang110136,China;2.Sci-techDepartment,AVICChangheAircraftIndustry(Group)CompanyLtd,Jingdezhen333000,China)Abstract:Knowledgebaseforspecificdomainscansatisfytheknowledgerequirementsforthenaturallan-guageprocessingsy

4、stem.However,mostcurrentworkforbuildingthedomainknowledgebaseishand-builtandinefficient.Tosolvethisproblem,morethan2300piecesofterminologydescribinginformationandtherulesthathavebeenformulatedwereanalyzed.Thenmorethan200semanticframeworksweresumma-rizedbasedoncorewordwhilethe

5、otherwordsarefilledtotheframeworksaccordingtotheruleandthesta-tisticalresults.Finally,thevalidnessoftheconstructedknowledgebaseisdemonstratedthatgoodresultsareachievedintermofsimilaritycalculation.Keywords:terminology;rule;statistic;semanticknowledgebase[3]自然语言的语义分析和内容信息的理解离不

6、传统的语义知识库包括WordNet、[1][4-5]开语义知识库的支持,计算机可以通过语义知FrameNet在内,构建方式大多为手工构建;较[6][7-8]识库了解人类语言,从而变得更加智能。传统的大型的语义知识库只有MindNet和Yago语义知识库大多面向通用领域,不能满足特定领的构建方式为自动构建;此外,文献[9]提出了一[2]域的自然语言处理系统对问题的知识需求,所种基于实体-属性框架的领域知识库的自动构建以构建领域知识库是十分必要的。方法,然而它们都是以自然语言的形式进行表述,收稿日期:2015-12-11基金项目:国防基础科研项目(项

7、目编号:A0520131003);辽宁省高校创新团队支持计划(项目编号:LT2014005)作者简介:王羊羊(1991-),女,辽宁鞍山人,硕士研究生,主要研究方向:自然语言处理,E-mail:wangyangyang0408@126.com;蔡东风(1958-),男,河北霸县人,教授,主要研究方向:人工智能、自然语言处理,E-mail:caidf@vip.163.com。第4期王羊羊,等:基于HowNet的术语语义知识库构建技术79在计算机系统中不易对其进行相似度计算、相关面”:DEF={Height渣高度:host={waters渣水域}};

8、度计算等处理。“发动机”:DEF={part渣部件:PartPosition={heart文献[13]针对航空领域术语的特点,在渣心},

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。