基于HowNet的词汇语义倾向计算

基于HowNet的词汇语义倾向计算

ID:36619435

大小:673.96 KB

页数:12页

时间:2019-05-13

基于HowNet的词汇语义倾向计算_第1页
基于HowNet的词汇语义倾向计算_第2页
基于HowNet的词汇语义倾向计算_第3页
基于HowNet的词汇语义倾向计算_第4页
基于HowNet的词汇语义倾向计算_第5页
资源描述:

《基于HowNet的词汇语义倾向计算》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据中文信息学报第20卷第1期JOURNALOFCHINESE刑K佩MAl∞NPROCESSINGV01.20No.1文章编号:1003—0077(2006)01—0014—07基于HowNet的词汇语义倾向计算朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德(复旦大学计算机科学与工程系,上海200433)摘要:在互联网技术快速发展、网络信息爆炸的今天,通过计算机自动分析大规模文本中的态度倾向信息的技术,在企业商业智能系统、政府舆情分析等诸多领域有着广阔的应用空间和发展前景。同时,语义褒贬倾向研究也为文本分类、自动文摘、文本过滤等自然语言处理的研究提供了新的思路和手段。篇章语义倾向研究的基础

2、fi-作是对词汇的褒贬倾向判别。本文基于HowNet,提出了两种词汇语义倾向性计算的方法:基于语义相似度的方法和基于语义相关场的方法。实验表明,本文的方法在汉语常用词中的效果较好,词频加权后的判别准确率可达80%以上,具有一定的实用价值。关键词:计算机应用;中文信息处理;态度分类;语义倾向;知网中图分类号:唧91文献标识码:ASemanticOrientationComputingBasedonHowNetZHUYan-lan,MINJin,ZHOUYa-qian,HUANGXuan-jing,WUⅡ·de(1)qⅪrhI脚tofComputerScienceandTechnolog

3、y,FudanUniversity,Shanghai200433,Chi.a)Abstract:Nowadays,withthedevdopmentofIntemetandinformationexplosion,automatedtechniquesfor舭姐慨allthor’sattitudestowardsspecificeventswillmakegreatefforttobusinessintelligenceandpoblicopinionsurvey.Senlanticorientationinferencehasbecomeam朗lliIlgfultool,which

4、couldprovideusefulirffonnationfortextclassification,剐咖mad刎∞,6lt既ingetc.Measuringthesen训corientationofwordswouldgreatlycontributetopredictingtheauthor’Sattitudeinapassage.Inthispitper。asimpleHowNet-basedmethotforsemanticorientationcolnpuLationofChinesewordsisintroduced.Althoughthismethodl_e恤only

5、afewseedwords,satisfactoryIestdtScanstillbeobtained.Andtheperfonrmnc沱isevenbetterforhe—quenflyusedwords,withthefrequency-weightedaccuracyofabove80%.Keywor凼:computerapplication;CJfineseinformationprocessing;sentimentclassification;semanticorientation;HowNet1简介面对浩瀚的网络资源,如何通过有效的手段获取所需的信息,是目前计算机领域研

6、究的热点。语义倾向性研究正是在这一背景下应运而生的。人们根据各自所关注的问题在Web上进行搜索,通过阅读大量相关文献、介绍、评论,逐渐形成自己的观点。由于网络资源过于庞大,搜集一阅读一评价的工作变得十分繁琐和耗时。因此迫切地需要一套能够自动搜索、评价、归纳的系统替人们完成这一任务。困难是显而易见的,计算机虽然具有极快的处理速度,14收稿日期:2005—05一Cr7定稿日期:2005—11—01基金项目:国家自然科学基金资助项目(60435020);上海市科技攻关计划资助项目(035115028)作者简介:朱嫣岚(1982·),女,硕士生,主要研究方向为自然语言处理.万方数据但如何使其

7、能够自动完成对文本的语义倾向的推断,仍然是个需要研究的课题。所谓词汇的语义倾向,即对于词汇的褒贬程度计算出一个度量值。为了便于统计和比较,目前比较常用的做法是将度量值规定为位于±1之间的实数。当度量值高于某阈值时,判别为褒义倾向;反之,则判为贬义倾向。此外,我们可以通过对篇章中词汇的语义倾向值求平均的方式,获得篇章的语义倾向。因此,对词汇的语义倾向计算是此类研究中的关键工作。语义倾向研究具有极大的实用价值。在商业领域中,能够为企业进行市场分析、市场调查、顾

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。