中文产品评论的特征观点对识别基于领域本体的建模方法

中文产品评论的特征观点对识别基于领域本体的建模方法

ID:33529471

大小:654.96 KB

页数:10页

时间:2019-02-26

中文产品评论的特征观点对识别基于领域本体的建模方法_第1页
中文产品评论的特征观点对识别基于领域本体的建模方法_第2页
中文产品评论的特征观点对识别基于领域本体的建模方法_第3页
中文产品评论的特征观点对识别基于领域本体的建模方法_第4页
中文产品评论的特征观点对识别基于领域本体的建模方法_第5页
资源描述:

《中文产品评论的特征观点对识别基于领域本体的建模方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第31卷第1期(总第229期)系统工程Vol.31,No.12013年1月SystemsEngineeringJan.,2013文章编号:1001-4098(2013)01-0068-10X中文产品评论的“特征观点对”识别:基于领域本体的建模方法111,2尹裴,王洪伟,郭恺强(1.同济大学经济与管理学院,上海200092;2.井冈山大学商学院,江西吉安343009)摘要:随着社交媒体的发展,不断增加的在线产品评论正在极大地影响电子商务市场,使得评论挖掘成为商业界与学术界共同的热点话题。针对中文产品

2、评论的特点,本文提出一种基于领域本体的建模方法,通过建立评论挖掘模型来对产品评论的基本评价单元——“特征观点对”进行识别。该建模过程以设计科学研究方法论为指导。首先在模型设计阶段,构建面向产品评论的领域本体;然后在模型实施阶段,提出基于本体的特征观点对识别方法;最后在模型评价阶段,通过实验对评论挖掘结果进行评价。实验结果表明,本文提出的方法与其他基于统计的方法以及基于语义的方法相比,在性能上有明显提高,对克服口语化严重和语法不规范等问题具有良好的效果。此外,通过特征观点对的识别与统计,使产品评论这

3、种非结构化文本转化为机器可读的、能理解的结构化表达,并得到具有一定商业应用价值的信息。关键词:中文产品评论;特征观点对;领域本体;评论挖掘模型中图分类号:F274文献标识码:A并不适用于中文评论这种口语化严重、语法不规范和主语1引言缺失的语料。在线评论反映了用户通过互联网对产品各方面发表因此,针对现有研究中的不足,本文提出面向中文产的看法。与商家的促销信息相比,在线评论具有独立性、品评论的特征观点对识别方法。从词语分析入手,研究词非商业性,因此深得用户信赖。与此同时,由于缺少线下语间潜在的语义关系

4、,并利用基于领域本体的建模方法,体验,更多的用户倾向于先看评论,后做决策。Deloitte构建用于识别特征观点对的评论挖掘模型。本研究的贡献为提出一种自动构建领域本体的算法,并在此基础上开发ConsumerProductsGroup调查显示,有67%的网民会浏览在线评论,其中82%认为在线评论影响了他们的购买决出产品评论挖掘的一般方法,将评论这种非结构化文本转策。可见,在线评论引发的电子口碑已不容小觑。通过评论化为机器可读的、能理解的结构化表达,从而建立起人与分析,商家能够了解市场对产品的看法,发

5、现与竞争对手机器的沟通桥梁、缩小技术开发与商务应用之间的距离。的差异,为产品改进、价格优化提供有价值信息。2文献综述用户往往是针对产品的不同特征发表相应的观点,所以产品特征及其评价观点便成为评论挖掘的基本对象,被2.1基于统计的特征观点对识别方法称作“特征观点对”。现有研究将特征识别与观点挖掘作为这种方法利用基于统计的算法识别特征词,再采用邻两项独立的任务[1-2]。但实际上将产品特征与观点作为一近原则来判断相应的观点。例如,Hu和Liu(2004)首先识个整体比将两者分开进行识别能获取更完整的评

6、论信别句子中的名词或名词短语,然后使用关联规则挖掘出频息[3-5]。特征观对识别的方法分为两类:基于统计的方法繁项作为产品特征,将离产品特征最近的形容词作为评论和基于语义的方法。这些方法大多以词频、词语距离以及观点[6]。Liu等(2006)和Scaffidi(2007)通过人工建立特定句法分析仅存在于词表面的关系,将其应用在英文评论这产品的特征集合来识别评论中的产品特征,再将与产品特[7-8]种句式固定、语法规范的语料上能取得较好的效果,但却征相邻的形容词作为评论观点。Zhang等(2010)通

7、过X收稿日期:2012-05-15;修订日期:2012-07-20基金项目:国家自然科学基金资助项目(70971099);中央高校基本科研业务费专项(1200219198);上海市科技发展基金软科学研究博士生学位论文资助项目(12692193000)作者简介:王洪伟(1973-),男,辽宁大连人,副教授,博士生导师,研究方向:商务智能与情感计算。第1期尹裴,王洪伟等:中文产品评论的“特征观点对”识别:基于领域本体的建模方法69条件随机场识别产欠特征,再基于邻近原则与语法树识别现性来挖掘特征观点对,

8、但当特征词与观点词距离较远与产品特征相对应的评价观点[9]。时,该方法所识别的特征观点对则可能并非互为搭配。2.2基于语义的特征观点对识别方法º相对而言,基于语法的语义方法比基于统计的方法这种方法将语言学知识引入评论挖掘,主要采用两种包含更多语言学知识,因此具有较好的精度。但仍存在两技术:基于语法的技术和基于本体的技术。其中,基于语方面不足:一方面由于语法规则为手工构建的,一般只能法的方法是通过构建语言模式、语法规则或情感词典来识处理句型比较简单、评论词与评论对象距离较近的句子;别

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。