中文网络产品评论中评价对象抽取方法研究.pdf

中文网络产品评论中评价对象抽取方法研究.pdf

ID:55569318

大小:2.11 MB

页数:75页

时间:2020-05-18

中文网络产品评论中评价对象抽取方法研究.pdf_第1页
中文网络产品评论中评价对象抽取方法研究.pdf_第2页
中文网络产品评论中评价对象抽取方法研究.pdf_第3页
中文网络产品评论中评价对象抽取方法研究.pdf_第4页
中文网络产品评论中评价对象抽取方法研究.pdf_第5页
资源描述:

《中文网络产品评论中评价对象抽取方法研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、中文网络产品评论中的评价对象抽取方法研究作者姓名:学科专业:导师姓名:完成时间:孟翠翠管理科学与工程王卫平副教授二。一一年五月i1UniversityofScienceandTechnologyofChinaAdissertationforMaster’SdegreeResearchontheApproachesofOpinionTargetExtractionfromChineseCustomerReviewsontheInternetAuthor’SName:CuicuiMengSpeciality:ManagementScienceandEngin

2、eeringSupervisor:A.Prof.WeipingWangFinishedtime:May,201过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:歪雩翠签字日期:丝!!:!:I中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复位论文全手段保存保密圈公作者签字随着Internet的迅猛发展和电子商务的不断普及,互联网以其独特的优势吸引着各大制造商在网络上出售产品以及消费者在网络

3、上购买产品。与此同时,网络上关于各种产品的评论语句的数量迅速增长。这些产品评价给制造商和消费者带来巨大好处。一方面,制造商可以从中得到关于产品的反馈信息;另一方面,潜在的消费者可以从已有的产品评价中找到客观真实的购物参考。但是评论语句庞大的数量在一定程度上非常不利于制造商以及潜在的消费者从中提取有用信息。面对这样的现实问题,如何才能对这浩如烟海的评论语句进行快速查询和统计,意见挖掘技术应运而生。意见挖掘是当前自然语言处理的研究热点,它帮助人们在大量产品评论中快速定位需要寻找的相关产品意见。意见由四个元素组成,即主题、持有者、陈述、情感。这四个元素之间存在

4、着内在的联系,即意见的持有者针对某主题发表了具有情感的意见陈述。在这四个元素中,主题的抽取可谓是重中之重。准确又快速地定位网络客户评论的主题(即评价对象),这是正确进行情感分析的基础,这也是意见挖掘系统准确率的保证。只有正确抽取评价对象,意见挖掘的结果才会准确可信。本文使用了网络中的中文产品评论(电脑类)作为实验数据来源,着重研究了意见挖掘中的评价对象抽取任务。本文从一个新的角度来考虑:一、抽取的评价对象符合抽取规则,但是并不一定与主题相关;二、即使与主题相关,但未必是主观句中的评价对象。本文不需要建立任何词典,也不需要进行主客观句的分析,只需要利用中国

5、科学院计算技术研究所自然语言处理研究组的ICTParser的句法分析以及哈尔滨工业大学的语言技术平台IR的依存关系对评论语句进行分析,然后根据一定的规则计算候选评价对象的权重,对候选评价对象进行初步筛选,最后利用似然率检验方法计算候选评价对象与主题的相关程度,对候选评价对象进行排序。实验结果验证了该方法的有效性。关键词:意见挖掘评价对象抽取似然率检验句法分析依存分析摘要ⅡABSTRACTWiththerapiddevelopmentofInteractandthegrowthofe—conln3efce,alotofbigmanufacturerssel

6、lproductsontheIntemetandmoreandmoreconsulD_ersbuyproductsonlinebecauseofitsuniqueadvantages.Meanwhile,thenumberofconllnentaryonvariousproductsinthewebgrowsrapidly.TheseproductevaluationsbringgreatbenefitstothemanufacturersandconsunR.qrs.Ontheonehand,themanufacturersCangetfeedback

7、informationaboutproducts;Ontheotherhand,thepotentialconsumerscanfindtheobjectiverealshoppingreferencefromexistingproductevaluation.Butthehugenumberofcommentarylinesisnotgoodformanufacturersandpotentialconsumerextractingusefulinformationinacertainextent.Inthefaceofsuchrealisticpro

8、blem,howtofastqueryandstatisticthesevolu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。