基于云模型理论的lda最大熵模型观点挖掘研究

基于云模型理论的lda最大熵模型观点挖掘研究

ID:35059896

大小:6.48 MB

页数:66页

时间:2019-03-17

基于云模型理论的lda最大熵模型观点挖掘研究_第1页
基于云模型理论的lda最大熵模型观点挖掘研究_第2页
基于云模型理论的lda最大熵模型观点挖掘研究_第3页
基于云模型理论的lda最大熵模型观点挖掘研究_第4页
基于云模型理论的lda最大熵模型观点挖掘研究_第5页
资源描述:

《基于云模型理论的lda最大熵模型观点挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级分类号UDC编号茅中钟赵欠考硕±学位论文基子模型理冷的LDA最大摘娛型3见点挽撫研堯学位申请人姓名:司旗申请学位学生类别:工程硕壬申请学位学科专业:软件工程指导教师姓名:马长袜到教换*■;硕去学位论文MAST’S?ERTHEWS硕±学位论文基于是模型理论的LDA最大贿模型观点巧掘研究论文作者:司琪指满狮:马长林副織学科专业=软件工程研究方向:机器学习华中师巧大学计舞轨学院20

2、16年5月*?>硕壬学位论文MA’?STERSTHEWSOinionMhihiResearchofLDpg乂MaximumEntropyModelBasedonCloudModelTheoryAThesisSubmittedinPartialFulfillmentoftheReuirementqFor化eMS.DegreeinSoftwareEngineeringBySiiQPostradua化P

3、roramggSchoolofComputerCentralChinaNormalUniversitySuervisor:MaChanlinpgAcademicTitle:AssociateProfessorSignature^jLAA::h^(^ArovedppMa2016y,<??硕去学位论文ER,MASTSTHES?IS华中师范大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导

4、师指导下,独立进行研究工作所取得的研巧成果。除文中己经标明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均己在文中W明确方式标明。本声明的法律结果由本人承担。作者签名:曰期;年^月曰/学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部口雜构送交论文的复印件和电子版,允许论文被査阅和借亂本权华中师范大学可队格本学位论文的全部或部分内淺i入有关数据库进

5、行检索,可W采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同意华中师范大学可W用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。作者签名:哥易-导师签名:■曰期:曰:知化年I月曰曰期vo月Ifg{I本人""己经认真阅读CALIS高校学位论文全文数据库发布章程,同意将本人的学""""位论文提交CALIS高校学位论文全文数据库中全文发布,并可按章程中的规定享一受相关权益。同煮论义提々后滞后:口半年:□年!□二年发布。-:作者签名郝导师签名:

6、曰期:3年月I日日期:月日4(.(巧壬学位论文MA靈’?S丽IS摘要"’’和大数据时代随着互联网的高速发展,当今社会进入了互联网+。电子商务和网络社交媒体的空前繁荣使得人们有了更多在网络上发表评论信息的机会,在线评论中包含着许多有价值的信息,这些信息能很好地服务商家、用户和政府部口。但面对互联网公司在日常运营中累积的用户网络行为所生成的海量在线评论数据,仅靠人工的方式根本无法有效地提取出关键信息。在这种大环境下,观点挖掘技术的诞生为解决W上问题提供了新的

7、思路,而细粒度观点挖掘由于能为用户提供更具体有效的信息,从而获得国内外研究人员的广泛关注。观点挖掘的H大主要任务分别是:情感分类、观点抽取和观点分析,为了完成W上任务,研究人员提出了很多的方法,它们可W被简单归纳为基于规则的方法和。基于统计机器学习的方法早期的观点挖掘使用的大都是基于规则的方法,需要人工定义领域特征词和词的提取规则一,虽然在定程度上满足了观点挖掘的需要,但工作量大、适应性差的特点使得该方法不适合于海量数据的观点挖掘。而主题模型为代表的基于统计机器学习的

8、观点挖掘方法,W其领域适应性和无监督性得到了研究人员的认可,逐渐替代了基于规则的方法。LDA一模型是种无监督的统计主题模型,,它将文档表示为若干词语的集合类一,似于个词袋其中的词语相互独立没有关联,然后根据变分推断、EM算法、吉--布斯采样等方法对文档主题分布和主题单词分布进行近似推理求解,从而得到文章中的相关观点,,。而文档中词语的位置和语义关系对观点表达有着重要的影响要想获取更准确和有价值的观点信息,需要对传统LDA模型进行改进后才能用于细粒度观点挖掘。此外,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。