企业外部商业关系抽取的研究

企业外部商业关系抽取的研究

ID:32415682

大小:4.83 MB

页数:70页

时间:2019-02-04

企业外部商业关系抽取的研究_第1页
企业外部商业关系抽取的研究_第2页
企业外部商业关系抽取的研究_第3页
企业外部商业关系抽取的研究_第4页
企业外部商业关系抽取的研究_第5页
资源描述:

《企业外部商业关系抽取的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、f煳嬲UniversityofScienceandTechnologyofChinaAdissertationformaster’SdegreeResearchontheExtractionofEnterpriseExternalBusinessRelationsAuthor’SName:JiaYangSpecialty:ComputerApplicationTechnologySupervisor:Asso.Prof.PeiquanJinFinishedtime:April,2013中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人

2、在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名:扬篮中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密

3、的学位论文在解密后也遵守此规定。妒开口保密(——年)作者签名:捣鱼翩虢龠毛杠签字日期:矽f;·!.7;摘要近年来,随着因特网的快速发展,Web网页的数量也呈现出急剧增长的趋势,海量的网页中通常蕴含着丰富的企业竞争情报,如何从海量的网页中挖掘企业所需的竞争情报成为人们研究的热点问题。企业竞争情报包含竞争者发现、商业关系抽取等多个方面,并且商业关系抽取己成为企业获取商业竞争情报的一种有效手段,在当今社会发挥着越来越重要的作用。本论文关注于从Web网页中抽取企业外部商业关系,企业外部商业关系是一种重要的企业竞争情报,主要反映了本企业与其他企业之问存在的商业

4、行为,通过获取企业及其他企业存在的商业关系可以帮助人们推测企业的发展策略,辅助人们决策。本文主要研究了企业外部商业关系中的收购关系和合作关系抽取问题,主要贡献如下:(1)提出了面向Web网页的Top.k企业收购关系抽取算法。本论文研究了在海量的Web网页中抽取企业收购关系的问题,并提出了一种新颖的算法,该算法引入了Web文本的时态特征和语义强弱性分类技术来实现企业收购关系的抽取。它通过对句子时态进行标注,再将时态特征应用到句子分类上解决描述收购关系的候选句子的语义强弱性分类问题,在此基础上对候选的收购对象进行排序产生最终的Top—k个企业收购关系。实

5、验分别测试了6144个从Google返回的网页,以及386818个从NewYorkTimes下载的网页,实验结果表明了所提出算法的有效性。(2)提出了基于简单模式生成算法的企业合作关系抽取方法。企业外部商业关系抽取过程中,首先通过简单模式“公司名+关系指示词”来获取数据集中存在的目标关系候选句子,然而在合作关系抽取过程中发现手工输入的简单模式存在着候选句子识别率过低的问题。针对这一问题,本论文提出了基于聚类的简单模式生成算法来自动的生成模式,提高候选句子识别率,在此基础上完成合作关系抽取。该算法引入了WordNet来获取句子中的关键字信息,通过加入关

6、键字权重信息来改进传统的TFIDF计算词语权重的不足,并采用聚类的方法得到最优簇,抽取最优簇中满足条件的关键字加入简单模式集合中,最后在时态标注、语义强弱分类的基础上完成合作关系抽取。实验结果表明算法显著提高了候选句子识别率和合作关系抽取效果。关键词:企业商业关系竞争情报关系抽取句子时态简单模式生成摘要IIAbstractInrecentyears,withtherapiddevelopmentoftheIntemet,thenumberofWebpagesisdramaticallyincreasinginasharplyupwardtrend.M

7、assiveWebpagesusuallycontainalotofenterprisecompetitiveintelligence.Therefore,howtomineenterprisecompetitiveintelligencefrommassivepageshasbecomeahotresearchtopic.Enterprisecompetitiveintelligenceinvolvesmanyaspects,suchascompetitorsminingandbusinessrelationsextraction.Inpartic

8、ular,findingoutthebusinessrelmionsforyourcompetitorsis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。