基于中心化的微博热点发现方法

基于中心化的微博热点发现方法

ID:3909332

大小:295.07 KB

页数:6页

时间:2017-11-25

基于中心化的微博热点发现方法_第1页
基于中心化的微博热点发现方法_第2页
基于中心化的微博热点发现方法_第3页
基于中心化的微博热点发现方法_第4页
基于中心化的微博热点发现方法_第5页
资源描述:

《基于中心化的微博热点发现方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第9卷第6期管理学报Vol.9No.62012年6月ChineseJournalofManagementJun.2012基于中心化的微博热点发现方法蔡淑琴11112张静王旸马玉涛林勇(1.华中科技大学管理学院;2.英国格林威治大学商学院)摘要:以解决微博平台海量信息碎片为切入点,结合微博信息文本短小、来源广泛、传播方式多样等特点,设计基于中心化的微博热点的发现机制。通过微博平台开放API记录的结构化元数据信息,设计微博的元数据模型,将微博热点发现看作是原始语料到热点语料簇的生产加工增值过程,设计以数据预处理技术为核心的语料初加工方法,以及基于短文本聚类、基于传播路径与用户

2、行为的中心化深加工方法,构建完整的生产加工过程模型,并通过实例验证理论研究成果。关键词:热点发现;微博;中心化;元数据模型中图分类号:C93;F270.7文献标识码:A文章编号:1672-884X(2012)06-0874-06Micro-bloggingHotspotDiscoveryMethodBasedonCentralization11112CAIShuqinZHANGJingWANGYangMAYutaoLINYong(1.HuazhongUniversityofScienceandTechnology,Wuhan,China;2.UniversityofGre

3、enwith,London,UK)Abstract:Inordertosolvetheproblemofmassivepiecesofinformationonmicro-blogs,thispa-perstudiesthecentralizationtheory-basedhotspotdiscoverymethodsformicro-blogs,inconsiderationofthefeaturesofmicro-bloggingcontentsuchasshorttext,varietyofsourcesanddiversemeansofdissemination

4、.ThroughthestructuredmetadataacquiredfromopenAPIs,somemetadatamodelsformicro-bloggingcontentareanalyzed,andthehotspotdiscoveryprocessisregardedasavalue-addedprocessoftheoriginalmaterialstoclustersofhotproducts.Forinitialanddeepprocessingmethodsduringtheproductionprocess,somedatapre-proces

5、singtechniquesaswellasshorttextclustering-basedanddisseminatingpathandusersbehavior-basedcentralizingtechniquesareproposed.Andacompleteproductionandprocessingmodelisestablished.Finally,aseriesofexperimentshaveverifiedthetheoreticalachievement.Keywords:hotspotdiscovery;micro-blogging;centr

6、alization;metadatamodel微博是一个基于用户关系的信息生产、分大主要微博站点的注册用户数均已超过2亿,享、传播和获取平台,其独特的信息生产机制和而根据流量数据统计,weibo.com已成为国内网络传播机制实现了4A(anytime、anywhere、第7大网站。anyone、anything)。从2006年底Twitter进入以微博为代表的新媒体与传统媒体(如报市场至今,短短5年时间里,微博这一新兴的社纸、门户网站等)相比具有不同的特征(见表会化网络服务形式深刻地影响着普通网民的信1)。由于微博内容的这些特征,展现在用户面息分享和获取方式。截至2011

7、年6月,国内两前的是庞杂的“光速微博碎片”,这加剧了用户表1微博与传统媒体的特征对比媒体内容数量文本长度标题更新频率内容发布者中心化程度内容组织传统媒体大量较长有较慢记者、管理员高通过超链接人为组织,结构化程度较高微博海量短小无非常快所有用户很低主要依靠用户个人和社会网络,欠组织收稿日期:2011-09-26基金项目:国家自然科学基金资助项目(71071066);教育部人文社会科学研究资助项目(11YJA630098)·874·基于中心化的微博热点发现方法———蔡淑琴张静王旸等在互联网世界中的“信息过载”和“信息迷失”,参考统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。