复杂网络上基于流行病学的舆情传播模型及其规律研究

复杂网络上基于流行病学的舆情传播模型及其规律研究

ID:75752202

大小:4.00 MB

页数:59页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
复杂网络上基于流行病学的舆情传播模型及其规律研究_第1页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第2页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第3页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第4页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第5页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第6页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第7页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第8页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第9页
复杂网络上基于流行病学的舆情传播模型及其规律研究_第10页
资源描述:

《复杂网络上基于流行病学的舆情传播模型及其规律研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

摘要摘要复杂网络上基于流行病学的舆情传播模型及其规律研究随着互联网技术的迅猛发展,人类社会进入了网络信息时代。网络已经成为了人们发布和传播信息的主要载体。在为人民生活提供诸多便利的同时,网络也成为了谣言传播的快速通道。在线网络上的舆情传播由于具有传播速度快、影响范围广等特点,已经引起了多起公共事件,对社会造成了不良影响。因此了解舆情信息在网络中传播过程及规律,对认识、预测和引导舆论事件的发生发展有着重要的理论意义和现实意义。信息和舆情传播这一课题一直备受专家学者关注,并进行了相关的研究。由于舆情传播的过程与传染病的病毒传播过程十分相似,所以建模的主要方法是基于病毒传播的传染病方法。真实的在线社会网络中的人即节点,人与人之间存在的关系即边。在线社会网络的拓扑结构即不是规则图也不是随机图,而接近于复杂网络,具有小世界效应和无标度特性。网络中的节点数量巨大,每个个体的行为特性复杂,对舆情传播产生相应的影响。为了对复杂网络中舆情传播的规律进行深入研究,本文基于流行病学提出了一种符合当前在线网络传播形式的传播模型:SICRS模型。该模型综合了传统流行病模型SIS模型和SIR模型,同时加入了染病个体从感染状态(infectious)到免疫状态(removed)的一个过渡状态,即治疗状态(cured)。各个状态对应到舆情传播领域即:S-对消息的未知状态,I-传播状态,C-知道消息但不传播的暂时遗忘状态,R-对消息免疫的永久遗忘状态。由于网络用户具有不同的个性特征及价值取向,因此在建模时考虑了个体agent多个特性对舆情传播规律的影响,包括个体影响力、对消息的好奇度、信息传播能力以及对信息的遗忘周期等。由于该模型只能输出宏观的各个状态人数等数据,并不能观察到网络中agent具体的微观变化,所以同时对具有代表性的网络进行了可视化。可视化的网络使网络特征更加明显,并通过更加直观的颜色来反映各个节点的状态。可视化网络对发现网络舆情传播的规律和特性起到了非常大的辅助作用。在SICRS传播模型下,并考虑Agent的特性以及Agent间的关系,通过仿真实验研究复杂网络中舆情传播的规律。仿真结果表明,标度网络中舆情传播过程呈现三阶段规律:传播初期存在舆情爆发现象;传播中期消息影响范围呈现周期性波动递减;在传播后期舆情在网络中呈现动态稳定。传播后期宏观上各个状态的节点数不变,而微观上网络中一些节点的状态存在周期性变化。同时发现当节点度较小时,节点经历周期数基本符合幂律分布。度较大时,节点经历周期数迅速减少。同时对模型中的潜在影响因子进行了实验分析,发现舆情传播的规律受网络密度影响,网络密度越大,舆情传播的影I 摘要响范围越大,消息在网络中持续的时间越长;舆情传播规律与用户传播时间的分布有关,传播能力强的人数越多,使传播中期持续的时间越长,但是不影响传播初期的舆情爆发情况与后期各状态稳定值;同时舆情传播的规律与用户好奇度分布相关性不大。以度数较小的节点作为信息传播源时会产生两种情况:一种情况为消息一直无法在网络中扩散;另一种情形为舆情会在网络中小范围传播,经过一段时间后影响范围逐渐缩小并彻底消失。通过对ER随机网络和WS小世界网络的仿真实验结果分析,发现网络的不同拓扑结构对以上舆情传播规律没有明显影响。关键词:舆情传播,流行病学,复杂网络,建模与仿真II AbstractAbstractTheSimulationandAnalysisofanOpinionSpreadingModelincomplexnetworksbasedonepidemiologyWiththerapiddevelopmentofInternettechnologyandinformationtechnology,humansocietyenteredtheInternetage.Thenetworkhasbecomethemaincarrierofthepeopletopublishanddisseminateinformation.Thenetworkprovidealotofconveniencetopeople'slives.Atthesametime,thenetworkbecomesfast-tracktoarumortoo.Becauseonlinedisseminationofpublicopinionspreadsfastandaffectswide,manypubliceventshasbeencausedtohadanegativeimpactonsociety.Therefore,tounderstandthetransmissionprocessandlawofpublicopiniononthenetworkhasimportanttheoreticalandpracticalsignificancetounderstand,predictandguidethedevelopmentofpublicopinionevents.Thesubjectaboutthespreadofinformationandpublicopinionhasalwaysbeenaconcernofexpertsandscholars.Thepropagationprocessofpublicopinionandinfectiousvirusisverysimilar,sothemainmethodofmodelingisbasedontheinfectiousdiseases.Intherealonlinesocialnetwork,thenodeispeopleandtheedgeistheinterpersonalrelation.Thetopologyofonlinesocialnetworkisnotaregulargraphorarandomgraph,whileclosetothecomplexnetworkwhichhasthesmall-worldeffectandno-scalecharacteristics.Boththehugenumberofnodesinthenetworkandthebehaviorcomplexityofeachindividualhaveacorrespondingimpactonthepublicopinionpropagation.Basedonepidemicmodel,anewspreadingmodel(SICRS)thatfitspopularonlinenetworkspreadingisproposedtostudypatternsofpublicopinionspreadincomplexsocialnetworks.ThemodelintegratedtraditionalepidemicmodelSISmodelandSIRmodel.Duetotheprocessofforgettingwhichcanbedividedintotemporaryforgettingandpermanentforgetting,atransitionstatenamedcuredstatuswhichrepresentstemporaryforgettingstatusisaddedbetweenspreadingstatusandpermanentforgettingstatus.Themeaningofeachstateinpublicopiniondissemination:Sstandsfortheunknownstatus,Istandsforthespreadstatus,Cstandsforthetemporaryforgettingstatusthatmeanstheagentknowtheinformationbutwillnotspreadit,andRstandsforthepermanentforgettingstatusthatmeanstheagentisimmunetotheinformation.Asweknow,networkuserhasdifferentpersonalitytraitsandvalues,andthecharacteristicwillaffectthepatternsofpublicopinionpropagation.Somanycharacteristicsoftheindividualagentareconsideredinthemodel,suchastheindividualinfluence,curiositytonews,informationdisseminationcapabilitiesandforgettingcycles,andsoon.Becausetheoutputofthemodelisonlythemacroscopicdataofrespectivestates,specificmicroscopicchangesintheagentcannotbeobserved.Therefore,thetypicalnetworkIII Abstractisvisualized.Thevisualnetworkmakesthecharacteristicsofnetworkmoreobvious,andthestateofnodescanbeobservedthroughamoreintuitivecolor.Visualnetworkhasplayedaveryimportantroleinfoundingthefeaturesandpatternsofpublicopinionspreadinthenetwork.BasedonSICRSpropagationmodels,andconsideredtheagent'scharacteristicsaswellastherelationshipbetweenagents,alargenumberofsimulationexperimentsareconductedtostudythepatternsofpublicopiniondisseminationinthecomplexnetwork.Simulationresultsshowthatthedisseminationofpublicopinioninthecomplexnetworkcanbedividedintothreestages.Intheearlystage,theinformationspreadrapidlyinthenetwork.Thereisthephenomenonofpublicopinionoutbreaks.Inthemiddlestage,withthegrowthofthepropagationtime,influencerangeofnewsreducesprogressivelyandperiodically.Inthelatestage,publicopinionpresentsdynamicstability.Thoughthenumberofeachstateisunchangedmacroscopically,thestateofsomenodesinthenetworkcyclicallychanged.Whenthedegreeofnodeislow,thenumberofexperiencedcycleofnodeisinlinewithapower-lawdistribution.Thenumberofcyclesofthenodewhichhasgreaterdegreeisrapidlyreduced.Atthesametime,bytheanalysistotheexperimentalresultaboutthepotentialimpactfactorinthemodel,wefoundthatthepublicopinionpropagationisaffectedbythedensityofthenetwork,thegreaterthenetworkdensity,thegreaterthescopeoftheimpactofpublicopinionspread,andthelongerthemessageslastinginthenetwork;thespreadpatternsarerelatedtothedistributionofuserpropagationtime,themorepeoplewhohasspreadability,thelongerimpacttimeofpublicopinioninthenetwork.Thespreadearlystageandlatestagecannotbeaffected.Thespreadisnotsignificantlyrelatedwiththedistributionofusercuriosity.Lowdegreenodesassourcesofinformationdisseminationwillcausetwosituations:theoneisthatthemessagehasnotbeenspreadinthenetwork;theotheroneisthatthepublicopinionwillbespreadinthesmallrangeandthentheinfluencescopewillnarrowtodisappearcompletely.BysimulationresultsofpublicopinionspreadinERrandomnetworkandWSsmall-worldnetwork,wefoundthatdifferentnetworktopologyhavenotsignificanteffecttothepatternsabove.Keywords:PublicOpinionSpread;Epidemiology;ComplexSocialNetwork;ModelingandSimulationIV 目录目录第1章绪论...............................................11.1研究背景................................................11.2研究目的和意义..........................................21.3论文主要内容............................................3第2章相关领域的研究概况.....................................52.1复杂网络................................................52.2流行病学................................................72.3基于Agent建模与仿真....................................72.4舆情传播研究现状........................................8第3章舆情传播的建模研究....................................103.1一些流行病模型.........................................103.2Agent建模.............................................123.3本文的传播模型.........................................13第4章仿真算法及实现........................................164.1无标度网络模型.........................................164.2仿真算法...............................................174.3网络可视化.............................................18第5章仿真结果及分析.........................................205.1仿真结果...............................................205.2结果分析...............................................215.2.1舆情传播初期......................................225.2.2舆情传播中期......................................255.2.3舆情传播后期......................................265.3影响因子分析...........................................295.3.1网络密度..........................................295.3.2用户传播能力分布..................................31I 目录5.3.3用户好奇度分布....................................335.4消息源为小度节点的仿真分析.............................345.5其他网络的仿真实验.....................................395.5.1ER随机网络仿真实验...............................395.5.2WS小世界网络仿真实验.............................41第6章论文总结与展望........................................446.1本文总结...............................................446.2展望...................................................45参考文献......................................................46作者简介及在学期间所取得的科研成果............................49致谢......................................................50II 第1章绪论第1章绪论1.1研究背景舆情,即舆论情况,是指在一定的社会空间内,公众对社会事件或现象的发生、发[1]展和变化所表达的态度和意见的总和。传统的社会舆情存在于人们日常生活的议论中,大多数情况下人们都采用口口相传的方式进行观点和思想的传播。而由于传统的传播方式存在诸多不稳定因素,舆论在传播过程中呈现出信息不完整、误差大、传播速度慢、[2]影响范围小等特点,这也导致舆情难以捕捉,更难进行整理分析以得到其传播规律。报纸、无线广播和电视等传统的传播媒体的出现,改变了以往舆情传播速度慢、范围小等状况。但是由于这些信息载体只是将一些社会现象或者政治事件报道给公众,平民百[3]姓却无法将自己的想法和态度及时全面地反馈。由此可见,这样广而告之的单方向舆情传播使政府不能全面了解民意民情。近年来,随着互联网的快速发展,网络已经在人们的日常生活中不可或缺,成为人与人之间交流沟通的新方式。由于互联网进入门槛低,无论什么身份什么阶层的人都可以轻松地成为网民,这导致互联网参与群体非常庞大。不同于传统的面对面的社会交往,[4]在匿名的网络中人们可以在短时间内建立大量的在线朋友关系。因此,网络在公众中迅速普及流行起来,人们通过网络来表达观点、传播思想。与传统的信息传播媒体以及口口相传的传播方式相比,互联网上的信息传播表现出了诸多新特性:实时交互性强、信息传播迅速、信息量巨大、传播范围广、参与者众多等等。互联网将人们分散的、自发的言论和思想集中地、显在地反映出来,这样便形成了网络舆情。可以说,互联网已经成为了社会舆论的放大器。由于互联网是完全开放的,任何人都可以成为网络信息的发布者、传播者和阅读者。通过论坛、博客、BBS、社交网站等途径,人们可以随时获取信息、发表观点。互联网[5]为人们提供了一个自由的信息共享平台。因为在网络中参与者都是匿名的,使得不同身份不同阶层的网民都可以畅所欲言,毫无忌讳地表达自己最真实的感受和情绪。而网络成为人们思想和观念的集散地的同时,也为大家提供了一个可以宣泄自己情绪的场所。在网络中不免会出现带有主观因素、缺乏理性的偏激言论,而由于网民之间的情绪相互影响发酵,使得这些言论在网络上迅速传播,以致产生消极有害的舆情。如今,在线网络已经成为了“虚拟社会”,网民都有不同的身份、背景,所以在线讨论的话题也非常多元化,涉及政治、经济、教育、军事、日常生活等等各个方面。这样,网络中的[6]信息数量非常庞大,同时涉及领域也非常广泛。同时网络信息传播存在实时性,所以网民会对所感兴趣的某一话题或事件迅速做出反应,进行探讨以互相交换意见及看法。1 第1章绪论而网络中的用户群体十分庞大,对于热点话题大家会纷纷进行带有情绪化的评论及转载,这样该话题的影响范围不断扩大,最终成为公众话题。同时,互联网的开放性使网络中的用户群体十分庞大,鱼龙混杂。随着舆情传播途径从传统渠道向互联网等新型载体转移,信息交流呈现出了非理性化以及情绪化等新特[7]征。存在一些网民出于各自的非法目的在网络上肆意散布谣言、人身攻击并传播偏激[8]及非理性思想。这些消极信息在网络上迅速传播,很难进行有效控制。与此同时,可以利用互联网舆情传播的速度快、影响大、范围广等特性,对需要普及和宣传的优质信息进行有目的的引导性传播,带动良好的社会风气、维护社会的和谐。所以充分地了解在线网络中舆情传播的规律,对控制恶意舆论并积极引导社会舆论是十分必要的,也是网络这一新兴媒体所面临的严峻挑战。1.2研究目的和意义近几年来,随着web2.0等互联网技术的迅猛发展,在线社会网络由于其为网络用户提供了快速便捷的沟通渠道而得到了广泛的应用,在线网络成为了人们沟通交流的主[9]要平台。不同于传统的社会交际网络,在线的舆论传播呈现出的突发性、实时交互性、传播速度快、影响范围广等新特性,是对传统的信息传播模式的颠覆。2012年,从中国互联网络信息中心发布的“第三十次中国互联网络发展状况”统计报告的统计数据可以看到,截至2012年6月底,中国网民规模已经达到5.38亿人,比2011年底增加了2450万人;互联网普及率高达39.9%,提升了1.6个百分点。而农村网民规模已达1.46亿。有此可见,互联网的普及率稳步上升且用户范围逐渐扩大的同时,互联网在人们生活中的重要性也越来越明显,已经成为一个不容忽视的新型舆论传播平台。互联网用户人数的不断增加,为网络舆论的形成以及传播提供了更加肥沃的土壤。通过新闻评论、网络论坛、博客、社交网站、wiki等多种信息交互方式,人们可以根据自己的喜好选择相关信息进行获取,同时也可以发表自己的言论和看法,并可以通过转载、分享等方式进行对该信息的继续传播。由于互联网的高度开放性和信息实时性,越来越多的民众选择在网络中获取信息、发表观点、交流看法。可以说随着互联网的快速普及,人们的交流方式及言论习惯也发生了很大的转变。众所周知,任何事情都有两面性。网络作为一个开放的公共舆论平台,在给人们提供实时获取信息、交互意见的良好舆论环境的同时,也给社会带来了一些不容忽视的负面影响。由于互联网的开放性及隐蔽性,被许多不法分子所利用。这些人通过网络散播黄色暴力信息、网络病毒,以获取不法利益或私人信息;甚至有些人利用网络的便捷性传播反动言论、虚假内容等,试图破坏社会和谐,误导民众的意识取向。近年来,发生[10]了多起由舆情或谣言传播引起的公共事件,如英国的伦敦骚乱、美国的华尔街游行事2 第1章绪论件、发生在我国的抢盐事件、毒胶囊事件、陕西表哥事件等等。网络舆情事件对社会已[11]经产生了非常深刻且广泛的影响,可以说目前没有其他的平台可以与之相媲美。可见网络舆情的影响及能量已经不可忽视、不能忽视、更不该忽视。由于网络舆情对社会舆论、人们的价值取向、行为方式、公众情绪等都有着越来越深远的影响,所以对网络舆情的研究也受到了社会及各级政府的高度重视。从舆情的宏观动态中提取出一定的规律及性质,进而研究舆情的控制及引导方法已经成为网络舆情研究工作的重中之重。改造世界必须先认识世界。通过对网络舆情发生、发展、演化的过程中的变化规律的分析,得到控制危害社会安全的舆论以及引导网络正能量信息的方法,这也是促进社会稳定、维护社会和谐的重要方法。这些在线社会网络节点数量巨大,拓扑形态不同于规则网络和随机网络,而是具有小世界效应和无标度特性的复杂网络[12]。因此,研究舆论在复杂网络中的形成过程、传播规律及性质等,这对认识、预测和引导舆论事件的发生发展有着重要的理论意义和现实意义。1.3论文主要内容信息传播的主要表现形式主要有两种,一是舆情传播,另一个则为流行病或病毒在复杂网络上的传播。由于整个社会对流行病传播这一问题的持续重视,流行病传播理论的相关研究已经获得了巨大的成功。而在线网络上的舆情传播符合流行病传播的动力学行为。所以本文基于流行病学理论提出符合当今在线社会网络上舆情传播的模型。同时在线网络中用户少则几万,多则几千万上亿,网络规模的庞大以及关系的错综复杂,使用户行为特征复杂、价值取向迥异,每个用户都表现出不同的个性特征,并且行为学研[13]究已发现传播者的个人特征会影响信息传播行为。因此,基于流行病学建模的思想并将用户的个性特征引入网络传播研究中,对更好地认知传播行为有帮助。为了抑制有害信息的蔓延,营造良好的互联网舆论环境,本文根据用户的个性特征来刻画用户的舆情传播行为,提出一种新的基于流行病学的传播模型,并模拟在复杂网络上舆情的传播过程,从而了解舆情信息网络传播的形成过程和传播规律。本文的基本结构如下:第一章,简要介绍了本文的研究背景,分析了互联网时代的舆情传播与传统舆情传播的区别,以及网络舆情给社会带来的新挑战与问题;同时介绍了本课题的研究目的及意义。第二章,对本文所涉及到的相关领域知识进行的简要的介绍。分别对复杂网络、流行病学、agent建模等知识背景进行分析引入,随后对舆情传播的国内外研究现状进行介绍。第三章,说明了本文提出的舆情传播模型。首先对一些基本的流行病模型进行分析3 第1章绪论比较。然后基于agent建模方法,并结合在线网络舆情传播过程中用户表现出的有关特性,对本文模型中的agent属性进行分析、定义。最后根据当今在线网络舆情传播的特点,基于流行病理论提出了一种舆情传播模型。第四章,将本文提出的传播模型应用到复杂网络中,实现相应的仿真算法并进行相应的仿真实验。通过对仿真实验获得的数据进行整理和分析,获得舆情传播的基本规律及特性。并通过对实验中的可变参数进行实验分析,得到了可以对舆情传播规律造成影响的相关因素。第五章,总结与展望。本章对本论文的工作进行了简单地总结,并提出了一些尚需解决的问题,以及将来要继续进行的工作。4 第2章相关领域的研究概况第2章相关领域的研究概况2.1复杂网络在网络理论的研究中,如果网络结构具有节点数目庞大并且节点间的关系十分复杂等特点,该网络则为复杂网络。通常网络中的节点代表存在于该网络中的个体,而网络中节点相连接的边则代表个体间的相互作用。复杂网络不同于简单网络,是一个具有十分复杂的拓扑结构特征的图。现实生活中的互联网网络、人际关系网、交通网、神经网络、细胞网络、科学家合作网络等,都属于复杂网络。对复杂网络的研究始于对这些真实网络的分析整理,提出一些统计量对网络的结构特征进行量化。研究学者们发现许多真实网络具有一些共同的拓扑统计性质。这些性质与规则网络或随机网络的特性不同,[14]被各界学者广泛研究的主要是小世界效应和无标度特性。下面对这两种结构特征进行简要介绍。1.小世界效应1998年,nature上发表了D.J.Watts和S.H.Strogatz的一篇论文,文中提出了WS小世界网络模型(Watts-StrogatzSmall-WorldNetworkModel),描述从完全规则网络到[15]完全随机网络的转变。WS小世界模型是一个简单的表示小世界效应的模型。小世界效应(small-worldeffect)即网络中任意两点之间的距离相对于整个网络规模是较小的,网络特性表现为平均路径短和聚类系数大。正如麦克卢汉所说,地球逐渐变成了一个地球村。这也从侧面证实了真实网络中存在的小世界效应,使得地球变成了一个小世界。平均路径短即表示虽然网络规模很大,但是任意两点之间的距离却相对很小。20世纪60年代美国哈弗大学的社会心理学家StanleyMilgram通过一系列社会调查得出了六度分离(sixdegreesofseparation)推断[16]。这意味着平均只要通过五个人,你就可以和地球上任何一个角落的任何一个人产生[17]联系。而集聚程度,是指网络集团化的程度。小世界效应表现出了高的集聚程度。例如,社会人际关系网络中总是存在熟人圈或朋友圈,即你的朋友的朋友也是你的朋友,圈中成员之间都存在关联关系。在某种程度上也类似于“物以类聚,人以群分”的特性。WS小世界网络是对规则图中边进行随机化重连得到的。该规则图中包含围成一个环的N个节点,连接边则是建立在节点与左右各k/2个邻居节点之间。重连则是以概率p随机选择网络中的边进行重新连接。但是要保证不能自连接,且两节点间最多连接一[18]条边。生成过程如图2.1所示。5 第2章相关领域的研究概况图2.1WS小世界网络生成示意图2.无标度特性1999年,Barabási和Albert在Science上发表了一篇影响很大的论文,文章指出不同于规则网络中连接度按照δ函数分布以及随机网络中节点度的正态分布,许多实际的[19]复杂网络的节点度数分布具有幂律形式。度是指网络中节点所连接边的数量,有向网络中度又分为出度和入度两类。简单来看,节点度按照幂律分布说明网络中大多数节点的度数较小,度数越大的节点数量越少。但是网络中存在节点度数非常大的节点,这样节点度数没有明显的特征长度,无法使用同一个单位来度量不同节点的度,这类网络又被称为无标度(scale-free)网络或者无尺度网络。无标度网络宏观的特征就是存在一些中心节点,这些中心节点相对于其他节点具有非常高的度,度的大小也代表着这些节点在网络中的重要性。例如,我国的航空网络,北京、上海、广州等城市为主要交通枢纽,飞往全国各地的航线非常多,而一些偏远城市仅有几条航线或者没有航线。又如近年热门的社交网站微博,影视明星姚晨等的粉丝已经达到三千万之多,而一般的普通用户粉丝量大多以百计算。可见,在现实网络中存在非常明显的中心节点。无标度网络的构造原则是增长特性和优先连接。初始网络中存在N个节点,每一步向网络中添加新的点,对于每个新点,将添加m条边在该新点和初始点之间。而这m个原始节点被优先连接的原则为:(2.1)其中i为新加入的节点,j为原始节点。从公式可见这种选择方式会使富点变得更[20]富。也就是说,随着网络节点的加入,网络的中心节点的度呈现快速增长,同时该节点的重要性也会越来越明显。6 第2章相关领域的研究概况2.2流行病学流行病学是研究疾病分布规律及影响因素,借以探讨病因,阐明流行规律,制订预[21]防、控制和消灭疾病的对策和措施的科学。由于人类历史上曾经多次受到及其严重的流行病的威胁,因此如何获取流行病传播规律并进行疾病预测是人们自古以来不变的话题。最早使用的统计方法完全是根据总结的经验。而随着数学和物理成果的不断更新,统计方法也不断得到改进。然而,大家都不喜欢事后诸葛亮,而是希望研究机构能够对流行病做出预测,以采取相应的预防对策和应对措施。预测则是以演化模型作为依据,没有一个确定的演化法则的系统是徒劳的、不确定的。因此必须对特殊传染疾病在给定网络上进行传播建模,其目的在于重现传染病的真实动力学并研究出控制甚至根治疾病的方法。实际上,流行病传播是一个非常复杂的过程,不同情形会产生截然不同的结果。比如,有些疾病是有免疫能力的,人被感染一次之后将会终身免疫不会被二次感染,如腮腺炎、麻疹、水痘等;而还有一些疾病是没有免疫能力的,人可以被反复感染,如肺结核等。因此不同类型的流行病需要建立不同的模型进行具体描述。事实上,根据粗粒化的描述方式,人们已经建立了大量的模型来描述不同的流行病传播情形。其中按照能不能被反复感染划分,也是最有影响的两种典型模型是SIS(易感-感染-易感)模型和SIR[22](易感-感染-免疫)模型。在SIS模型中,人群被划分为两组:易感(susceptible)人群和染病人群(infected)。易感人群是人们处于为患病但是可以被感染的状态,或者是疾病已经被治愈但仍可以感[23-24]染;染病人群则可以将疾病传染给别人。所以说染病人群是流行病传播的源头,他们将疾病传染给易感人群,促使流行病在网络中传播。而SIR模型中,人群被划分为三[25-26]类:易感人群(susceptible)、染病人群(infected)和免疫人群(recovered)。免疫人群即被治愈后获得了免疫能力,不会再被传染该疾病,也就不再对相应的动力学行为产生任何影响。该模型下,感染人数会随着时间推移而逐步增加,而由于个体会对流行病产生免疫,所以接着感染人数因为免疫人群的增加而开始减少,直到网络中不存在染病人群,传染过程结束。SIS模型和SIR模型的区别就是二者的终态不同。除了这两个典型的模型外,还有一些其他的比较常用的流行病传播模型,如SI模型、SIRS模型等。2.3基于Agent建模与仿真目前,基于agent的建模和仿真方法(Agent-BasedModelingandSimulation,ABMS)7 第2章相关领域的研究概况被广泛应用于各个领域的复杂系统的研究,其中不乏社会领域、经济领域、生物领域以及工程领域,等等。现实世界中存在着各种形态的实体,我们将其中具有主动的行为能[27]力的实体抽象为agent。Agent可以在没有其它系统的直接干预下可以自助控制其行为和内部状态;agent能够感知所处的环境,并根据环境的变化做出相应的反应;同时agent可以与网络中的其他agent进行交互信息。ABMS是当前建模与仿真领域的研究热点。而社会系统中的“人”与ABMS中的Agent具有本质相似性。人同样具有自治性、反应性、主动性和社会性,所以人被抽象成具有自主决策、协调能力的agent。基于agent建模与仿真方法非常适合发现和研究人[28]类系统的自组织和涌现行为,所以一直在社会领域得到广泛应用。Agent是对复杂系统中的主动个体进行抽象整理得到的,同时也是模型中的基本组成单位。Agent具有不同的特性,并且根据内部感知器获取到的环境、其它agent信息以及自身状态和设定好的规则来修改自身的状态,并通过效应器对环境与其它agent实[29]施行为,达到agent交互的目的。通过这种感知--行为模型或更高级的智能模型,实现个体agent的功能行为建模。同时agent之间进行有效通信等交互行为,会导致系统涌现出整体的行为。所以这种建模仿真方法被广泛地应用于群体行为的研究。2.4舆情传播研究现状近些年,科研学者们将注意力集中于描述和理解社会网络系统中个体的集群行为产生的原因和发生、发展的过程,并进行了大量的研究工作。其中舆情传播就是重要的研究方向之一。[30][31][32]Sznajd,Deffuant和Hegselmann等人首先对复杂网络上的舆情传播进行了研究,他们选择的复杂网络模型主要是NW小世界模型和BA无标度网络模型。Sznajd模型的思想是社会网络中一个人的意见会受外部社会群体的影响,群体的规模越大则影响越大。也就是说想要说服一个人,两个或更多人的意见要比一个人更有效。而由于人的意见不总是绝对的是或否,很多人的意见介于两者之间。因此Deffuant和Hegselmann分别提出了不同的连续型意见模型。以上模型对个体间简单的相互作用进行明确定义,并通过这种个体之间微观作用的多次迭代进而研究系统中宏观的复杂行为。这些模型在建模过程中引入了物理学中的物质扩散、热传导模型或磁铁粒子交互模型。JuliánCandia中进行了大规模的蒙特卡洛(montecarlo)仿真,研究了BA无标度网络中不可逆转舆[33]情传播模型的动力学行为和临界行为。[34]信息和舆情传播建模的主要方法是基于病毒传播的传染病方法。网络传播的研究是从传染病的流行问题研究开始的,对人类产生了重大的影响,也为研究舆情扩散提[35]供了有益的思路。舆论传播的动力学行为服从流行病学中的SIR传播模型。这个问题8 第2章相关领域的研究概况首先由sudbury进行了研究,提出了一个随机网的SIR模型。得到舆论最多只能传递到80%的人群的结论。刘宗华研究了舆论在一般网络上的传播情形,发现随机网最易传播[36]舆论。最近提出了另外一种方法,阈值模型或复杂感染。该模型假定用户获知消息概[37]率符合关于用户已知消息邻居占总邻居数比例的sigmoid函数。研究学者提出并介绍[38]了一个传染函数和一个连接强度函数(CSF),用以研究程度偏置传输速率和非线性传染性对复杂社会网络中舆情传播的影响。在社会学理论中,意见传播过程中存在关键[39]人物,也就是意见领袖。这些关键节点(Hubnodes)对舆论的传播起着非常重要的作用。也有学者将意见领袖视为一种特殊agent进行建模,并研究其在舆情传播中的特[40-41]性。IgorKanovsky提出了一个新模型,该模型假设获得消息的概率是关于接触到[42]的影响者数目的函数,称为“0-1-2”作用。在线社会网络具有一人发表信息,所有好友都会获得该消息的特性,使得信息传播更快;在线网络中用户少则几万,多则几千万上亿,网络规模的庞大以及关系的错综复杂,使用户行为特征复杂、价值取向迥异,并且行为学研究已发现传播者的个人特征会[13]影响信息传播行为。因此,基于流行病学建模的思想并将用户的个性特征引入网络传播研究中,对更好地认知传播行为有帮助。本文根据用户的个性特征来刻画用户的舆情传播行为,提出一种新的基于流行病学的传播模型,并模拟在复杂网络上舆情的传播过程,从而了解舆情信息网络传播的形成过程和传播规律,进而预测和引导舆论事件的发生发展,防治网络恶意舆论和网络暴力的产生,建设和谐良好的网络舆论环境。9 第3章舆情传播的建模研究第3章舆情传播的建模研究3.1一些流行病模型网络上的信息传播的直接表现形式为舆论传播,与病毒或传染流行病在各种复杂网[43-44]络上的传播比较接近。传染病模型的人群划分的理念被广泛的应用。对于不同的传染病传播情形,人们已经建立了大量的模型来描述。其中,按照能不能被反复感染来划分的两种典型的模型分别为SIS(易感-感染-易感)模型与SIR(易感-感染-免疫)模型。3.1.1SIS模型SIS模型将人群划分为两类:易感人群(S)和染病人群(I)。疾病传染源即染病人群与易感者接触后,使其以一定的概率λ成为感染者;感染人群本身也以一定的概率μ可以被治愈,被治愈的个体对该病毒仍然是易感染的;易感人群一旦被感染,就又称[45-47]为了新的感染源。由于存在二次感染的情况,所以SIS模型的终态为稳定态,如振荡态或不动点,感染机制可以用下式表示:(3.1)(3.2)s(t),i(t)分别表示群体中的个体在时刻t处于S态和I态的密度。以下微分方程组描述了SIS模型在易感人群和染病人群充分混合时的动力学行为。(3.3)(3.4)在方程组中存在一个阈值ρ,当λ<ρ,其定态解为i(T)=0。而当λ>ρ,定态解为i(T)>0。T为达到稳定状态的时间。SIS模型的状态转换图如图3.1。10 第3章舆情传播的建模研究图3.1SIS模型的状态转换图3.1.2SIR模型SIR模型将人群划分为三类:易感人群(S),染病人群(I)和免疫人群(R)。SIR模型适合于描述染病者在治愈后不会再被二次感染的疾病,如腮腺炎、百日咳、水痘等,或者是那些几乎不可避免走向死亡的疾病,如艾滋病等。与SIS模型不同的是,染病人群治愈后并非再次成为易感人群,而是以概率μ成为免疫人群。人们一旦进入免疫状态,则不会再被感染。所以免疫人群的个体不会再对病毒的传播起任何作用。SIR[48-49]模型的终态为无感染态,低于临界阈值时总感染人数的密度为零。其动力学方程如下:(3.5)(3.6)s(t),i(t),r(t)分别表示群体中的个体在时刻t处于S态、I态和R态的密度。以下微分方程组描述了SIR模型在易感人群和染病人群充分混合时的动力学行为。(3.7)(3.8)(3-9)SIR模型存在一个阈值ρ,当λ<ρ时流行病将无法扩散出去,而当λ>ρ时流行病爆发并成为全局性感染状态。SIR模型的状态转换图如图3.2。图3.2SIR模型的状态转换图11 第3章舆情传播的建模研究3.2Agent建模[50]基于Agent的建模与仿真是一种自下而上的建模方法。该方法对Agent个体及其相互之间(包括与环境)的简单行为进行定义并进行建模仿真,通过对agent的交互动作的长时间观察研究来发现复杂系统的宏观行为。这正符合网络中个体之间消息不断传递而产生舆情的状况,所以ABMS非常适用于对舆情的建模。因此对于本文所研究的复杂网络中舆情传播问题,agent则为复杂网络中的节点。根据对真实的舆情传播情况的分析,定义agent的特性。而建模的重点则是对agent间舆情演化的规则即上述个体agent的交互行为的制定,最后根据所建模型进行仿真实验,通过实验结果进一步研究舆情传播的规律。Agent是在线网路中的每个用户,因此他们都有不同的个性,本文从影响力、好奇度、信息传播能力、遗忘周期(暂时性遗忘和永久性遗忘)等对舆情演化最相关的几个特性对agent进行分析。影响力[51]从传播学基础理论可知,现实生活存在意见领袖的现象。在线社会网络中,有一些用户建立了一定的声誉,其被关注度比较高,所以的他的意见也会被更多的人看到,影响范围更广,同时作为意见领袖他的意见也能够对他人产生更大程度的影响。由于度较大的节点意味着该节点与比较多的节点相连接,这样该节点发布的信息便会被更多的人获取,所以本文将影响力定义为节点agent的度的大小。好奇度现实社会中,受个体性格、身份背景、文化程度、心理因素等影响,人们对信息的掌握、理解、认可、分析程度也有所不同,所以个体对新奇事物的好奇程度是不同的。一些人对消息的分析不够,对大多数消息不进行筛选就相信并转发传播;也存在一些人则对消息进行自己的判断,只有消息足够新奇才会接受并关注。信息传播能力信息传播能力即agent认可一则消息并对该消息进行持续传播的能力。由于互联网用户十分庞大,所以不同用户关注的事物不同、在线使用网络的时间不同、用户价值取向及好奇持久性也不同,导致每个人对消息关注时间及在线传播能力也不同。遗忘周期遗忘是对曾经记过的信息无法回忆起来,或者回忆起的是错误信息。而遗忘又可以分为暂时性遗忘和永久性遗忘:暂时性遗忘是指对曾经已知信息的遗忘是暂时的,在适宜条件下还可能恢复记忆;而永久性遗忘则是指个体对曾经已知信息的遗忘是永久的,[52]如果不重新学习该信息就不可能恢复记忆。本文认为网络舆情传播过程中,agent对消息失去兴趣时便进入了暂时性遗忘,在此期间如果周围有足够的刺激(看到一定数目12 第3章舆情传播的建模研究的好友传播此消息)就会唤醒其记忆,重新进入暂时性遗忘阶段,但是期间仍然不进行消息的传播。当完成暂时性遗忘,则进入永久性遗忘阶段。这一阶段不会受外界影响,对该消息不感兴趣且不予传播。只有完成该周期,才可以像没接触过该消息的agent的一样重新认识该消息。在线社会网络与现实生活的关系网一样,每个人的个性都不相同,并可能按照某种规律分布。所以本文对以上几种用户特征分别按照下面几种分布方式进行研究,并研究这几种用户特征分布方式对舆情传播规律的影响。均匀分布:(3.10)泊松分布:(3.11)正态分布:(3.12)对数正态分布:(3.13)3.3本文的传播模型在现实生活中,存在这样一种流行病,在患病中期具有传染能力,而在患病末期经过自身的治疗和修复则不会再传染给他人,并且疾病治愈完成免疫期后个体仍然会被二次感染,如病毒感冒等。本文借鉴传染病模型的人群划分的理念,提出了符合上述情况的SICRS模型(易感-感染-治疗-免疫-易感)。SICRS模型综合了SIS模型和SIR模型的同时,加入染病个体从感染状态(infectious)到治愈状态(recovered)的一个过渡状态,即治疗状态(cured)。在这种状态下,个体进行自我治疗,虽然携带病毒,但失去传播病毒的能力。模型中易感人群染病后进入感染状态,而处于感染状态的个体以概率λ进入治疗状态,此时还没有完全治愈,也不能再传染其他个体;在治疗状态的个体以概率μ进入完全治愈的免疫状态;而治愈的个体又会以概率σ变成会被再次感染的易感人群。将该流行病传播模型应用到舆情传播问题中,对这四种状态的个体进行如下定义:S(susceptible):未知状态,网络中不知道或者不相信该消息的个体;I(infectious):传播状态,知道该消息并进行传播的个体;C(cured):暂时遗忘状态,开始淡忘该消息并失去传播意图的个体;R(recovered):永久遗忘状态,对消息完全失去兴趣的个体。13 第3章舆情传播的建模研究对SICRS传播模型中的相关参数进行定义如下:新奇度p:每条消息都带有一定的新奇度。新奇度比较大的消息比较容易得到公众的关注,引起大家的兴趣;而新奇度较小的消息则容易被大家忽略。接受值pa:网络中个体接受或相信一则新闻或消息的临界点,我们称之为接受值。当达到接受值时,该个体相信此消息并进行传播。暂时遗忘率λ:个体处于传播状态时,会以概率λ进入暂时遗忘状态。永久遗忘率μ:个体处于暂时遗忘状态时,会以概率μ进入永久遗忘状态。恢复率σ:个体处于永久遗忘状态时,会以概率σ恢复为未知状态。该模型中agent间的交互行为以及agent状态演化规则如下:由于在线社交网络中,一个人发出的消息,与自己有关的人(存在连边)都能够看到,同时一个人也可以看到所有好友发出的消息。所以在每一个时刻t,处于未知状态S下的agenti检查与其相连的所有agent,对处于传播状态I的agent进行计数n,则agentI得到了一个正的受消息的影响度。假设agenti本次进入S状态时间为。(3.14)其中是与本次处于S状态时间相关的函数,即对agent而言,消息的每次传播都使其新奇度(或能量)有不同程度的下降。每个个体都保留着过去时期内所获得的总的消息影响度。(3.15)当时,即该消息对agenti的影响力已经达到其对新奇消息的接受值时,对不知道该消息的agenti开始相信并传播该消息。处于I状态的agent会对消息进行传播,并以暂时遗忘率λ进入C状态。当agenti进入C状态时,如果i周围的处于状态I的邻居agent数(M为既定参数),则维持在此状态。否则会以概率进入永久性遗忘状态R。这表示当周围还有一些人提起该消息,会影响他对此消息的遗忘过程。当agent进入R状态后,表示其对该消息彻底遗忘,更不会传播该消息。而处于R状态的agent,仍然可以以恢复率σ重新进入状态S,恢复为对该消息的未知状态。这表示重新开始了一次对该消息的接受和传播过程。因此,消息在网络中的不断传播导致了网络中agent的状态变化。也可以说,SICRS传播模型通过网络中个体的状态变化,反映出消息在网络中的传播情况。处于I状态的群体即消息传播到的人群。SICRS传播模型的状态转换图如图3.3.14 第3章舆情传播的建模研究图3.3SICRS传播模型的状态转换图15 第4章仿真算法及实现第4章仿真算法及实现4.1无标度网络模型交通网、神经网、科学家合作网、人际关系网等这些存在于现实生活中的系统都可[53]以通过网络来描述,而本文所研究的网络舆情传播的载体就是在线社会网络。而复杂网络中的BA无标度网络与现实在线社会网络的拓扑结构较为接近,所以本文首先采用无标度网络作为舆情研究的网络模型。网络中的agent节点代表用户,网络中的边连接建立了好友关系的用户。在该网络中,当朋友关系区分为单方关注和互相关注时,可以作为有向网络。而在本文的研究课题中网络的方向性并不重要,所以本文构造的无标度网络为无向无权的网络。在舆情传播过程中,复杂网络也不断发生着变化,如用户的注册及注销、好友关系的建立和解除等,由于网络舆情传播时间相对较短,所以暂时不考虑网络的演化,认为网络在舆情传播过程中保持不变。本文采用的BA无标度网络生成方式如下:初始网络中存在10个节点,每一步向网络中加入新节点并与网络中的5个节点相连,网络构建程序运行19990步。生成网络的具体参数如表4.1。表4.1本文所用无标度网络相关参数网络参数值网络平均度10节点数20000边数100,000网络的具体度分布如图4.1,有图可见本文所生成的无标度网络的度分布符合幂律分布。16 第4章仿真算法及实现图4.1本文所用无标度网络的度分布4.2仿真算法由于选择的复杂网络的数据量很大,其中每个节点都是一个agent,根据舆情传播的过程及SICRS模型的特征,设计了三个类以满足本论文的舆情传播仿真要求。网络类CNet定义了复杂网络的真实结构,包括网络中的人,人与人之间的关系以及网络中的消息及相关的操作。消息类CInformation定义了要在网络中进行传播的消息。消息带有一定的新奇度m_power。Cperson类定义了网络中人的信息。每个人都定义的未知状态S,传播状态I,暂时遗忘状态C,永久遗忘状态R的相关参数,以及各个状态之间进行转换控制的函数。具体算法设计如下:Step1:对网络进行初始化,对网络中每一个agent的不同个性参数按照3段方程组中相应的分布公式进行设置。Step2:对消息进行初始化,将消息的信息新奇度属性赋初值。Step3:确定消息传播源。随机选择网络中的一个节点,将其状态属性设为I传播状态。Step4:更新网络中所有agent的状态。遍历所有agent进行如下操作:检查当前agenti所处状态,并进入相应的处理程序。如果i处于未知状态,即i.status=S,则按照上面公式计算消息的累积影响度Di,17 第4章仿真算法及实现当累积影响度达到该agent的接受值时,即Di>i.pa,则进入I状态,否则状态不变。如果i处于传播状态,即i.status=I,则以暂时遗忘率λ为概率进入C状态。如果i处于暂时遗忘状态,即i.status=C,则检查该agent的好友(存在邻居关系的agent)中处于I状态的人数m,如果m>M,将永久遗忘概率暂时清零,否则以设定的永久遗忘概率μ为概率进入永久遗忘状态R。如果i处于永久遗忘状态,即i.status=R,则以恢复率σ为概率重新进入未知状态S。Step5:统计处于各种状态的agent数量,写入输出文件。Step6:如果遍历网络节点的执行次数number10,图中的曲线基本符合幂律分布,即随着agent度的增大,agent完成的SICRS传播周期迅速的减少;并且存在一些度非常大的agent没有完成一个完整的周期,cycles<1,即存在一些点为不振点。实验数据显示,这些不振点大多数停留在暂时遗忘状态,少部分停留在永久遗忘状态。我们认为舆情传播过程中,度平均下的agent传播周期数的分布与网络的度分布可能有关。5.3影响因子分析5.3.1网络密度相同类型的不同网络可能具有不同的稀疏程度。例如在繁华的都市的人际关系网络比偏远地区相同人数的人际关系网络更加复杂,密度也会更大。而在一个网络的不同时期的密度也不尽相同。例如某sns网站中的社会网络已经形成的初期的网络密度较小,而虽然网络人数已经稳定,随着时间的推移,人与人之间关系的不断建立,网络密度会变大。所以为了研究网路密度对舆情传播的影响,本文对不同密度的网络进行试验。由于上述实验采用的无标度网络为每步加入5条边而生成的,所以分别针对生成无标度网络时,每步加入3条边和每步加入7条边的网络进行试验,其密度记为3θ,7θ。实验结果如图5.8。(a)网络密度为3θ29 第5章仿真结果及分析(b)网络密度为5θ(c)网络密度为7θ图5.8不同网络密度进行仿真的实验结果从图5.8中可以看到不同密度的网络中舆情传播同样也遵循着传播初期舆情爆发、中期范围波动递减和后期动态稳定的规律。但是网络规模相同,密度越大的网络平稳前波动峰值降低的越缓慢,稳定的越晚,即网络中期持续的时间较长。本文认为当表示不同状态agent数的曲线振幅小于2%时,网络状态为稳定状态。通过对数据统计比较,得到表5.3:30 第5章仿真结果及分析表5.3不同密度网络仿真实验结果对比稳定值密度稳定前步数经历周期数S态I态C态R态4204315589243498444359061954853153064227895101400794367983880表中显示了在不同网络密度下,网络达到动态稳定前所经历的步数和波动周期数。以及各个曲线的稳定值,即网络中四种状态曲线波动振幅均小于2%后,四种状态下agent数的平均值。表中的统计数据也验证了随着网络密度的增大,网络进入稳定状态需要的步骤也增多,经历的振荡次数也增多;处于未知状态S的稳定值随之减小;相反处于暂时遗忘状态C的稳定值随之增大。这说明网络的密度越大,舆情传播过程中不知道该消息的人就越少,即传播到的用户更多,所产生的影响范围更大,持续时间更长。同时网络密度越大,导致网络中agent的度整体变大,而agent的周围邻居的状态会影响其暂时性遗忘的进程,也就是说周围邻居越多,该agent继续处于暂时性遗忘状态而非进入永久性遗忘状态的概率越大,使得最终处于暂时性遗忘状态的agent人数变大。5.3.2用户传播能力分布本文中暂时遗忘率即从传播状态进入暂时遗忘状态的概率,即用户对此消息停止传播,故与用户对消息的持续传播时间成反比。文中暂时遗忘率λ符合对数正态分布,所以用户传播时间也按对数正态分布。为了研究用户传播时间分布对网络舆情传播规律的影响,我们对用户传播时间的分布函数进行修改,原实验中的方差σ=0.5下面分别对σ=0.75,σ=0.3进行试验,我们得到图5.9。31 第5章仿真结果及分析(a)方差σ=0.75(b)方差σ=0.532 第5章仿真结果及分析(c)方差σ=0.3图5.9网络中节点的传播时间按不同方差分布的实验结果从图5.9可以清晰地看出,对数正态分布函数中的σ越小,稳定前振荡次数越多,传播中期持续的时间越长。为了进一步具体分析,在表中加入了信息爆发值及爆发时间等数据的考察,即处于传播状态I的用户第一次达到的最大值以及达到该值的步数。表5.4不同传播时间分布的仿真数据对比稳定值稳定前步数经历周期数信息爆发值/stepS态I态C态R态0.75255219971/2218988449555041230.5590619998/2219548531530642260.318032119926/221944860851954272从表5.4中统计数据可以看到,随着σ减小网络达到稳定前所经历的步数和振荡次数大幅度增加。但是在网络爆发的时间却相同,而且爆发时I状态的人数也几乎相同。在网络稳定时,各个状态的稳定值相差都非常小。从对数正态分布函数的特性可知,随着方差σ的减小,网络中持久传播能力越强的人数越多,这使舆论在网络中影响时间越长,影响范围缩小的也越慢。同时具有持久传播能力的人数分布不影响网络信息的第一次爆发的时间及传播到的用户范围;且在网络舆情传播的后期,网络各状态稳定值也几乎不受其影响。5.3.3用户好奇度分布为了研究用户的好奇度分布对网络舆情传播的影响,我们分别对好奇度按照均匀分33 第5章仿真结果及分析布、泊松分布及正态分布三种情况进行试验,并与本文所使用的用户好奇度常数分布进行对比,得到下表。表中考察内容增加了在网络信息爆发后,各曲线产生周期性波动的第一波峰值及第二波峰值。表中实验数据进行统计,发现按照不同用户好奇度分布下,舆情传播达到稳定状态前的步数差非常小,且经历了相同的舆情传播周期数;agent数目几乎同一时间达到第一峰值和第二峰值,且峰值差相对于峰值来说微乎其微;同时在舆情传播后期,不同好奇度分布下的agent数稳定值几乎相等。也就是说网络传播的初期、中期和后期的特征值都没有明显变化。从这几方面的数据可见网络舆情传播规律不受用户好奇度的分布影响,与用户好奇度分布方式无关。表5.6不同用户好奇度仿真实验结果对比第一峰值分布方式稳定前步数经历周期数S态I态C态R态常数590657781428592969178均匀587654341382893669290泊松563652431377593698712正态583651441380093748833第二峰值稳定值S态I态C态R态S态I态C态R态常数420112163706872521954853153064226均匀398911693710368961952852953274212泊松400511465710668831963852553324226正态3915118587018680319848535533042075.4消息源为小度节点的仿真分析随机选择节点做为消息传播的源头,度数为18。进行舆情传播仿真实验,结果如图5.10所示。由图可见处于S未知状态的人数一直居高不下。但是可以看到在实验进行初期曲线有微小的波动,之后便呈现直线,即值保持不变。由于S态人数相对于I传播状态、C暂时遗忘状态和R永久遗忘状态的人数非常大,并不是一个数量级别,所以在此图中很难发现这三种状态的曲线变化。因此将该图中曲线的起始到数据停止变化的时间段截取出来,并进行放大得到图5.11。图中可见处于未知状态的人数有个迅速减小的趋势,保持该人数值一段时间后缓慢上升,恢复为最大值即网络中总人数。相应的I状态曲线首先有个急剧上升,达到峰值一段时间后开始下降,接下来C状态曲线和R状态34 第5章仿真结果及分析曲线随之相继上升,当C曲线和R曲线达到最大值后开始波动下降。最后I态曲线、C态曲线和R态曲线停止波动并保持值为0。从图中各条曲线所呈现出来的特征,可以看出如果信息从度数较小的点开始进行传播,信息会在小范围人群中传播开,并产生一定的影响。由于个体存在遗忘周期,并经过一段时间重新回到未知状态,所以消息经过小范围的传播后会逐渐消失,同时人群状态均为未知状态。图5.10信息源节点度为18的一种仿真实验结果(a)S状态的变化情况35 第5章仿真结果及分析(b)I、C、R状态的变化情况图5.11仿真实验结果中各个状态的变化情况为了能够更加清晰地观察网络中节点状态变化,对以上情况进行了网络可视化仿真实验。对实验结果中的不同时刻进行截图得到图5.12。(a)截图一36 第5章仿真结果及分析(b)截图二(c)截图三37 第5章仿真结果及分析(d)截图四图5.12可视化网络仿真实验截图从截图a为网络的最初始状态。网络中存在一个信息源节点,且该节点度数较小(在可视化网络外围)。截图b显示网络中知道消息并传播的人数(红色)在短时间内有小范围猛增并几乎达到消息影响范围最大值。而随后在该影响范围内不同状态节点相继出现,传播状态(红色)、暂时遗忘状态(绿色)和永久遗忘状态(紫色)的人数几乎持平。而一段时间后这三种状态人数都不同程度减少,最后网络平静。如截图d所示,网络中只存在蓝色节点,即消息在网络中消失,所有节点都对该消息未知。通过对可视化网络反映出的信息进行分析,直观的验证了图5.11中的实验数据结果,即以度数较小的节点作为信息传播源时,舆情传播会出现以下现象:消息在网络的小范围内进行快速传播并且消息会逐渐消失,最后网络中个体彻底不知道该消息。当随机选择网络中度数为5的节点作为信息传播的起始点进行仿真实验时,得到如图5.13所示的实验结果。图中显示在实验过程中网络中各个状态节点数目几乎一直保持不变。而通过实验数据可以发现,网络中的信息源节点没有将信息传播出去,只是该节点自己经历I传播状态、C暂时遗忘状态、R永久遗忘状态,最后返回到S未知状态的过程,所以整个网络中各状态的数值在最开始只有值为1的极微小变化,而使图5.13中曲线宏观上呈直线形态。由此可见该消息在网络中没有扩散,即直到信息传播源节点彻底遗忘该信息而回归到未知状态,也没有其他agent节点知道该消息。38 第5章仿真结果及分析图5.13信息源节点度为5的一种仿真实验结果5.5其他网络的仿真实验针对舆情在BA无标度网络中传播的情况进行以上仿真实验,并获得了相关的舆情传播规律。而为了验证这些传播规律是否符合其他拓扑结构的网络,本文又对随机网络和WS小世界网络进行了相关的仿真实验。5.5.1ER随机网络仿真实验ER随机网络是将N个孤立的网络节点,依次按照概率p将每一对节点连边而产生[18]的,本文所采用的ER随机网络具体的相关参数表如表5.7所示:表5.7本文所用ER随机网络相关参数网络参数值网络平均度10节点数20000边数200,000连接概率p0.439 第5章仿真结果及分析该ER随机网络的度分布如图5.14,可以看见该网络的度分布符合泊松分布。图5.14本文采用的ER随机网络的度分布在本仿真试验中,具体仿真参数的值如表5.8所示。表5.8基于ER随机网络传播实验的仿真参数仿真参数值消息的新奇度(p)3.0个体agent的好奇度(pa)15暂时遗忘率的分布(λ)见公式3.13,其中方差为0.6永久遗忘率(μ)4恢复率(σ)15信息源agent的度13运行步数1500对信息在ER随机网络传播进行仿真实验,得到实验结果如图5.15。图中黑色曲线代表处于对消息未知状态S的人数在程序运行过程中的变化;红色曲线代表网络中处于传播状态I的人数变化;蓝色曲线代表网络中处于暂时遗忘状态C的人数变化情况;而绿色曲线则代表处于永久遗忘状态的人数变化。从图中可以看到在step较小时各条曲线都有大浮动的变化,随后均呈现周期性递减的趋势,并且曲线的波动中心值几乎不变。40 第5章仿真结果及分析最后各条曲线达到动态稳定,以微小幅度维持在恒定值。实验结果表明舆情在ER随机网络中进行传播同样符合传播初期舆情爆发、传播中期消息影响范围呈现周期性波动递减、传播后期舆情在网络中呈现动态稳定等规律。图5.15基于ER随机网络传播的实验仿真结果5.5.2WS小世界网络仿真实验从规则网络开始,以概率p进行随机化重连每条边,保证没有自连接和重复边即可[18]获得WS小世界网络。而本文所采用的WS小世界网络的具体的相关参数表如表5.9所示:表5.9本文所用WS小世界网络相关参数网络参数值网络平均度10.1节点数20000边数202000重连概率p0.6在本仿真试验中,具体仿真参数的值如表5.10所示。41 第5章仿真结果及分析表5.10实验的仿真参数仿真参数值消息的新奇度(p)3.0个体agent的好奇度(pa)8暂时遗忘率的分布(λ)见公式3.13,其中方差为0.4永久遗忘率(μ)5恢复率(σ)10信息源agent的度11运行步数1500对信息在WS小世界网络传播进行仿真实验,得到实验结果如图5.16。图中曲线表明舆情在WS小世界网络中进行传播呈现于BA无标度网络及ER随机网络相同的传播规律,即传播过程分为三个阶段:传播初期存在舆情爆发现象,消息影响范围迅速扩大;在传播中期消息影响范围周期性波动递减;在传播后期各个状态的人数在网络中呈现动态稳定,消息也的影响范围也呈现动态稳定现象。图5.16基于WS小世界网络传播的实验仿真结果通过对ER随机网络和WS小世界网络进行舆情传播的实验,可以发现本文得到的舆情传播三阶段规律同样适用,再次验证了该规律的可靠性。虽然不同网络实验得到的42 第5章仿真结果及分析稳定值有所差异,但是曲线的波动趋势却大致相同。可见网络的拓扑结构对本文所发现的舆情传播规律没有明显影响。而由于真实在线社会网络在具有无标度特性的同时,也具有一定的随机性和小世界特性,所以以上实验增大了本文发现的舆情传播三阶段规律也存在于真实在线社会网络的可能性,对以后的研究工作有很大的理论意义。43 第6章论文总结及展望第6章论文总结与展望6.1本文总结本文针对当今在线网络中舆情传播的特体,基于流行病模型提出了一种符合在线网络舆情传播的舆情传播模型,SICRS模型。由于在线社会网络并非规则网络和随即网络,而是一种复杂网络,所以本文的研究网络模型设定为最接近真实网络的无标度网络。考虑到网络中每个个体都各具个性,并且是可以根据周围情况来更改自己状态的智能体,所以本文基于agent进行建模与仿真。并着重考虑了网络中agent的影响力、好奇度、传播能力及遗忘周期等特性。考虑了网络中的节点agent的类型、特性、关系,并根据SICRS模型为agent设定演化规则。SICRS模型应用了流行病建模中常用的人群划分的概念,根据在线舆情传播特征将最典型的两个流行病模型SIS和SIR模型加以结合,并加入了一个中间状态C(治疗状态)。对应到传播模型中,SICR各个状态对应的意义则为对消息的未知状态S、传播状态I、暂时遗忘状态C和永久遗忘状态R。网络中个体以一定概率经历着未知-传播-暂时遗忘-永久遗忘-未知这样的状态循环,个体的状态变化反映出了信息在网络中的传播过程。因此,对该模型进行实现及仿真,通过实验数据分析网络中的舆情传播的规律及特征。而该模型只能输出宏观的各个状态人数值等数据,并不能观察到网络中agent具体的微观变化,所以同时对具有代表性的网络进行了可视化。可视化的网络使网络特征更加明显,并通过颜色来反映各个节点的状态,这样节点状态变化情况也更加直观。可视化网络对发现网络舆情传播的规律和特性起到了非常大的辅助作用。通过对实验结果的分析统计得到如下结论:1.无标度网络中舆情传播过程呈现三阶段规律:传播初期存在舆情爆发现象;传播中期消息影响范围呈现周期性波动递减;在传播后期舆情在网络中呈现动态稳定。2.传播后期宏观上各个状态的节点数不变,而微观上网络中一些节点的状态存在周期性变化。当节点度较小时,节点经历周期数基本符合幂律分布。度较大时,节点经历周期数迅速减少。3.网络舆情传播规律存在相关影响因子:网络的密度越大,消息在网络中持续时间越长,影响范围越大;用户传播时间的分布主要影响舆情传播中期,舆论在网络中持续时间越长、影响范围缩小的越慢,但是不影响传播初期的信息爆发及传播后期各个状态的稳定值;用户好奇度的分布对舆情传播影响很小。4.以度数较小的节点作为信息传播源时会产生两种情况:一种情况为消息一直无法在网络中扩散;另一种情形为舆情会在网络中小范围传播,经过一段时间后影响范围逐44 第6章论文总结及展望渐缩小并彻底消失。5.网络的不同拓扑结构对以上舆情传播规律没有明显影响。本文根据SICRS模型进行仿真实验得到的结果进行分析,得到了复杂网络中舆情传播过程的规律以及相关的影响因子,这对深入了解舆情传播以及研究引导和控制舆情方法具有一定的理论意义和现实意义。6.2展望本文采用的网络模型主要为BA无标度网络,而真实的在线社会网络要比无标度网络更加复杂。因此在下一步的工作中,我们将对真实的在线社会网络进行建模,并研究该网络模型上舆情传播规律,这样在提升网络模型模拟真实社会的准确性的同时,也可以获得更加符合真实在线网络的舆情传播规律,对制定更加有效的舆情控制方案有着十分重要的意义。由于本文中只有一条信息在网络中传播,而没有考虑多条相关信息在网络中传播的情况。所以对多条相关舆论信息(尤其是相互促进或相互抑制的信息)同时在网络中传播的规律研究,也是今后工作的重点。在线舆情传播研究的重中之重也是本文的研究宗旨,则是根据舆情在网络中的传播规律,研究出控制或引导舆论传播的方法。所以这将是舆情传播问题研究的最终目标。45 参考文献参考文献[1]姜胜洪.网络舆情热点的形成与发展、现状及舆论引导[J].理论月刊,2008,4:4-36[2]童亚拉.突发群体性事件网络舆情信息传播复杂网络预测模型分析[J].研究与设计,2011,27:28-39[3]陈旭.基于社会网络的WEB舆情系统的研究与实现[D].成都,电子科技大学,2010.[4]胡海波,王科,徐玲,汪小帆.基于复杂网络理论的在线社会网络分析[J].复杂系统与复杂性科学.2008.6.[5]邱航明,孙文俊,白钰.不同博客圈结构对比及其成因研究[J].现代情报.2008.6:40-43[6]PetersonW,GistN.Rumorandpublicopinion[J].AmericanJournalofSociology,1951,57(2):159-167.[7]张芳,司光亚,罗批.谣言传播模型研究综述[J].复杂系统与复杂性科学,2009(4).[8]刘建明.舆论传播[M].北京:清华人学出版社,2000.[9]FuF,LiuLH,WangL.EmpiricalAnalysisofOnlineSocialNetworksintheAgeofWeb2.0[J].PhysicaA,2008(387):675-684[10]潘新,基于复杂网络的舆情传播模型研究[D].大连,大连理工大学,2010.[11]田枫,彭学涛.突发公共事件中网络舆情危机的治理[J].吉林人大.2010年第05期[12]D.Centola.Thespreadofbehaviorinanonlinesocialnetworkexperiment[J].Science,329(5996):1194-1197,3September2010.[13]魏婧,刘业政,邢小云.在线社会化网络的口碑传播研究[J].情报杂志,2011.4:34-38[14]Yong-YeolAhn,SeungyeopHan,HaewoonKwak,SueMoon,HawoongJeong,Analysisoftopologicalcharacteristicsofhugeonlinesocialnetworkingservices[J],Proceedingsofthe16thinternationalconferenceonWorldWideWeb,May08-12,2007,Banff,Alberta,Canada[15]WattsDJ,StrogatzSH.Collectivedynamicsof"small-world"networks[J].Nature,1998,393(June):440-442.[16]MilgramS.Thesmallworldproblem[J].PsychologyTody,1967,2:60-67.[17]AlbertR,BarabásiA-L.Statisticalmechanicsofcomplexnetwork[J].ReviewofModernPhysics,2002,74(Jan.):47-97.[18]汪小帆,李翔,陈关荣.复杂网络理论及其应用[M].北京:清华大学出版社,2006:14-15[19]BarabasiAL,AlbertR.Emergenceofscalinginrandomnetworks[J].Science,1999,286(Oct.):509-512.[20]刘涛,陈忠,陈晓荣.复杂网络理论及其应用研究概述[J].系统工程,2005,23(6).[21]耿贯一.流行病学[M].北京:人民卫生出版社.1996∶979-1001[22]V.M.EguiluzandK.Klemm,EpidemicThresholdinStructuredScale-FreeNetworks[J].Phys.Rev.Lett.,89(2002)108701.[23]Z.LiuandB.Hu,Epidemicspreadingincommunitynetworks[J].Europhys.Lett.,72(2005)31546 参考文献[24]K.Li,M.Small,H.Zhang,X.Fu.Epidemicoutbreaksonnetworkswitheffectivecontacts,NonlinearAnal[J].RealWorldAppl.,11(2010),pp.1017–1025.[25]M.E.J.Newman,Spreadofepidemicdiseaseonnetworks[J].Phs.Rev.E,66(2002)016128.[26]D.J.Daley,J.Gani.EpidemicModelling[M].CambridgeUniversityPress,Cambridge,UK(2000)[27]Bandini,S.,Manzoni,S.,Vizzari,G.:AgentBasedModelingandSimulation[J].In:EncyclopediaofComplexityandSystemsScience2009,pp.184–197(2009)[28]MacalCM,NorthMJ.Agent-basedmodelingandsimulation:DesktopABMS[J].In:HendersonSGetal(eds).Proceedingsofthe2007WinterSimulationConference.IEEEPress:WashingtonDC,2007.9–12December,pp95–106.[29]Bonabeau,E.2002.Agent-basedmodeling:Methodsandtechniquesforsimulatinghumansystems[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmericano.2002.99(Suppl3):7280.[30]SZNAJDWK,SZNAJDJ.Opinionevolutioninclosedcommunity[J].InternationalJournalofModernPhysicsC,2000,11(6):1157-1165.[31]DEFFUANTG,etal.Mixingbeliefsamonginteractingagents,adv[J].ComplexSyst.,2000(3):87-98.[32]HEGSELMANNR,etal.Opiniondynamicsandboundedconfidencemodels,analysisandsimulation[J].JournalofArtificialSocietiesandSocialSimulation,2002,5(3):162-171.[33]JuliánCandia,Irreversibleopinionspreadingonscale-freenetworks[J].Phys.Rev.E75,026110(2007).[34]KitsakM,GallosLK,HavlinS,LiljerosF,MuchnikL,etal.Identificationofinfluentialspreadersincomplexnetworks[J].NaturePhysics,6(11),888-893(2010).[35]D.J.Daley,D.G.Kendall.epidemicsandrumors[J].Nature,12(1964).Vol204,pp:1118.[36]A.J.Sudbury,Theproportionofthepopulationneverhearingarumour[J].Appl.Prob.22(1985)443.[37]J.Zhou,Z.LiuandB.Li,Influenceofnetworkstructureonrumorpropagation[J].Phys.Lett.A,368(2007)458.[38]Centola,D.,&Macy,M..Complexcontagionsandtheweaknessoflongties[J].AmericanJournalofSociology,(2007),113(3),702-734.[39]F.RoshaniandY.Naimi.Effectsofdegree-biasedtransmissionrateandnonlinearinfectivityonrumorspreadingincomplexsocialnetworks[J].Phys.Rev.E.85,036109(2012)[40]Katz,E.,&Lazarsfeld,P.F.Personalinfluence:Thepartplayedbypeopleintheflowofmasscommunications[M].NewYork:TheFreePress.(1955)[41]AndreaEllerom,AnnamariaSorato,GiovanniFasano.NewModelforEstimatingtheProbabilityofInformationSpreadingwithOpinion-Leaders[J].Workingpaperseries.ISSN:2239-2734.2011(11)[42]I.KanovskyandO.Yaary.ModelofOpinionSpreadinginSocialNetworks.June2011[43]Y.Moreno,M.Nekovee,Dynamicsofrumorspreadingincomplexnetworks[J].Phys.Rev.E,69(2004).[44]M.Nekovee,Y.Moreno,G.Bianconi,M.Marsili.Theoryofrumourspreadingincomplexsocial47 参考文献networks[J].PhysicaA:StatisticalMechanicsanditsApplicationsVolume374,Issue1,15January2007,Pages457–470[45]M.Boguna,R.Pastor-SatorrasandA.Vespignani,AbsenceofEpidemicThresholdinScale-FreeNetworkswithDegreeCorrelations[J].Phys.Rev.Lett.,90(2003)028701.[46]R.OlinkyandL.Stone,Unexpectedepidemicthresholdsinheterogeneousnetworks:Theroleofdiseasetransmission[J].Phys.Rev.E,70(2004)030902[47]Y.Moreno,M.Nekovee,A.Vespignani.Efficiencyandreliabilityofepidemicdatadisseminationincomplexnetworks[J].Phys.Rev.E,69(2004),p.055101R[48]R.Pastor-Satorras,A.Vespignani.Epidemicspreadinginscale-freenetworks[J].Phys.Rev.Lett.,86(2001),p.3200[49]Srbljinovic,A,Skunca,O.,AnIntroductiontoAgentBasedModelingandSimulationofSocialProcesses[J],InterdisciplinaryDescriptionofComplexSystems1(1-2),1-8,2003.[50]贺筱媛,胡晓峰.基于Agent的Web网信息传播仿真模型[J].系统仿真学报,2010,22(10):24-26.[51]刘小波,基于人际关系网络的舆情演化建模研究[J].情报理论与实践,2011(9)[52]施琪嘉,创伤心理学[M],北京:中国医药科技出版社,2006[53]WUF,HUBERMANBA.Socialstructureandopinionformation[R].HPLabsPaloAlto,CA,94304,2006[54]KamadaT,KawaiS.AnAlgorithmforDrawingGeneralUndirectedGraphs[J].InformationProcessingLetters,1989,31(1):7-15[55]FruchtermanTMJ,ReingoldEM.GraphDrawingbyForce-directedPlacement[J].Software:PracticeandExperience,1991,21(11):1129-1164.[56]ShneidermanB,ArisA.NetworkVisualizationbySemanticSubstrates[J].IEEETransactionsonVisualizationandComputerGraphics.2006,12(5):733-740.[57]王柏,吴巍,徐超群.复杂网络可视化研究综述[J].计算机科学,2007,34(4):17-23.[58]孙扬,蒋远翔,赵翔等.网络可视化研究综述[J].计算机科学,2010,37(2):12-18,30[59]张伟明,罗军勇,王清贤.网络拓扑可视化研究综述[J].计算机应用研究,2008,25(6):1606-1610.48 作者简介及在学期间所取得的科研成果作者简介及在学期间所取得的科研成果陈静,女,1988年7月13日出生于黑龙江省克山县,汉族人,工学硕士学位,在校期间曾任教研室党委党支部书记,曾发表国际会议论文两篇,期刊论文一篇,并参加两次国际学术会议。联系方式在学期间所取得的科研成果指在学期间取得的与学位论文内容相关的研究成果:发表的学术论文:[1].DongweiGUO,JingCHEN,BingLI,XinquanLI.TheModelingandSimulationoftheTrafficCongestionDriftInductionMechanismBasedonMinorityGame[J].The2rdInternationalConferenceonNetworkingandInformationTechnology(ICNIT2011).2011vol.17.pp:212-216.[2].DongweiGUO,JingCHEN,BingLI.TheRevelationofTrafficCongestionDriftandInductionMechanismunderInformationModification[J].PrzegladElektrotechniczny.Issue3,Vol89,2013,pp:110-112.[3].DongweiGUO,JingCHEN,BingLI.EvolutionaryCharacteristicsofPublicOpinionSpreadinSocialNetworks[J].The3rdInternationalConferenceonComputerandComputationalIntelligence(ICCCI2012).December15-16,2012.Bali,Indonesia.49 致谢致谢三年的研究生时光如梭而逝,在细数人生行囊中的种种收获的同时,心中也增加了诸多浓浓的感恩之情。衷心感谢我的恩师郭东伟教授。郭老师不仅治学严谨、学识渊博、通晓古今,而且德才兼备、为人谦和、平易近人、亦师亦友。在这三年研究生生涯中,从郭老师身上学习到的不只是如何做学术研究,更是如何做人,这些能力将使我受用终生。同时师母也是我今生最感激的人之一。师母善良可亲,大气从容,一直对我关爱有加,无微不至。师母也是我的人生导师,在我困顿迷茫时给予引导和帮助,教我如果面对人生中的潮起潮落。在我心里,二位已经不只是我的恩师和师母,更是我的亲人。感谢刘淼老师对我在学术上的指导和生活中的照顾,像姐姐一样对我的关心和帮助。同时感谢教研室的王康平、吕慧英等老师在这三年来对我的关心和指导。感谢各位师兄师姐、同学朋友对我在学习、生活等各方面的帮助。感谢李冰同学一直在我身边,陪我走过晴空万里抑或风雨滂沱。五年的时间沉淀了诸多美好,相信时间将使这份感情更加醇厚。感谢家人在各方面给予的极大鼓励和支持!最后对百忙之中审阅论文的老师表示感谢!50

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭