《复杂网络上基于流行病学的舆情传播模型及其规律研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
摘要摘要复杂网络上基于流行病学的舆情传播模型及其规律研究随着互联网技术的迅猛发展,人类社会进入了网络信息时代。网络已经成为了人们发布和传播信息的主要载体。在为人民生活提供诸多便利的同时,网络也成为了谣言传播的快速通道。在线网络上的舆情传播由于具有传播速度快、影响范围广等特点,已经引起了多起公共事件,对社会造成了不良影响。因此了解舆情信息在网络中传播过程及规律,对认识、预测和引导舆论事件的发生发展有着重要的理论意义和现实意义。信息和舆情传播这一课题一直备受专家学者关注,并进行了相关的研究。由于舆情传播的过程与传染病的病毒传播过程十分相似,所以建模的主要方法是基于病毒传播的传染病方法。真实的在线社会网络中的人即节点,人与人之间存在的关系即边。在线社会网络的拓扑结构即不是规则图也不是随机图,而接近于复杂网络,具有小世界效应和无标度特性。网络中的节点数量巨大,每个个体的行为特性复杂,对舆情传播产生相应的影响。为了对复杂网络中舆情传播的规律进行深入研究,本文基于流行病学提出了一种符合当前在线网络传播形式的传播模型:SICRS模型。该模型综合了传统流行病模型SIS模型和SIR模型,同时加入了染病个体从感染状态(infectious)到免疫状态(removed)的一个过渡状态,即治疗状态(cured)。各个状态对应到舆情传播领域即:S-对消息的未知状态,I-传播状态,C-知道消息但不传播的暂时遗忘状态,R-对消息免疫的永久遗忘状态。由于网络用户具有不同的个性特征及价值取向,因此在建模时考虑了个体agent多个特性对舆情传播规律的影响,包括个体影响力、对消息的好奇度、信息传播能力以及对信息的遗忘周期等。由于该模型只能输出宏观的各个状态人数等数据,并不能观察到网络中agent具体的微观变化,所以同时对具有代表性的网络进行了可视化。可视化的网络使网络特征更加明显,并通过更加直观的颜色来反映各个节点的状态。可视化网络对发现网络舆情传播的规律和特性起到了非常大的辅助作用。在SICRS传播模型下,并考虑Agent的特性以及Agent间的关系,通过仿真实验研究复杂网络中舆情传播的规律。仿真结果表明,标度网络中舆情传播过程呈现三阶段规律:传播初期存在舆情爆发现象;传播中期消息影响范围呈现周期性波动递减;在传播后期舆情在网络中呈现动态稳定。传播后期宏观上各个状态的节点数不变,而微观上网络中一些节点的状态存在周期性变化。同时发现当节点度较小时,节点经历周期数基本符合幂律分布。度较大时,节点经历周期数迅速减少。同时对模型中的潜在影响因子进行了实验分析,发现舆情传播的规律受网络密度影响,网络密度越大,舆情传播的影I 摘要响范围越大,消息在网络中持续的时间越长;舆情传播规律与用户传播时间的分布有关,传播能力强的人数越多,使传播中期持续的时间越长,但是不影响传播初期的舆情爆发情况与后期各状态稳定值;同时舆情传播的规律与用户好奇度分布相关性不大。以度数较小的节点作为信息传播源时会产生两种情况:一种情况为消息一直无法在网络中扩散;另一种情形为舆情会在网络中小范围传播,经过一段时间后影响范围逐渐缩小并彻底消失。通过对ER随机网络和WS小世界网络的仿真实验结果分析,发现网络的不同拓扑结构对以上舆情传播规律没有明显影响。关键词:舆情传播,流行病学,复杂网络,建模与仿真II AbstractAbstractTheSimulationandAnalysisofanOpinionSpreadingModelincomplexnetworksbasedonepidemiologyWiththerapiddevelopmentofInternettechnologyandinformationtechnology,humansocietyenteredtheInternetage.Thenetworkhasbecomethemaincarrierofthepeopletopublishanddisseminateinformation.Thenetworkprovidealotofconveniencetopeople'slives.Atthesametime,thenetworkbecomesfast-tracktoarumortoo.Becauseonlinedisseminationofpublicopinionspreadsfastandaffectswide,manypubliceventshasbeencausedtohadanegativeimpactonsociety.Therefore,tounderstandthetransmissionprocessandlawofpublicopiniononthenetworkhasimportanttheoreticalandpracticalsignificancetounderstand,predictandguidethedevelopmentofpublicopinionevents.Thesubjectaboutthespreadofinformationandpublicopinionhasalwaysbeenaconcernofexpertsandscholars.Thepropagationprocessofpublicopinionandinfectiousvirusisverysimilar,sothemainmethodofmodelingisbasedontheinfectiousdiseases.Intherealonlinesocialnetwork,thenodeispeopleandtheedgeistheinterpersonalrelation.Thetopologyofonlinesocialnetworkisnotaregulargraphorarandomgraph,whileclosetothecomplexnetworkwhichhasthesmall-worldeffectandno-scalecharacteristics.Boththehugenumberofnodesinthenetworkandthebehaviorcomplexityofeachindividualhaveacorrespondingimpactonthepublicopinionpropagation.Basedonepidemicmodel,anewspreadingmodel(SICRS)thatfitspopularonlinenetworkspreadingisproposedtostudypatternsofpublicopinionspreadincomplexsocialnetworks.ThemodelintegratedtraditionalepidemicmodelSISmodelandSIRmodel.Duetotheprocessofforgettingwhichcanbedividedintotemporaryforgettingandpermanentforgetting,atransitionstatenamedcuredstatuswhichrepresentstemporaryforgettingstatusisaddedbetweenspreadingstatusandpermanentforgettingstatus.Themeaningofeachstateinpublicopiniondissemination:Sstandsfortheunknownstatus,Istandsforthespreadstatus,Cstandsforthetemporaryforgettingstatusthatmeanstheagentknowtheinformationbutwillnotspreadit,andRstandsforthepermanentforgettingstatusthatmeanstheagentisimmunetotheinformation.Asweknow,networkuserhasdifferentpersonalitytraitsandvalues,andthecharacteristicwillaffectthepatternsofpublicopinionpropagation.Somanycharacteristicsoftheindividualagentareconsideredinthemodel,suchastheindividualinfluence,curiositytonews,informationdisseminationcapabilitiesandforgettingcycles,andsoon.Becausetheoutputofthemodelisonlythemacroscopicdataofrespectivestates,specificmicroscopicchangesintheagentcannotbeobserved.Therefore,thetypicalnetworkIII Abstractisvisualized.Thevisualnetworkmakesthecharacteristicsofnetworkmoreobvious,andthestateofnodescanbeobservedthroughamoreintuitivecolor.Visualnetworkhasplayedaveryimportantroleinfoundingthefeaturesandpatternsofpublicopinionspreadinthenetwork.BasedonSICRSpropagationmodels,andconsideredtheagent'scharacteristicsaswellastherelationshipbetweenagents,alargenumberofsimulationexperimentsareconductedtostudythepatternsofpublicopiniondisseminationinthecomplexnetwork.Simulationresultsshowthatthedisseminationofpublicopinioninthecomplexnetworkcanbedividedintothreestages.Intheearlystage,theinformationspreadrapidlyinthenetwork.Thereisthephenomenonofpublicopinionoutbreaks.Inthemiddlestage,withthegrowthofthepropagationtime,influencerangeofnewsreducesprogressivelyandperiodically.Inthelatestage,publicopinionpresentsdynamicstability.Thoughthenumberofeachstateisunchangedmacroscopically,thestateofsomenodesinthenetworkcyclicallychanged.Whenthedegreeofnodeislow,thenumberofexperiencedcycleofnodeisinlinewithapower-lawdistribution.Thenumberofcyclesofthenodewhichhasgreaterdegreeisrapidlyreduced.Atthesametime,bytheanalysistotheexperimentalresultaboutthepotentialimpactfactorinthemodel,wefoundthatthepublicopinionpropagationisaffectedbythedensityofthenetwork,thegreaterthenetworkdensity,thegreaterthescopeoftheimpactofpublicopinionspread,andthelongerthemessageslastinginthenetwork;thespreadpatternsarerelatedtothedistributionofuserpropagationtime,themorepeoplewhohasspreadability,thelongerimpacttimeofpublicopinioninthenetwork.Thespreadearlystageandlatestagecannotbeaffected.Thespreadisnotsignificantlyrelatedwiththedistributionofusercuriosity.Lowdegreenodesassourcesofinformationdisseminationwillcausetwosituations:theoneisthatthemessagehasnotbeenspreadinthenetwork;theotheroneisthatthepublicopinionwillbespreadinthesmallrangeandthentheinfluencescopewillnarrowtodisappearcompletely.BysimulationresultsofpublicopinionspreadinERrandomnetworkandWSsmall-worldnetwork,wefoundthatdifferentnetworktopologyhavenotsignificanteffecttothepatternsabove.Keywords:PublicOpinionSpread;Epidemiology;ComplexSocialNetwork;ModelingandSimulationIV 目录目录第1章绪论...............................................11.1研究背景................................................11.2研究目的和意义..........................................21.3论文主要内容............................................3第2章相关领域的研究概况.....................................52.1复杂网络................................................52.2流行病学................................................72.3基于Agent建模与仿真....................................72.4舆情传播研究现状........................................8第3章舆情传播的建模研究....................................103.1一些流行病模型.........................................103.2Agent建模.............................................123.3本文的传播模型.........................................13第4章仿真算法及实现........................................164.1无标度网络模型.........................................164.2仿真算法...............................................174.3网络可视化.............................................18第5章仿真结果及分析.........................................205.1仿真结果...............................................205.2结果分析...............................................215.2.1舆情传播初期......................................225.2.2舆情传播中期......................................255.2.3舆情传播后期......................................265.3影响因子分析...........................................295.3.1网络密度..........................................295.3.2用户传播能力分布..................................31I 目录5.3.3用户好奇度分布....................................335.4消息源为小度节点的仿真分析.............................345.5其他网络的仿真实验.....................................395.5.1ER随机网络仿真实验...............................395.5.2WS小世界网络仿真实验.............................41第6章论文总结与展望........................................446.1本文总结...............................................446.2展望...................................................45参考文献......................................................46作者简介及在学期间所取得的科研成果............................49致谢......................................................50II 第1章绪论第1章绪论1.1研究背景舆情,即舆论情况,是指在一定的社会空间内,公众对社会事件或现象的发生、发[1]展和变化所表达的态度和意见的总和。传统的社会舆情存在于人们日常生活的议论中,大多数情况下人们都采用口口相传的方式进行观点和思想的传播。而由于传统的传播方式存在诸多不稳定因素,舆论在传播过程中呈现出信息不完整、误差大、传播速度慢、[2]影响范围小等特点,这也导致舆情难以捕捉,更难进行整理分析以得到其传播规律。报纸、无线广播和电视等传统的传播媒体的出现,改变了以往舆情传播速度慢、范围小等状况。但是由于这些信息载体只是将一些社会现象或者政治事件报道给公众,平民百[3]姓却无法将自己的想法和态度及时全面地反馈。由此可见,这样广而告之的单方向舆情传播使政府不能全面了解民意民情。近年来,随着互联网的快速发展,网络已经在人们的日常生活中不可或缺,成为人与人之间交流沟通的新方式。由于互联网进入门槛低,无论什么身份什么阶层的人都可以轻松地成为网民,这导致互联网参与群体非常庞大。不同于传统的面对面的社会交往,[4]在匿名的网络中人们可以在短时间内建立大量的在线朋友关系。因此,网络在公众中迅速普及流行起来,人们通过网络来表达观点、传播思想。与传统的信息传播媒体以及口口相传的传播方式相比,互联网上的信息传播表现出了诸多新特性:实时交互性强、信息传播迅速、信息量巨大、传播范围广、参与者众多等等。互联网将人们分散的、自发的言论和思想集中地、显在地反映出来,这样便形成了网络舆情。可以说,互联网已经成为了社会舆论的放大器。由于互联网是完全开放的,任何人都可以成为网络信息的发布者、传播者和阅读者。通过论坛、博客、BBS、社交网站等途径,人们可以随时获取信息、发表观点。互联网[5]为人们提供了一个自由的信息共享平台。因为在网络中参与者都是匿名的,使得不同身份不同阶层的网民都可以畅所欲言,毫无忌讳地表达自己最真实的感受和情绪。而网络成为人们思想和观念的集散地的同时,也为大家提供了一个可以宣泄自己情绪的场所。在网络中不免会出现带有主观因素、缺乏理性的偏激言论,而由于网民之间的情绪相互影响发酵,使得这些言论在网络上迅速传播,以致产生消极有害的舆情。如今,在线网络已经成为了“虚拟社会”,网民都有不同的身份、背景,所以在线讨论的话题也非常多元化,涉及政治、经济、教育、军事、日常生活等等各个方面。这样,网络中的[6]信息数量非常庞大,同时涉及领域也非常广泛。同时网络信息传播存在实时性,所以网民会对所感兴趣的某一话题或事件迅速做出反应,进行探讨以互相交换意见及看法。1 第1章绪论而网络中的用户群体十分庞大,对于热点话题大家会纷纷进行带有情绪化的评论及转载,这样该话题的影响范围不断扩大,最终成为公众话题。同时,互联网的开放性使网络中的用户群体十分庞大,鱼龙混杂。随着舆情传播途径从传统渠道向互联网等新型载体转移,信息交流呈现出了非理性化以及情绪化等新特[7]征。存在一些网民出于各自的非法目的在网络上肆意散布谣言、人身攻击并传播偏激[8]及非理性思想。这些消极信息在网络上迅速传播,很难进行有效控制。与此同时,可以利用互联网舆情传播的速度快、影响大、范围广等特性,对需要普及和宣传的优质信息进行有目的的引导性传播,带动良好的社会风气、维护社会的和谐。所以充分地了解在线网络中舆情传播的规律,对控制恶意舆论并积极引导社会舆论是十分必要的,也是网络这一新兴媒体所面临的严峻挑战。1.2研究目的和意义近几年来,随着web2.0等互联网技术的迅猛发展,在线社会网络由于其为网络用户提供了快速便捷的沟通渠道而得到了广泛的应用,在线网络成为了人们沟通交流的主[9]要平台。不同于传统的社会交际网络,在线的舆论传播呈现出的突发性、实时交互性、传播速度快、影响范围广等新特性,是对传统的信息传播模式的颠覆。2012年,从中国互联网络信息中心发布的“第三十次中国互联网络发展状况”统计报告的统计数据可以看到,截至2012年6月底,中国网民规模已经达到5.38亿人,比2011年底增加了2450万人;互联网普及率高达39.9%,提升了1.6个百分点。而农村网民规模已达1.46亿。有此可见,互联网的普及率稳步上升且用户范围逐渐扩大的同时,互联网在人们生活中的重要性也越来越明显,已经成为一个不容忽视的新型舆论传播平台。互联网用户人数的不断增加,为网络舆论的形成以及传播提供了更加肥沃的土壤。通过新闻评论、网络论坛、博客、社交网站、wiki等多种信息交互方式,人们可以根据自己的喜好选择相关信息进行获取,同时也可以发表自己的言论和看法,并可以通过转载、分享等方式进行对该信息的继续传播。由于互联网的高度开放性和信息实时性,越来越多的民众选择在网络中获取信息、发表观点、交流看法。可以说随着互联网的快速普及,人们的交流方式及言论习惯也发生了很大的转变。众所周知,任何事情都有两面性。网络作为一个开放的公共舆论平台,在给人们提供实时获取信息、交互意见的良好舆论环境的同时,也给社会带来了一些不容忽视的负面影响。由于互联网的开放性及隐蔽性,被许多不法分子所利用。这些人通过网络散播黄色暴力信息、网络病毒,以获取不法利益或私人信息;甚至有些人利用网络的便捷性传播反动言论、虚假内容等,试图破坏社会和谐,误导民众的意识取向。近年来,发生[10]了多起由舆情或谣言传播引起的公共事件,如英国的伦敦骚乱、美国的华尔街游行事2 第1章绪论件、发生在我国的抢盐事件、毒胶囊事件、陕西表哥事件等等。网络舆情事件对社会已[11]经产生了非常深刻且广泛的影响,可以说目前没有其他的平台可以与之相媲美。可见网络舆情的影响及能量已经不可忽视、不能忽视、更不该忽视。由于网络舆情对社会舆论、人们的价值取向、行为方式、公众情绪等都有着越来越深远的影响,所以对网络舆情的研究也受到了社会及各级政府的高度重视。从舆情的宏观动态中提取出一定的规律及性质,进而研究舆情的控制及引导方法已经成为网络舆情研究工作的重中之重。改造世界必须先认识世界。通过对网络舆情发生、发展、演化的过程中的变化规律的分析,得到控制危害社会安全的舆论以及引导网络正能量信息的方法,这也是促进社会稳定、维护社会和谐的重要方法。这些在线社会网络节点数量巨大,拓扑形态不同于规则网络和随机网络,而是具有小世界效应和无标度特性的复杂网络[12]。因此,研究舆论在复杂网络中的形成过程、传播规律及性质等,这对认识、预测和引导舆论事件的发生发展有着重要的理论意义和现实意义。1.3论文主要内容信息传播的主要表现形式主要有两种,一是舆情传播,另一个则为流行病或病毒在复杂网络上的传播。由于整个社会对流行病传播这一问题的持续重视,流行病传播理论的相关研究已经获得了巨大的成功。而在线网络上的舆情传播符合流行病传播的动力学行为。所以本文基于流行病学理论提出符合当今在线社会网络上舆情传播的模型。同时在线网络中用户少则几万,多则几千万上亿,网络规模的庞大以及关系的错综复杂,使用户行为特征复杂、价值取向迥异,每个用户都表现出不同的个性特征,并且行为学研[13]究已发现传播者的个人特征会影响信息传播行为。因此,基于流行病学建模的思想并将用户的个性特征引入网络传播研究中,对更好地认知传播行为有帮助。为了抑制有害信息的蔓延,营造良好的互联网舆论环境,本文根据用户的个性特征来刻画用户的舆情传播行为,提出一种新的基于流行病学的传播模型,并模拟在复杂网络上舆情的传播过程,从而了解舆情信息网络传播的形成过程和传播规律。本文的基本结构如下:第一章,简要介绍了本文的研究背景,分析了互联网时代的舆情传播与传统舆情传播的区别,以及网络舆情给社会带来的新挑战与问题;同时介绍了本课题的研究目的及意义。第二章,对本文所涉及到的相关领域知识进行的简要的介绍。分别对复杂网络、流行病学、agent建模等知识背景进行分析引入,随后对舆情传播的国内外研究现状进行介绍。第三章,说明了本文提出的舆情传播模型。首先对一些基本的流行病模型进行分析3 第1章绪论比较。然后基于agent建模方法,并结合在线网络舆情传播过程中用户表现出的有关特性,对本文模型中的agent属性进行分析、定义。最后根据当今在线网络舆情传播的特点,基于流行病理论提出了一种舆情传播模型。第四章,将本文提出的传播模型应用到复杂网络中,实现相应的仿真算法并进行相应的仿真实验。通过对仿真实验获得的数据进行整理和分析,获得舆情传播的基本规律及特性。并通过对实验中的可变参数进行实验分析,得到了可以对舆情传播规律造成影响的相关因素。第五章,总结与展望。本章对本论文的工作进行了简单地总结,并提出了一些尚需解决的问题,以及将来要继续进行的工作。4 第2章相关领域的研究概况第2章相关领域的研究概况2.1复杂网络在网络理论的研究中,如果网络结构具有节点数目庞大并且节点间的关系十分复杂等特点,该网络则为复杂网络。通常网络中的节点代表存在于该网络中的个体,而网络中节点相连接的边则代表个体间的相互作用。复杂网络不同于简单网络,是一个具有十分复杂的拓扑结构特征的图。现实生活中的互联网网络、人际关系网、交通网、神经网络、细胞网络、科学家合作网络等,都属于复杂网络。对复杂网络的研究始于对这些真实网络的分析整理,提出一些统计量对网络的结构特征进行量化。研究学者们发现许多真实网络具有一些共同的拓扑统计性质。这些性质与规则网络或随机网络的特性不同,[14]被各界学者广泛研究的主要是小世界效应和无标度特性。下面对这两种结构特征进行简要介绍。1.小世界效应1998年,nature上发表了D.J.Watts和S.H.Strogatz的一篇论文,文中提出了WS小世界网络模型(Watts-StrogatzSmall-WorldNetworkModel),描述从完全规则网络到[15]完全随机网络的转变。WS小世界模型是一个简单的表示小世界效应的模型。小世界效应(small-worldeffect)即网络中任意两点之间的距离相对于整个网络规模是较小的,网络特性表现为平均路径短和聚类系数大。正如麦克卢汉所说,地球逐渐变成了一个地球村。这也从侧面证实了真实网络中存在的小世界效应,使得地球变成了一个小世界。平均路径短即表示虽然网络规模很大,但是任意两点之间的距离却相对很小。20世纪60年代美国哈弗大学的社会心理学家StanleyMilgram通过一系列社会调查得出了六度分离(sixdegreesofseparation)推断[16]。这意味着平均只要通过五个人,你就可以和地球上任何一个角落的任何一个人产生[17]联系。而集聚程度,是指网络集团化的程度。小世界效应表现出了高的集聚程度。例如,社会人际关系网络中总是存在熟人圈或朋友圈,即你的朋友的朋友也是你的朋友,圈中成员之间都存在关联关系。在某种程度上也类似于“物以类聚,人以群分”的特性。WS小世界网络是对规则图中边进行随机化重连得到的。该规则图中包含围成一个环的N个节点,连接边则是建立在节点与左右各k/2个邻居节点之间。重连则是以概率p随机选择网络中的边进行重新连接。但是要保证不能自连接,且两节点间最多连接一[18]条边。生成过程如图2.1所示。5 第2章相关领域的研究概况图2.1WS小世界网络生成示意图2.无标度特性1999年,Barabási和Albert在Science上发表了一篇影响很大的论文,文章指出不同于规则网络中连接度按照δ函数分布以及随机网络中节点度的正态分布,许多实际的[19]复杂网络的节点度数分布具有幂律形式。度是指网络中节点所连接边的数量,有向网络中度又分为出度和入度两类。简单来看,节点度按照幂律分布说明网络中大多数节点的度数较小,度数越大的节点数量越少。但是网络中存在节点度数非常大的节点,这样节点度数没有明显的特征长度,无法使用同一个单位来度量不同节点的度,这类网络又被称为无标度(scale-free)网络或者无尺度网络。无标度网络宏观的特征就是存在一些中心节点,这些中心节点相对于其他节点具有非常高的度,度的大小也代表着这些节点在网络中的重要性。例如,我国的航空网络,北京、上海、广州等城市为主要交通枢纽,飞往全国各地的航线非常多,而一些偏远城市仅有几条航线或者没有航线。又如近年热门的社交网站微博,影视明星姚晨等的粉丝已经达到三千万之多,而一般的普通用户粉丝量大多以百计算。可见,在现实网络中存在非常明显的中心节点。无标度网络的构造原则是增长特性和优先连接。初始网络中存在N个节点,每一步向网络中添加新的点,对于每个新点,将添加m条边在该新点和初始点之间。而这m个原始节点被优先连接的原则为:(2.1)其中i为新加入的节点,j为原始节点。从公式可见这种选择方式会使富点变得更[20]富。也就是说,随着网络节点的加入,网络的中心节点的度呈现快速增长,同时该节点的重要性也会越来越明显。6 第2章相关领域的研究概况2.2流行病学流行病学是研究疾病分布规律及影响因素,借以探讨病因,阐明流行规律,制订预[21]防、控制和消灭疾病的对策和措施的科学。由于人类历史上曾经多次受到及其严重的流行病的威胁,因此如何获取流行病传播规律并进行疾病预测是人们自古以来不变的话题。最早使用的统计方法完全是根据总结的经验。而随着数学和物理成果的不断更新,统计方法也不断得到改进。然而,大家都不喜欢事后诸葛亮,而是希望研究机构能够对流行病做出预测,以采取相应的预防对策和应对措施。预测则是以演化模型作为依据,没有一个确定的演化法则的系统是徒劳的、不确定的。因此必须对特殊传染疾病在给定网络上进行传播建模,其目的在于重现传染病的真实动力学并研究出控制甚至根治疾病的方法。实际上,流行病传播是一个非常复杂的过程,不同情形会产生截然不同的结果。比如,有些疾病是有免疫能力的,人被感染一次之后将会终身免疫不会被二次感染,如腮腺炎、麻疹、水痘等;而还有一些疾病是没有免疫能力的,人可以被反复感染,如肺结核等。因此不同类型的流行病需要建立不同的模型进行具体描述。事实上,根据粗粒化的描述方式,人们已经建立了大量的模型来描述不同的流行病传播情形。其中按照能不能被反复感染划分,也是最有影响的两种典型模型是SIS(易感-感染-易感)模型和SIR[22](易感-感染-免疫)模型。在SIS模型中,人群被划分为两组:易感(susceptible)人群和染病人群(infected)。易感人群是人们处于为患病但是可以被感染的状态,或者是疾病已经被治愈但仍可以感[23-24]染;染病人群则可以将疾病传染给别人。所以说染病人群是流行病传播的源头,他们将疾病传染给易感人群,促使流行病在网络中传播。而SIR模型中,人群被划分为三[25-26]类:易感人群(susceptible)、染病人群(infected)和免疫人群(recovered)。免疫人群即被治愈后获得了免疫能力,不会再被传染该疾病,也就不再对相应的动力学行为产生任何影响。该模型下,感染人数会随着时间推移而逐步增加,而由于个体会对流行病产生免疫,所以接着感染人数因为免疫人群的增加而开始减少,直到网络中不存在染病人群,传染过程结束。SIS模型和SIR模型的区别就是二者的终态不同。除了这两个典型的模型外,还有一些其他的比较常用的流行病传播模型,如SI模型、SIRS模型等。2.3基于Agent建模与仿真目前,基于agent的建模和仿真方法(Agent-BasedModelingandSimulation,ABMS)7 第2章相关领域的研究概况被广泛应用于各个领域的复杂系统的研究,其中不乏社会领域、经济领域、生物领域以及工程领域,等等。现实世界中存在着各种形态的实体,我们将其中具有主动的行为能[27]力的实体抽象为agent。Agent可以在没有其它系统的直接干预下可以自助控制其行为和内部状态;agent能够感知所处的环境,并根据环境的变化做出相应的反应;同时agent可以与网络中的其他agent进行交互信息。ABMS是当前建模与仿真领域的研究热点。而社会系统中的“人”与ABMS中的Agent具有本质相似性。人同样具有自治性、反应性、主动性和社会性,所以人被抽象成具有自主决策、协调能力的agent。基于agent建模与仿真方法非常适合发现和研究人[28]类系统的自组织和涌现行为,所以一直在社会领域得到广泛应用。Agent是对复杂系统中的主动个体进行抽象整理得到的,同时也是模型中的基本组成单位。Agent具有不同的特性,并且根据内部感知器获取到的环境、其它agent信息以及自身状态和设定好的规则来修改自身的状态,并通过效应器对环境与其它agent实[29]施行为,达到agent交互的目的。通过这种感知--行为模型或更高级的智能模型,实现个体agent的功能行为建模。同时agent之间进行有效通信等交互行为,会导致系统涌现出整体的行为。所以这种建模仿真方法被广泛地应用于群体行为的研究。2.4舆情传播研究现状近些年,科研学者们将注意力集中于描述和理解社会网络系统中个体的集群行为产生的原因和发生、发展的过程,并进行了大量的研究工作。其中舆情传播就是重要的研究方向之一。[30][31][32]Sznajd,Deffuant和Hegselmann等人首先对复杂网络上的舆情传播进行了研究,他们选择的复杂网络模型主要是NW小世界模型和BA无标度网络模型。Sznajd模型的思想是社会网络中一个人的意见会受外部社会群体的影响,群体的规模越大则影响越大。也就是说想要说服一个人,两个或更多人的意见要比一个人更有效。而由于人的意见不总是绝对的是或否,很多人的意见介于两者之间。因此Deffuant和Hegselmann分别提出了不同的连续型意见模型。以上模型对个体间简单的相互作用进行明确定义,并通过这种个体之间微观作用的多次迭代进而研究系统中宏观的复杂行为。这些模型在建模过程中引入了物理学中的物质扩散、热传导模型或磁铁粒子交互模型。JuliánCandia中进行了大规模的蒙特卡洛(montecarlo)仿真,研究了BA无标度网络中不可逆转舆[33]情传播模型的动力学行为和临界行为。[34]信息和舆情传播建模的主要方法是基于病毒传播的传染病方法。网络传播的研究是从传染病的流行问题研究开始的,对人类产生了重大的影响,也为研究舆情扩散提[35]供了有益的思路。舆论传播的动力学行为服从流行病学中的SIR传播模型。这个问题8 第2章相关领域的研究概况首先由sudbury进行了研究,提出了一个随机网的SIR模型。得到舆论最多只能传递到80%的人群的结论。刘宗华研究了舆论在一般网络上的传播情形,发现随机网最易传播[36]舆论。最近提出了另外一种方法,阈值模型或复杂感染。该模型假定用户获知消息概[37]率符合关于用户已知消息邻居占总邻居数比例的sigmoid函数。研究学者提出并介绍[38]了一个传染函数和一个连接强度函数(CSF),用以研究程度偏置传输速率和非线性传染性对复杂社会网络中舆情传播的影响。在社会学理论中,意见传播过程中存在关键[39]人物,也就是意见领袖。这些关键节点(Hubnodes)对舆论的传播起着非常重要的作用。也有学者将意见领袖视为一种特殊agent进行建模,并研究其在舆情传播中的特[40-41]性。IgorKanovsky提出了一个新模型,该模型假设获得消息的概率是关于接触到[42]的影响者数目的函数,称为“0-1-2”作用。在线社会网络具有一人发表信息,所有好友都会获得该消息的特性,使得信息传播更快;在线网络中用户少则几万,多则几千万上亿,网络规模的庞大以及关系的错综复杂,使用户行为特征复杂、价值取向迥异,并且行为学研究已发现传播者的个人特征会[13]影响信息传播行为。因此,基于流行病学建模的思想并将用户的个性特征引入网络传播研究中,对更好地认知传播行为有帮助。本文根据用户的个性特征来刻画用户的舆情传播行为,提出一种新的基于流行病学的传播模型,并模拟在复杂网络上舆情的传播过程,从而了解舆情信息网络传播的形成过程和传播规律,进而预测和引导舆论事件的发生发展,防治网络恶意舆论和网络暴力的产生,建设和谐良好的网络舆论环境。9 第3章舆情传播的建模研究第3章舆情传播的建模研究3.1一些流行病模型网络上的信息传播的直接表现形式为舆论传播,与病毒或传染流行病在各种复杂网[43-44]络上的传播比较接近。传染病模型的人群划分的理念被广泛的应用。对于不同的传染病传播情形,人们已经建立了大量的模型来描述。其中,按照能不能被反复感染来划分的两种典型的模型分别为SIS(易感-感染-易感)模型与SIR(易感-感染-免疫)模型。3.1.1SIS模型SIS模型将人群划分为两类:易感人群(S)和染病人群(I)。疾病传染源即染病人群与易感者接触后,使其以一定的概率λ成为感染者;感染人群本身也以一定的概率μ可以被治愈,被治愈的个体对该病毒仍然是易感染的;易感人群一旦被感染,就又称[45-47]为了新的感染源。由于存在二次感染的情况,所以SIS模型的终态为稳定态,如振荡态或不动点,感染机制可以用下式表示:(3.1)(3.2)s(t),i(t)分别表示群体中的个体在时刻t处于S态和I态的密度。以下微分方程组描述了SIS模型在易感人群和染病人群充分混合时的动力学行为。(3.3)(3.4)在方程组中存在一个阈值ρ,当λ<ρ,其定态解为i(T)=0。而当λ>ρ,定态解为i(T)>0。T为达到稳定状态的时间。SIS模型的状态转换图如图3.1。10 第3章舆情传播的建模研究图3.1SIS模型的状态转换图3.1.2SIR模型SIR模型将人群划分为三类:易感人群(S),染病人群(I)和免疫人群(R)。SIR模型适合于描述染病者在治愈后不会再被二次感染的疾病,如腮腺炎、百日咳、水痘等,或者是那些几乎不可避免走向死亡的疾病,如艾滋病等。与SIS模型不同的是,染病人群治愈后并非再次成为易感人群,而是以概率μ成为免疫人群。人们一旦进入免疫状态,则不会再被感染。所以免疫人群的个体不会再对病毒的传播起任何作用。SIR[48-49]模型的终态为无感染态,低于临界阈值时总感染人数的密度为零。其动力学方程如下:(3.5)(3.6)s(t),i(t),r(t)分别表示群体中的个体在时刻t处于S态、I态和R态的密度。以下微分方程组描述了SIR模型在易感人群和染病人群充分混合时的动力学行为。(3.7)(3.8)(3-9)SIR模型存在一个阈值ρ,当λ<ρ时流行病将无法扩散出去,而当λ>ρ时流行病爆发并成为全局性感染状态。SIR模型的状态转换图如图3.2。图3.2SIR模型的状态转换图11 第3章舆情传播的建模研究3.2Agent建模[50]基于Agent的建模与仿真是一种自下而上的建模方法。该方法对Agent个体及其相互之间(包括与环境)的简单行为进行定义并进行建模仿真,通过对agent的交互动作的长时间观察研究来发现复杂系统的宏观行为。这正符合网络中个体之间消息不断传递而产生舆情的状况,所以ABMS非常适用于对舆情的建模。因此对于本文所研究的复杂网络中舆情传播问题,agent则为复杂网络中的节点。根据对真实的舆情传播情况的分析,定义agent的特性。而建模的重点则是对agent间舆情演化的规则即上述个体agent的交互行为的制定,最后根据所建模型进行仿真实验,通过实验结果进一步研究舆情传播的规律。Agent是在线网路中的每个用户,因此他们都有不同的个性,本文从影响力、好奇度、信息传播能力、遗忘周期(暂时性遗忘和永久性遗忘)等对舆情演化最相关的几个特性对agent进行分析。影响力[51]从传播学基础理论可知,现实生活存在意见领袖的现象。在线社会网络中,有一些用户建立了一定的声誉,其被关注度比较高,所以的他的意见也会被更多的人看到,影响范围更广,同时作为意见领袖他的意见也能够对他人产生更大程度的影响。由于度较大的节点意味着该节点与比较多的节点相连接,这样该节点发布的信息便会被更多的人获取,所以本文将影响力定义为节点agent的度的大小。好奇度现实社会中,受个体性格、身份背景、文化程度、心理因素等影响,人们对信息的掌握、理解、认可、分析程度也有所不同,所以个体对新奇事物的好奇程度是不同的。一些人对消息的分析不够,对大多数消息不进行筛选就相信并转发传播;也存在一些人则对消息进行自己的判断,只有消息足够新奇才会接受并关注。信息传播能力信息传播能力即agent认可一则消息并对该消息进行持续传播的能力。由于互联网用户十分庞大,所以不同用户关注的事物不同、在线使用网络的时间不同、用户价值取向及好奇持久性也不同,导致每个人对消息关注时间及在线传播能力也不同。遗忘周期遗忘是对曾经记过的信息无法回忆起来,或者回忆起的是错误信息。而遗忘又可以分为暂时性遗忘和永久性遗忘:暂时性遗忘是指对曾经已知信息的遗忘是暂时的,在适宜条件下还可能恢复记忆;而永久性遗忘则是指个体对曾经已知信息的遗忘是永久的,[52]如果不重新学习该信息就不可能恢复记忆。本文认为网络舆情传播过程中,agent对消息失去兴趣时便进入了暂时性遗忘,在此期间如果周围有足够的刺激(看到一定数目12 第3章舆情传播的建模研究的好友传播此消息)就会唤醒其记忆,重新进入暂时性遗忘阶段,但是期间仍然不进行消息的传播。当完成暂时性遗忘,则进入永久性遗忘阶段。这一阶段不会受外界影响,对该消息不感兴趣且不予传播。只有完成该周期,才可以像没接触过该消息的agent的一样重新认识该消息。在线社会网络与现实生活的关系网一样,每个人的个性都不相同,并可能按照某种规律分布。所以本文对以上几种用户特征分别按照下面几种分布方式进行研究,并研究这几种用户特征分布方式对舆情传播规律的影响。均匀分布:(3.10)泊松分布:(3.11)正态分布:(3.12)对数正态分布:(3.13)3.3本文的传播模型在现实生活中,存在这样一种流行病,在患病中期具有传染能力,而在患病末期经过自身的治疗和修复则不会再传染给他人,并且疾病治愈完成免疫期后个体仍然会被二次感染,如病毒感冒等。本文借鉴传染病模型的人群划分的理念,提出了符合上述情况的SICRS模型(易感-感染-治疗-免疫-易感)。SICRS模型综合了SIS模型和SIR模型的同时,加入染病个体从感染状态(infectious)到治愈状态(recovered)的一个过渡状态,即治疗状态(cured)。在这种状态下,个体进行自我治疗,虽然携带病毒,但失去传播病毒的能力。模型中易感人群染病后进入感染状态,而处于感染状态的个体以概率λ进入治疗状态,此时还没有完全治愈,也不能再传染其他个体;在治疗状态的个体以概率μ进入完全治愈的免疫状态;而治愈的个体又会以概率σ变成会被再次感染的易感人群。将该流行病传播模型应用到舆情传播问题中,对这四种状态的个体进行如下定义:S(susceptible):未知状态,网络中不知道或者不相信该消息的个体;I(infectious):传播状态,知道该消息并进行传播的个体;C(cured):暂时遗忘状态,开始淡忘该消息并失去传播意图的个体;R(recovered):永久遗忘状态,对消息完全失去兴趣的个体。13 第3章舆情传播的建模研究对SICRS传播模型中的相关参数进行定义如下:新奇度p:每条消息都带有一定的新奇度。新奇度比较大的消息比较容易得到公众的关注,引起大家的兴趣;而新奇度较小的消息则容易被大家忽略。接受值pa:网络中个体接受或相信一则新闻或消息的临界点,我们称之为接受值。当达到接受值时,该个体相信此消息并进行传播。暂时遗忘率λ:个体处于传播状态时,会以概率λ进入暂时遗忘状态。永久遗忘率μ:个体处于暂时遗忘状态时,会以概率μ进入永久遗忘状态。恢复率σ:个体处于永久遗忘状态时,会以概率σ恢复为未知状态。该模型中agent间的交互行为以及agent状态演化规则如下:由于在线社交网络中,一个人发出的消息,与自己有关的人(存在连边)都能够看到,同时一个人也可以看到所有好友发出的消息。所以在每一个时刻t,处于未知状态S下的agenti检查与其相连的所有agent,对处于传播状态I的agent进行计数n,则agentI得到了一个正的受消息的影响度。假设agenti本次进入S状态时间为。(3.14)其中是与本次处于S状态时间相关的函数,即对agent而言,消息的每次传播都使其新奇度(或能量)有不同程度的下降。每个个体都保留着过去时期内所获得的总的消息影响度。(3.15)当时,即该消息对agenti的影响力已经达到其对新奇消息的接受值时,对不知道该消息的agenti开始相信并传播该消息。处于I状态的agent会对消息进行传播,并以暂时遗忘率λ进入C状态。当agenti进入C状态时,如果i周围的处于状态I的邻居agent数(M为既定参数),则维持在此状态。否则会以概率进入永久性遗忘状态R。这表示当周围还有一些人提起该消息,会影响他对此消息的遗忘过程。当agent进入R状态后,表示其对该消息彻底遗忘,更不会传播该消息。而处于R状态的agent,仍然可以以恢复率σ重新进入状态S,恢复为对该消息的未知状态。这表示重新开始了一次对该消息的接受和传播过程。因此,消息在网络中的不断传播导致了网络中agent的状态变化。也可以说,SICRS传播模型通过网络中个体的状态变化,反映出消息在网络中的传播情况。处于I状态的群体即消息传播到的人群。SICRS传播模型的状态转换图如图3.3.14 第3章舆情传播的建模研究图3.3SICRS传播模型的状态转换图15 第4章仿真算法及实现第4章仿真算法及实现4.1无标度网络模型交通网、神经网、科学家合作网、人际关系网等这些存在于现实生活中的系统都可[53]以通过网络来描述,而本文所研究的网络舆情传播的载体就是在线社会网络。而复杂网络中的BA无标度网络与现实在线社会网络的拓扑结构较为接近,所以本文首先采用无标度网络作为舆情研究的网络模型。网络中的agent节点代表用户,网络中的边连接建立了好友关系的用户。在该网络中,当朋友关系区分为单方关注和互相关注时,可以作为有向网络。而在本文的研究课题中网络的方向性并不重要,所以本文构造的无标度网络为无向无权的网络。在舆情传播过程中,复杂网络也不断发生着变化,如用户的注册及注销、好友关系的建立和解除等,由于网络舆情传播时间相对较短,所以暂时不考虑网络的演化,认为网络在舆情传播过程中保持不变。本文采用的BA无标度网络生成方式如下:初始网络中存在10个节点,每一步向网络中加入新节点并与网络中的5个节点相连,网络构建程序运行19990步。生成网络的具体参数如表4.1。表4.1本文所用无标度网络相关参数网络参数值网络平均度10节点数20000边数100,000网络的具体度分布如图4.1,有图可见本文所生成的无标度网络的度分布符合幂律分布。16 第4章仿真算法及实现图4.1本文所用无标度网络的度分布4.2仿真算法由于选择的复杂网络的数据量很大,其中每个节点都是一个agent,根据舆情传播的过程及SICRS模型的特征,设计了三个类以满足本论文的舆情传播仿真要求。网络类CNet定义了复杂网络的真实结构,包括网络中的人,人与人之间的关系以及网络中的消息及相关的操作。消息类CInformation定义了要在网络中进行传播的消息。消息带有一定的新奇度m_power。Cperson类定义了网络中人的信息。每个人都定义的未知状态S,传播状态I,暂时遗忘状态C,永久遗忘状态R的相关参数,以及各个状态之间进行转换控制的函数。具体算法设计如下:Step1:对网络进行初始化,对网络中每一个agent的不同个性参数按照3段方程组中相应的分布公式进行设置。Step2:对消息进行初始化,将消息的信息新奇度属性赋初值。Step3:确定消息传播源。随机选择网络中的一个节点,将其状态属性设为I传播状态。Step4:更新网络中所有agent的状态。遍历所有agent进行如下操作:检查当前agenti所处状态,并进入相应的处理程序。如果i处于未知状态,即i.status=S,则按照上面公式计算消息的累积影响度Di,17 第4章仿真算法及实现当累积影响度达到该agent的接受值时,即Di>i.pa,则进入I状态,否则状态不变。如果i处于传播状态,即i.status=I,则以暂时遗忘率λ为概率进入C状态。如果i处于暂时遗忘状态,即i.status=C,则检查该agent的好友(存在邻居关系的agent)中处于I状态的人数m,如果m>M,将永久遗忘概率暂时清零,否则以设定的永久遗忘概率μ为概率进入永久遗忘状态R。如果i处于永久遗忘状态,即i.status=R,则以恢复率σ为概率重新进入未知状态S。Step5:统计处于各种状态的agent数量,写入输出文件。Step6:如果遍历网络节点的执行次数number
此文档下载收益归作者所有