禽流感病毒进化与传播规律研究

禽流感病毒进化与传播规律研究

ID:76333174

大小:5.21 MB

页数:114页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
禽流感病毒进化与传播规律研究_第1页
禽流感病毒进化与传播规律研究_第2页
禽流感病毒进化与传播规律研究_第3页
禽流感病毒进化与传播规律研究_第4页
禽流感病毒进化与传播规律研究_第5页
禽流感病毒进化与传播规律研究_第6页
禽流感病毒进化与传播规律研究_第7页
禽流感病毒进化与传播规律研究_第8页
禽流感病毒进化与传播规律研究_第9页
禽流感病毒进化与传播规律研究_第10页
资源描述:

《禽流感病毒进化与传播规律研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

分类号学号152101UDC密级军事科学院博士学位论文禽流感病毒进化与传播规律研究ResearchontheEvolutionandTransmissionofAvianInfluenzavirus作者姓名胡明达学科专业生物信息学指导教师梁龙答辩主席刘少君学位授予单位军事科学院论文提交日期2018年5月20日 原创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作新取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表和撰写过的研究成果,也不包含为获得军事科学院或其他教育机构的一学位或证书而使用过的材料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。:禽流感病毒进化与传播规律研究学位论翅目::训I年r月学位论文作者签名曰期;^曰学位论文版权使用授权书本人完全了解军事科学院有关保留、使用学位论文的规定。本人授权军事科学院可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库逬行检索,可以采用影印、汇编学位论文。、缩印或扫描等复制手段保存(保密学位论文在解密后适用本授权书)学位论文题目:禽流感病毒进化与传播规律研究肩曰期学位论文作者签名::年夕月这日作者指导教师签名:日期:年月M日?辦:T 军事科学院博士学位论文目录摘要.....................................................................................................................IAbstract.................................................................................................................III第一章前言........................................................................................................11.1禽流感病毒概述................................................................................................11.2禽流感病毒进化动力的相关研究....................................................................41.2.1抗原漂移与抗原转变.............................................................................41.2.2正选择压力与密码子偏性.....................................................................61.3禽流感病毒传播规律的相关研究....................................................................91.3.1禽流感病毒的主要传播方式................................................................91.3.2甲型禽流感病毒的系统地理发生学研究............................................91.4论文的主要工作和创新点..............................................................................121.4.1本文的相关研究方法与科学问题.......................................................121.4.2论文内容的主要结构...........................................................................14第二章H7N9亚型禽流感病毒在中国第五次流行的进化特征分析........................162.1研究背景.........................................................................................................162.2材料与方法.....................................................................................................172.2.1H7N9亚型禽流感病毒序列收集和多序列比对(SequenceAlignment)........................................................................................................................................172.2.2H7N9亚型禽流感病毒的系统发生学分析(Phylogeny)...............182.2.3H7N9亚型禽流感病毒的密码子使用偏向对应分析(CorrespondenceAnalysis,COA)..........................................................................................................192.2.4H7N9亚型禽流感病毒的种群多样性动态变化分析(Populationdynamics)与氨基酸进化速率分析(Substitutionrates).........................................192.2.5H7N9亚型禽流感病毒的氨基酸替换状况统计与互信息计算分析202.3结果分析.........................................................................................................212.3.1H7N9亚型禽流感病毒的基因进化特征............................................212.3.2H7N9亚型禽流感病毒的密码子使用偏性变化特征........................222.3.3H7N9亚型禽流感病毒的种群动态变化情况....................................242.3.4H7N9亚型禽流感病毒五次疫情之间的氨基酸进化速率比较........262.3.5H7N9亚型禽流感病毒的氨基酸突变的动态变化特征....................28第I页 军事科学院博士学位论文2.3.6H7N9亚型禽流感病毒与其他亚型禽流感病毒的重配情况调查....332.4讨论与结论.....................................................................................................37第三章H9N2亚型禽流感病毒的全球传播规律研究..............................................403.1研究背景.........................................................................................................403.2材料与方法.....................................................................................................413.2.1H9N2亚型禽流感病毒的序列收集与多序列比对............................413.2.2H9N2亚型禽流感病毒的系统发生学分析和系统地理发生学分析423.2.3H9N2亚型禽流感病毒的密码子使用偏性对应分析........................433.2.4H9N2亚型禽流感病毒的正选择作用压力分析................................433.2.5H9N2亚型禽流感病毒的全球传播网络绘制....................................443.3结果分析.........................................................................................................443.3.1H9N2亚型禽流感病毒的系统发生学进化特征................................443.3.2H9N2亚型禽流感病毒的密码子使用偏性特征................................493.3.3H9N2亚型禽流感病毒的正选择作用压力位点统计........................513.3.4全球H9N2亚型禽流感病毒的系统地理发生学重建......................523.4讨论与结论.....................................................................................................61第四章重点亚型禽流感病毒的协同进化模式研究................................................644.1研究背景.........................................................................................................644.2材料与方法.....................................................................................................654.2.1序列收集筛选与多序列比对...............................................................654.2.2氨基酸突变位点的协同进化分析.......................................................654.2.3重点亚型禽流感病毒蛋白间协同进化关联网络的构建...................664.3结果分析.........................................................................................................674.3.1H5N1亚型禽流感病毒的协同进化分析............................................674.3.2H7N9亚型禽流感病毒的协同进化分析............................................714.3.4H9N2亚型禽流感病毒的协同进化分析............................................754.4讨论.................................................................................................................82第五章全文总结与展望........................................................................................84第II页 军事科学院博士学位论文表目录表2.1H7N9亚型禽流感病毒各次疫情的序列数量统计..........................................18表2.2H7N9亚型禽流感病毒HA基因中氨基酸突变位点在各次疫情的变化情况31表2.3H7N9亚型禽流感病毒NA基因中氨基酸突变位点在各次疫情的变化情况32表2.4H7N9亚型禽流感病毒HA基因的部分位点与高致病性插入位点的互信息值统计表(MI>0.1)........................................................................................................33表3.1HA基因各种群的序列数量统计......................................................................49表3.2NA基因各种群的序列数量统计......................................................................49表3.3HA基因节段各种群的正选择氨基酸位点......................................................51表3.4NA基因节段各种群的正选择氨基酸位点......................................................51表4.1重点亚型禽流感病毒序列数量统计................................................................65表4.2H5N1亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计......69表4.3H5N1亚型禽流感病毒氨基酸协同突变位点组合分布..................................70表4.4H7N9亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计......72表4.5H7N9亚型禽流感病毒氨基酸协同突变位点组合分布..................................73表4.6“中国群”H9N2亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计(分表1).................................................................................................................76表4.6“中国群”H9N2亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计(分表2).................................................................................................................78表4.7“中国群”H9N2亚型禽流感病毒氨基酸协同突变位点组合分布...................81第III页 军事科学院博士学位论文图目录图1.1甲型流感病毒的结构与复制流程图,引自(Schrauwenetal2014)...............3图1.2各亚型流感病毒的密码子使用偏性变化趋势图,引自(Wongetal,2010)..8图1.3H9N2亚型禽流感病毒在中国的动态传播网络,引自(Jinetal,2014).....11图1.4H5N1亚型禽流感在全球范围内的传播网络,引自(Lietal,2014)............12图2.1H7N9亚型禽流感病毒的HA基因和NA基因的系统发生树.......................22图2.2H7N9亚型禽流感病毒HA基因和NA基因的密码子使用偏性对应分析图23图2.3H7N9亚型禽流感病毒HA基因和NA基因的种群多样性变化曲线图.......25图2.4H7N9亚型禽流感病毒历次疫情中氨基酸进化速率曲线图..........................27图2.5H7N9亚型禽流感病毒HA基因各突变位点的动态变化情况....................28图2.6H7N9亚型禽流感病毒NA基因各突变位点的动态变化情况....................29图2.7重点亚型禽流感病毒MP基因节段的系统发生树........................................34图2.8重点亚型禽流感病毒NP基因节段的系统发生树.........................................34图2.9重点亚型禽流感病毒NS基因节段的系统发生树.........................................35图2.10重点亚型禽流感病毒PA基因节段的系统发生树.......................................35图2.11重点亚型禽流感病毒PB1基因节段的系统发生树.....................................36图2.12重点亚型禽流感病毒PB2基因节段的系统发生树.....................................36图3.1H9N2亚型禽流感病毒的HA基因节段系统发生进化树...............................46图3.2H9N2亚型禽流感病毒的NA基因节段系统发生进化树...............................48图3.3H9N2亚型禽流感病毒密码子使用偏性对应分析三维坐标图......................50图3.4H9N2亚型禽流感病毒“世界群”的系统地理发生学MCC系谱树................52图3.5H9N2亚型禽流感病毒“亚非群”的系统地理发生学MCC系谱树................54图3.6H9N2亚型禽流感病毒“中国群”的系统地理发生学MCC系谱树................56图3.7“世界群”H9N2亚型禽流感病毒传播路线图...................................................58图3.8“亚非群”H9N2亚型禽流感病毒传播路线图...................................................59图3.9“中国群”H9N2亚型禽流感病毒传播路线图...................................................60图4.1H5N1亚型禽流感病毒协同突变氨基酸位点变化示意图..............................68图4.2H5N1亚型禽流感病毒各基因节段间的协同进化关联网络..........................70图4.3H7N9亚型禽流感病毒协同突变氨基酸位点变化示意图..............................73图4.4H7N9亚型禽流感病毒各基因节段间的协同进化关联网络..........................74图4.5“中国群”H9N2亚型禽流感病毒协同突变氨基酸位点变化示意图...............80图4.6“中国群”H9N2亚型禽流感病毒各基因节段间的协同进化关联网络...........81第IV页 军事科学院博士学位论文缩略语表英文缩写英文全称中文名称vRNAviralRNA病毒RNANPNucleoprotein内核蛋白M1MatrixProtein基质蛋白WHOWorldHealthOrganization世界卫生组织AIVAvianinfluenzavirus禽流感病毒HPAIHighlypathogenicavianinfluenza高致病性禽流感LPAILowpathogenicavianinfluenza低致病性禽流感NPAINonpathogenicavianinfluenza非致病性禽流感HAHemagglutinin血凝素蛋白NANeuraminidase神经氨酸酶蛋白PB2PolymeraseBasicProtein2聚合酶碱性蛋白2PB1PolymeraseBasicProtein1聚合酶碱性蛋白1PAPolymeraseAcidProtein聚合酶酸性蛋白RNPRibonucleoprotein核糖核蛋白复合物SASialicAcid唾液酸MMatrix基质基因节段M2Ionchannelprotein离子通道蛋白NSNonstructural非结构基因节段NEPNuclearExportProtein核转运蛋白dSSynonymous同义核苷酸替代速率dNNonsynonymous非同义核苷酸替代速率RELRandomeffectsmodels随机效应似然法FELFixedeffectslikelihoodmodels固定效应似然法GISAIDGlobalInitiativeonSharingAll全球共享流感数据库InfluenzaDataIRDInfluenzaResearchDatabase流感研究数据库MCMCBayesianMarkovchainMonteCarlo贝叶斯马尔科夫蒙特卡洛模型COACorrespondenceAnalysis密码子使用偏向对应分析第V页 军事科学院博士学位论文RSCURelativeSynonymousCodonUsage相对同义密码子使用度MSAMultiplesequencealignment蛋白家族的多序列比对SLACSingle-likelihoodancestorcounting单一祖先计数方法MEMEMixedEffectsModelofEvolution混合效应进化模型方法FUBARDFastUnconstrainedBayesian快速无约束贝叶斯选Approximationforinferring择模型SelectionBSSVSBayesianstochasticsearchvariable贝叶斯随机搜索变量selection选择模型第VI页 军事科学院博士学位论文摘要禽流感病毒属于甲型流感病毒,近年来越来越多的禽流感病毒获得了跨越宿主限制感染人类的能力。其中H7N9亚型禽流感病毒和H5N1亚型禽流感病毒屡次在人类社会中暴发疫情给人类的生命安全带来了越来越大的威胁。尤其是2016年下半年到2017年中在中国暴发的第五次H7N9亚型禽流感病毒疫情感染人数接近其前四次疫情的总和。这不仅给人类社会带来了恐慌还造成了巨大经济损失。此外,有研究显示H9N2亚型禽流感病毒在全世界范围内广泛传播的同时也以重配的方式产生新型禽流感病毒。通过这种方式新型禽流感病毒往往可以从H9N2亚型禽流感病毒中获得跨越宿主限制传播到人类的能力。因此,为了更有效的应对禽流感病毒快速进化而带来的潜在威胁,为了更准确的防控禽流感病毒的传播扩散,为了更及时的监测禽流感病毒的遗传变异。我们围绕禽流感病毒的进化与传播规律这一科学问题,对多种亚型禽流感病毒展开了系统的研究。本文的第一部分工作中,我们以最近暴发的第五次H7N9亚型禽流感病毒疫情为入手点,通过系统发生学分析,密码子使用偏性对应分析等方法证明并发现了第五次疫情与前几次疫情相比在密码子使用偏性和遗传进化规律特征上存在明显差异,在HA基因节段中第五次疫情病毒的进化速率是历次疫情中最高的,此外病毒在HA基因中不仅出现了可以形成高致病性毒株的327K,328R,329T和330A四个氨基酸插入,还出现了R58L,E115R,A123P,K173E,V186I,G326R,E395K和V422M等新型变异。此外我们将几次疫情中H7N9亚型禽流感病毒遗传特征上的动态变化进行了追踪调查。在结合了多方面的研究结果后,我们谨慎的推断出第四次疫情和第五次疫情共同构成了一个“两步”进化过程,即病毒通过第四次疫情的暴发以较高的进化速率在NA基因节段完成了第一步的进化过程,随即病毒在继承了第一步进化过程中已经完成进化的NA基因节段后在HA基因节段又进行快速进化,最终在第五次疫情中完成了第二步的进化过程。此外,我们发现各次疫情中H7N9亚型禽流感病毒都频繁与H9N2亚型禽流感病毒发生重配。因此在本文的第二部分中我们将研究重点转向了H9N2亚型禽流感病毒。使用先分群后建立系统地理发生学重建模型的方法,我们细致的将H9N2亚型禽流感病毒的全球传播网络与路线揭示了出来。在研究中,我们发现H9N2亚型禽流感病毒在进化过程中衍生出了拥有独立进化过程,特定传播地理区域,不同遗传特征的三个种群。并根据每个种群的传播范围将其命名为“世界群”“亚第I页 军事科学院博士学位论文非群”和“中国群”。通过研究我们发现每个种群都有独立的传播线路和传播模式,“世界群”的主要传播动力来源为候鸟迁徙,传播区域最大,受到的正选择压力最小,传播起源为美国,主要的传播中心包括中国香港,日本,韩国,中国大陆,以及荷兰。“亚非群”的主要传播动力来源既有候鸟迁徙也有家禽贸易的影响,传播区域横跨亚非两大洲,受到正选择压力中等,传播起源为日本,主要的传播中心为巴基斯坦和伊朗。“中国群”的主要传播动力来源为家禽贸易,传播区域最小,受到的正选择压力最大,传播起源为中国的广东省和中国香港,主要的传播中心为珠江三角洲和长江三角洲地区。此外结合各种群的进化以及传播规律和不同种群的共同祖先分歧时间结果,我们提出了H9N2亚型禽流感病毒存在这样一种“全球播种,区域性适应进化”的传播进化模式。本文第三部分工作通过协同突变计算方法对重点亚型禽流感病毒的协同进化模式进行了详细而系统的探究。当前对禽流感病毒的进化研究大多着眼于某一基因节段或者某几个氨基酸突变位点。缺乏对不同氨基酸突变位点,不同基因节段之间协同突变以及协同进化情况的研究。本文第三部分研究中通过对H7N9亚型禽流感病毒,H9N2亚型禽流感病毒,H5N1亚型禽流感病毒等分别进行协同进化分析,找出了各亚型禽流感病毒中协同进化的氨基酸突变位点,绘制了各基因节段间的协同进化关系。我们发现H7N9亚型和H5N1亚型禽流感病毒分别拥有5组氨基酸协同突变位点组合,而H9N2亚型禽流感病毒有11组氨基酸协同突变位点组合。此外H5N1亚型禽流感病毒在部分基因节段间存在协同进化关系,而H7N9亚型禽流感和H9N2亚型禽流感病毒的各基因节段间几乎都不存在协同进化关系。本文通过对H7N9亚型禽流感病毒的进化过程研究,对H9N2亚型禽流感病毒的全球传播规律研究以及对重要亚型禽流感病毒的协同进化模式研究,进一步揭示了禽流感病毒在进化和传播过程中呈现出的特征与规律。研究成果不仅加深了对禽流感病毒进化和传播的认识,还对流感病毒的防控与监测具有指导性价值。关键词:禽流感病毒;分子进化;传播网络;系统发生学;H7N9;H9N2;H5N1;系统地理发生学;协同进化第II页 军事科学院博士学位论文AbstractAvianinfluenzavirusisakindofinfluenzaAvirus.Inrecentyears,moreandmoresubtypesofavianinfluenzaviruseshaveobtainedtheabilitytocrossthehostandinfecthumanbeings.Amongthem,H7N9subtypeavianinfluenzavirusandH5N1subtypeavianinfluenzavirusoutbrokefrequentlyinhumansociety,whichhavebroughtmoreandmorethreattohumanlifeandsafety.Inparticular,thefifthoutbreakofH7N9virusinChinahavecausedthemostseriousdamageandthenumberofinfectionswasclosetothesumofthefourpreviousoutbreaks.Thisnotonlybroughtpanictohumansociety,butalsocausedhugeeconomiclosses.Inaddition,studieshaveshownthatH9N2subtypeavianinfluenzavirushasbeenwidelyworldwidespreading,andalsofrequentlyproducingnewsubtypeavianinfluenzaviruswithreassortment.Inthiswaythenew-typeavianinfluenzaviruscanoftenobtaintheabilityfromtheH9N2virustocrossthehostandinfecthumanbeings.Therefore,inordertoeffectivelycopewiththepotentialthreatbroughtbytherapidevolutionofavianinfluenzavirus,weneedtomonitorthegeneticvariationofavianinfluenzainatimelymanner.Wehavecarriedoutasystematicstudyofavarietyofsubtypeavianinfluenzaviruses,focusingonthescientificproblemsoftheevolutionandtransmissionofavianinfluenzavirus.Thefirstpartofthiswork,wetakethefifthepidemicofH7N9subtypeavianinfluenzavirusasthestartingpoint.Throughphylogeneticanalysis,thecodonusagebiasanalysisandotheranalyses,forthefirsttimewefoundthatvirusinthefifthepidemicusedthedifferentcodonusagebiasandhaddifferentgeneticevolutioncharacteristicscomparedwiththepreviousepidemics.InHAgenesegment,theevolutionrateinfifthoutbreaksisthehighest,andthevirusintheHAgenenotonlyhas327K,328R,329Tand330Afouraminoacidinsertionwhichcausedtheemergenceofhighlypathogenicstrains,alsohasnewaminoacidmutationslikeR58L,E115R,A123P,K173E,V186I,G326R,E395KandV422M.Inaddition,wehavetrackedthedynamicchangesinthegeneticcharacteristicsoftheH7N9subtypeavianinfluenzavirus.Incombinationwithotherresults,weinferthatthefourthepidemicandthefifthepidemichaveformeda"two-step"evolutionprocess,inthefirststepofwhichthevirushascompletedtheevolutionoftheNAgenewithhighrateofevolutionthroughthefourthepidemic,theninthesecondstep,thevirushasinheritedNAgenesegmentevolutionafterthefirststepandcontinuedtocompletetheevolutionofHAgeneinthefifthepidemic.Inaddition,wefoundthatthereassortmentbetweentheH7N9virusandtheH9N2virusoccurredineachepidemic.So,inthesecondpartofthisarticle,wehaveshiftedthefocustotheH9N2subtypeofavianinfluenzavirus.第III页 军事科学院博士学位论文WefirstdividedtheH9N2virusintoseveralgroupsaccordingtothephylogeneticreconstructionresultsandthenusedthephylogeographyanalysistoestablishthewholeWorldtransmissionnetworksoftheH9N2virus.Inthestudy,wefoundthattheH9N2subtypeavianinfluenzavirusevolvedthreespecieswithindependentevolutionprocess,specificgeographicareaanddifferentgeneticcharacteristics.Accordingtothegeographicspreadingrange,wenamedthespeciesas“Worldwidelineage”“Asia-Africalineage”and“Chinalineage”.Throughtheresearchwefoundthateachlineagehasindependenttransmissionlineandthemodeofcommunication.Themaintransmissionsourceof“Worldwidelineage|”wasthemigratorybirds.“Worldwidelineage”hasthelargestregionalspreadarea,andtheminimumpositiveselectionpressure.Theoriginofthe“Worldwidelineage”istheUnitedStates,andthetransmissioncentersareincludingtheHongkong,Japan,SouthKorea,HollandandmainlandChina.Themaintransmissionsourceof“Asia-Africalineage”isbothfromthemigratorybirdsandthepoultrytrade.“Asia-Africalineage”hasspreadacrosstheAsiaandAfrica,andthepositiveselectionpressureisinthemediumlevel.TheoriginofpropagationisJapan.ThemaincommunicationcentersarePakistanandIran.Themaindrivingforceof"Chinalineage"ispoultrytrade.Thevirusinthe“Chinalineage”hasthesmallesttransmissionareaandthelargestpositiveselectionpressure.TheoriginofthespreadisGuangdongprovinceandHongkong,China.ThemaincommunicationcentersarethePearlRiverDeltaandtheYangtzeRiverDelta.Inaddition,combinedwiththeevolutionandtransmissionrulesofdifferentgroupsandtheresultsofcommonancestordivergencetimeofdifferentpopulations,wefirstproposedtheH9N2globalsubtypeavianinfluenzavirusthathassucha"globalsowing,regionallyadaptiveevolution"propagationandevolutionmode.Inthethirdpartofthisarticle,wecalculatethecoevolutionmodelofthekeysubtypesavianinfluenzaviruswiththemethodofCOmutationcalculation.Thecurrentevolutionofavianinfluenzavirusismostlyfocusedonacertainsegmentofthegeneorsomeaminoacidmutationsites.Thereisalackofresearchonthesynergisticmutationandcoevolutionofdifferentaminoacidmutationsites,differentsegmentsofthegenesegments.TheH7N9subtypeofavianinfluenzavirus,H9N2subtypeavianinfluenzavirus,andH5N1subtypeavianinfluenzavirusareanalyzedtofindouttheco-evolutionaminoacidmutationbetweenall8segments.Andthenwedrawtheco-evolutionaryrelationshipbetweeneachgenesegment.WefoundthatH7N9subtypeandH5N1subtypeavianinfluenzavirushad5combinationsofaminoacidco-mutationsites,whiletheH9N2subtypeavianinfluenzavirushad11groupsofaminoacidmutationsites.Inaddition,therearesomeco-evolutionrelationshipsbetweenH5N1subtypeavianinfluenzavirusatsomegenestages,butthereisalmostnoco-evolutionrelationshipbetweenH7N9subtypeavianinfluenzaandH9N2subtypeavianinfluenzavirus.ThroughthestudyoftheevolutionprocessofH7N9subtypeavianinfluenzavirus,the第IV页 军事科学院博士学位论文studyoftheglobalspreadnetworksofavianinfluenzavirusH9N2subtypeavianinfluenzavirusandthestudyofco-evolutionmodelinthekeysubtypesavianinfluenzavirus,wehavefurtherrevealedthecharacteristicsandlawsoftheavianinfluenzaviruspresentsintheevolutionandpropagationprocess.Theresearchresultsnotonlydeepentheunderstandingoftheevolutionandtransmissionofavianinfluenzavirus,butalsohaveguidancevalueforthepreventionandcontrolandmonitoringofinfluenzavirus.Keywords:Avianinfluenzavirus;Molecularevolution;Transmissionnetwork;Phylogenetic;H7N9;H9N2;H5N1;Phylogeography;Co-evolution第V页 军事科学院博士学位论文第一章前言1.1禽流感病毒概述流感病毒属于正黏液病毒科,包含八个独立的病毒RNA(viralRNA,vRNA)片段(Segment)。根据病毒内部核蛋白(Nucleoprotein,NP)和基质蛋白(MatrixProtein,M1)的抗原性的差异可以将流感病毒分为甲型(A),乙型(B),丙型(C),丁型(D)四种类型。其中甲型和乙型流感病毒对人类的健康威胁更大并呈现季节性流行,会导致上呼吸道感染,下呼吸道感染,脑膜炎,肺炎等严重的疾病。根据世界卫生组织(WorldHealthOrganization,WHO)报告,每年全球季节性的流感暴发感染约6亿人,而每年因季节性流感而死亡的人数已经上升到了65万人(http://www.who.int/mediacentre/news/releases/2017/seasonal-flu/en/)。其中,甲型流感病毒可以感染的宿主种类繁多,范围广泛,对人类的生命安全造成的危害最为严重[1]。禽流感病毒(Avianinfluenzavirus,AIV)属于甲型流感病毒,根据对鸡的致病性可以分为非致病性禽流感(Nonpathogenicavianinfluenza,NPAI),低致病性禽流感(Lowpathogenicavianinfluenza,LPAI)和高致病性禽流感(Highlypathogenicavianinfluenza,HPAI)三类。并且根据血凝素蛋白节段(Hemagglutinin,HA)和神经氨酸酶蛋白节段(Neuraminidase,NA)抗原性的差异,可以将HA蛋白节段分为16个亚型,NA蛋白节段分为9个亚型[2,18]。禽流感病毒分布于全世界各地,由于活禽贸易,禽畜类养殖以及候鸟迁徙等因素使得禽流感病毒有机会与其他动物源流感进行基因重配和组装,进而获得更高的致病性和传播性,甚至可以获得跨越种间障碍感染其他哺乳动物甚至人类的能力。这种情况的发生不仅给养禽业造成了巨大的经济损害,还有可能引起流感病毒的大流行对人类社会造成灾难性的危害。从历史上看,1918年“西班牙流感”是由H1N1亚型禽流感病毒经由人体适应后,获得了直接感染人的能力进而在人群中广泛传播,最后造成了全球累计死亡人数约五千万人的惨剧[3]。此外,近年来越来越多的禽流感亚型逐步获得了感染人的能力并造成了严重的危害。H5N1亚型禽流感病毒在1997年的香港首次被发现可以感染人,并造成18人感染,6人死亡。2003年和2005年H5N1亚型禽流感病毒再次暴发,并且在第1页 军事科学院博士学位论文感染人群中出现了更高的死亡率,与此同时H5N1亚型禽流感病毒的传播地理范围也再次扩大。通过病毒间的重组和进化,更多的H5亚型的禽流感病毒(H5N2,H5N3,H5N5,H5N6和H5N8)获得了感染人的能力并在世界多地流行[4-10]。目前高致病性禽流感H5N1亚型可在60多个国家分离得到,全球共有860人感染,其中446人死亡,死亡率高达53%。中国疾病预防控制中心在2013年首次报道了人感染禽流感病毒H7N9的病例。在此之后H7N9亚型禽流感病毒在人群大肆流行,到2017年止,已经暴发了5波疫情,感染人数高达1564人,死亡人数610人。其中第五波疫情的暴发造成的损害最为严重,有758人感染,288人死亡(http://www.who.int/influenza/vaccines/virus/201709_zoonotic_vaccinevirusupdate.pdf?ua=1),是历次疫情中感染人数最多,传播范围最广,带来经济损失最为严重的一次疫情。H5N1亚型禽流感病毒和H7N9亚型禽流感病毒对人类的危害日益加剧,越来越多的研究发现,这两种亚型禽流感病毒都与H9N2亚型禽流感病毒的内部功能蛋白节段发生过重组,并且认为H9N2亚型禽流感病毒是可以使其他禽流感病毒获得跨越种间限制感染到人类功能的一个重要基因平台[11-13]。1966年首株H9N2亚型禽流感病毒在美国的火鸡中被分离出来[14],此后该亚型在全球范围传播蔓延开来,1994年在中国广东暴发了首次H9N2亚型禽流感病毒疫情[15],1997年至2002年,相关研究开发并应用了H9N2亚型禽流感病毒的疫苗,在一定程度上遏制了H9N2亚型禽流感病毒的传播,然而2010年后H9N2亚型禽流感病毒发生变异,原有疫苗不能再提供保护,疫情再度暴发。在地方流行和散发的过程中,H9N2亚型禽流感病毒演化出了不同分支,可以感染的宿主也日益增多,除了多种野鸟和家禽外,还可以感染猪,马,猫和狗等哺乳动物甚至在人类中也出现了越来越多的感染病例[16-17]。第2页 军事科学院博士学位论文图1.1甲型流感病毒的结构与复制流程图,引自文献[20]甲型禽流感病毒是具有包膜的单负链RNA病毒,总长度约13kb,可编码16个蛋白(图1.1)。其中聚合酶碱性蛋白2(PolymeraseBasicProtein2,PB2),聚合酶碱性蛋白1(PolymeraseBasicProtein1,PB1),和聚合酶酸性蛋白(PolymeraseAcidProtein,PA),共同构成了RNA聚合酶复合物。PB1编码的蛋白PB1-F2蛋白可以介导细胞凋亡,是甲型流感重要的毒力因子。PA节段可以翻译出PA-N155,PA-N182,PA-X等三个蛋白,其中PA-N155与PA-N182蛋白对病毒复制有重要作用,而PA-X可以抑制宿主细胞基因的表达[18]。血凝素节段(Hemagglutinin,HA)主要编码流感病毒识别宿主细胞表面受体的糖蛋第3页 军事科学院博士学位论文白HA。糖蛋白HA是甲型流感病毒最主要的表面抗原,同时也是宿主免疫反应的主要靶点。主要功能是识别受体进入宿主细胞,介导病毒包膜和宿主细胞内体(Endosome)的膜融合过程,使流感病毒将核酸释放到宿主细胞内。神经氨酸酶(Neuraminidase,NA)蛋白主要功能是通过剪切细胞表面糖蛋白和糖脂末端的唾液酸(SialicAcid,SA)使病毒从宿主细胞中释放,便于病毒的传播。此外NA蛋白也是流感病毒的主要表面抗原。NP附着在病毒的RNA(viralRNA,vRNA)上,主要功能是与聚合酶复合物一起形成核糖核蛋白复合物(Ribonucleoprotein,RNP),构成病毒的复制机器。基质节段(Matrix,M)会编码产生两个蛋白,基质蛋白M1,离子通道蛋白(Ionchannelprotein)M2。非结构(Nonstructural,NS)片段也会编码产生两个非结构蛋白NS1和NS2,NS1蛋白的功能是可以抑制宿主对流感的抗病毒效应,而NS2是一种核转运蛋白(NuclearExportProtein,NEP)[18,19]。血凝素HA与神经氨酸酶NA是甲型流感病毒中和性抗体的主要靶点。其中H1-H16以及N1-N9的所有亚型以各种不同的组合保藏在野生水禽之中。值得注意的是禽流感病毒通常对野禽宿主不致病,这可能是病毒与宿主相互适应的结果,同时这也使得野鸟迁徙成为了不同亚型禽流感病毒重组和传播的主要途径之一,因而野生水禽被认为是甲型流感病毒的保藏宿主和其它宿主中流感病毒的源头[2,18]。1.2禽流感病毒进化动力的相关研究甲型流感病毒可感染的宿主范围广泛,包括人,猪,狗,马,海洋哺乳动物以及禽类。研究表明,流感病毒是一种具有较强宿主特异性的病毒,即一种宿主的流感病毒对另外一种不同宿主的感染是高度受限的[18]。然而,近年来可以跨越宿主限制传播到其他动物中的禽流感病毒亚型越来越多,危害也越来越大。目前禽流感病毒中H5N1,H6N1,H6N6,H7N2,H7N3,H7N7,H7N9,H9N2,H10N7,H10N8等都已经跨过宿主界限感染人类[18,20-22]。这说明尽管流感病毒具有较强的宿主限制性,但是流感病毒可以通过不断进化获得对新宿主的适应性,而其中流感病毒主要的进化动力来源为抗原漂移和抗原转变。1.2.1抗原漂移与抗原转变抗原漂移(Antigenicdrift),指的是基因组发生突变而导致抗原的小幅度变异。在流感病毒中抗原漂移主要发生在其表面糖蛋白HA和NA上,不断积累的第4页 军事科学院博士学位论文抗原漂移会改变病毒的抗原性质进而帮助病毒逃避宿主免疫系统[18,23]。目前流感病毒基因库中积累了大量数据,而这些数据为研究抗原漂移和流感病毒的进化规律提供了基础条件。对人流感H3N2的系统发生学研究(Phylogenetics)表明HA的基因进化树呈现“仙人掌”(Cactus-like)形态,进化树中主干分支代表的优势群体随时间的不断进化而末端短小分支代表的劣势群体则逐渐被选择清洗(Selectivesweep),体现出了H3N2亚型人流感病毒的进化规律中抗原漂移所积累的氨基酸替换存在强烈的淘汰机制[18],更有相关研究通过抗原映射(Antigenicmapping)方法揭示,每3年具有新抗原性的H3N2亚型病毒就会将旧病毒取代,即发生抗原群的跳变(Antigenicclusterjump)[18,24]。而对禽流感病毒H9N2的系统发生学研究则表明,HA的进化树被分为了三个主要的分支(Lineage),每个分支都存在优势群体和劣势群体,这说明H9N2亚型禽流感病毒在进化规律中这样的淘汰机制并不激烈,抗原漂移带来的氨基酸积累使得H9N2亚型禽流感病毒产生了多个不同的优势群体,扩充了其基因多样性,促进了H9N2亚型禽流感病毒的快速进化[25]。抗原漂移为流感病毒的快速变异进化提供了基础。而这种快速进化的遗传特性不单会造成人流感病毒的持续流行,更有可能,为其他动物源性流感病毒如禽流感病毒获得适应人宿主的变异而感染人提供了基础。识别相应宿主细胞的表面受体是流感病毒跨越宿主限制传播的首要条件。有研究表明HA蛋白受体结合区关键氨基酸的突变(如H1中D190E,D225G等)会为禽流感病毒改变所识别的宿主受体类型提供可能条件。如H5N1,H7N9等都在传播过程中进化出了适应人宿主的相关变异[18,26-28]。除了抗原漂移外,流感病毒的主要进化动力还有抗原转变(Antigenicshift)和重配(Reassortment)。由于甲型流感病毒的基因组分为8个相对独立的节段,因此当两种不同亚型的甲型流感病毒感染同一个宿主时,可能会有节段之间的交叉和重组发生,进而形成RNA片段分别来自不同的父代病毒的具有新RNA节段组合的新型病毒。这一过程叫做“重配”或者“重排”,“重配”可能会造成甲型流感病毒表面糖蛋白HA和NA蛋白抗原性产生较大的改变,这样现象称为“抗原转变”。从发生频率看,抗原转变发生的情况远少于抗原漂移,却是甲型流感病毒进化的一个重要的驱动力,是丰富基因多样性的另一个重要机制[29]。前面的章节提到,几乎所有亚型的禽流感病毒都广泛保藏于野生水禽之中,并且对野生水禽并不致病,而携带着不同亚型禽流感病毒的水禽,则是发生频繁抗原转变和重配的绝佳场所。抗原转变可以快速且高效的扩充甲型流感病毒的基因池,目前在水禽中已经发现了超过100种组合的甲型流感病毒,而这同时也为禽流感病毒获得跨宿主传播能力提供了大量且有效的遗传“原料”。在禽类中非致病性的或者低致病性的禽流感病毒一旦与其他亚型流感病毒第5页 军事科学院博士学位论文重配而感染人,往往就会造成流感的大暴发,并且具有高死亡率。这是因为基因片段的重配使得禽流感病毒发生了较大的抗原转变,而人群并不具有这样免疫能力,进而暴发疫情造成对人类生命安全和社会生产的巨大危害。甲型流感病毒因重配而产生的抗原转变在历史上已经造成了4次全球范围的流感大流行,分别是1918年,禽流感病毒和猪流感病毒重配产生的新型H1N1亚型流感病毒造成西班牙大流感,1957年由禽流感病毒和之前的H1N1病毒重配产生的H2N2病毒引发的亚洲流感大暴发,1968年由禽流感病毒PB1节段与H3N2亚型流感病毒重配而产生的新型H3N2病毒引发的香港流感大暴发以及2009年发生了三重重配的H1N1亚型猪流感病毒引发的世界流感大暴发[30-33]。事实上,流感病毒的抗原转变机制不仅过去已经为人类生命安全带来巨大危害还很可能在将来产生新的流感大流行。近年来,越来越多禽流感病毒通过重配获得了跨越宿主感染人的能力,其中H5N1亚型禽流感病毒在1997年首次被监测到感染人类,之后十数年间引发了更多的感染和死亡,根据系统发生学分析,感染人的H5N1正是通过与H9N2亚型禽流感病毒重配而发生抗原转变,进而获得了跨宿主的能力[55]。2013年,H7N9亚型禽流感病毒首次出现了感染人的疫情,之后的4年内连续发生了五次疫情,通过系统发生学分析,该H7N9亚型禽流感病毒除了HA和NA蛋白节段,其他6个蛋白节段都分别来自于多种不同的流行于中国的H9N2亚型禽流感病毒[12]。重配是流感进化,尤其跨越宿主限制性,甚至产生大流行的重要机制。但有关甲型流感病毒重配及抗原转变的基本规律仍然不十分清楚,比如重配的条件和限制性,怎样的重配可以引起抗原转变进而获得跨宿主能力,重配对不同亚型的流感病毒的毒力致病性影响等科学问题。1.2.2正选择压力与密码子偏性如果一个氨基酸位点的非同义(Nonsynonymous,dN)核苷酸替代速率显著地超过其同义(Synonymous,dS)核苷酸替代速率,那么我们称这个位点受到正选择压力作用(Positiveselectionpressure),反之为负选择压力作用(Negativeselectionpressure)[34].在甲型流感病毒的进化过程中如果其受到了负选择压力的作用,那么将导致使得该位点氨基酸改变的突变被清除.如果病毒受到的是正选择压力作用,则变异体倾向于替代原来的种群,即新产生的氨基酸突变会有取代原有氨基酸的趋势,也就是说,正选择压力作用有利于病毒的生存。前面章节提到,甲型禽流感病毒的主要进化动力是抗原漂移和抗原转变,而影响甲型流感病毒进化方向的因素之一就是正选择压力的作用[34]。有研究对1997年至2004年从鸟类和人类体内分离得到的病毒HA1序列进行了正选择压第6页 军事科学院博士学位论文力分析,他们发现正选择压力作用于2001,2003和2004年的HA1基因,以及1997年的PB2基因和2004年的NS1基因[35]。此外还有研究表明作用于人的H3N2亚型流感病毒的HA蛋白段在正选择压力的作用下提高了病毒的生存能力[34]。而对2003年到2007年的H5N1亚型的禽流感病毒进行了正选择分析的研究发现,H5N1亚型禽流感病毒受到的正选择压力可能有利于其扩大自己的传播区域[37]。此类的研究还有很多,这些研究结果说明正选择压力作用广泛的存在于流感病毒的各个亚型之中,而且正选择压力作用的时间和作用的基因节段也各有差异。此外在正选择压力的作用下,流感病毒都获得了更有利于自己生存的能力。在病毒的进化过程中基因突变,基因重组为进化提供了丰富的原材料和进化动力,产生了丰富的基因型,使病毒有可能获得各种各样的抗原特性和能力,然而并不是所有的突变带来的特性都适合于病毒的生存和进化。因此病毒的进化会受选择压力的作用去除掉不适合生存的突变,保留可以提升生存能力的突变,进而有目的的向某一特定方向发展。当病毒面临负选择压力时,病毒的会保持原有的有利于自己生存的基因,清洗和淘汰掉所有改变该基因的突变。而在正选择压力下,病毒会选择保留有利于自己生产的突变,并对这种有利于生存的突变进行积累,进而产生更有利于生存的新的病毒类型。正选择压力分析的方法有很多,但是大体上可以分为三类:计数方法[38,39](Countingmethod)、随机效应似然法[40-42](Randomeffectsmodels,REL)和固定效应似然法[43-45](Fixedeffectslikelihoodmodels,FEL).通过以上这些方法,研究人员可以检测到病毒在进化过程所面临的正选择压力大小,正选择压力作用的蛋白和位点,进而进一步找到有利于病毒生存的突变和可以充当药物靶点的保守位点,最后探究出病毒的进化规律并且对病毒进化方向做出一定程度的预测。正选择压力分析的主要对象就是密码子,而密码子使用偏性的改变也与病毒的进化有关[56]。编码同一种氨基酸的不同密码子被称为同义密码子,而同义密码子在生物体内并非随机使用[46],不同物种之间或同一物种内不同基因在编码氨基酸时会倾向使用某些特定的密码子,这种现象被称为密码子使用偏性。普遍认为,病原微生物在同一种宿主间传播的时间足够长以后,为了更好的利用宿主内的资源和提高自身的生存能力,病毒的密码子使用偏性(Codonusagebias)会与宿主的密码子使用偏性趋同,即病毒编码氨基酸时会倾向于使用该宿主编码同种氨基酸所使用的密码子[47]。因此病毒密码子使用偏性的改变也会影响病毒本身的进化方向。此外,有研究发现随时间的推移和进化过程的推进,不同亚型的流感病毒的密码子使用偏性呈现出了向某一方向定向进化的现象(图1.2)。这说明流感病毒的密码子使用偏性正在随着病毒本身的进化而有方向的改变着[48]。第7页 军事科学院博士学位论文图1.2各亚型流感病毒的密码子使用偏性变化趋势图,引自文献[86]禽流感病毒通过抗原漂移和抗原转变等机制可以持续不断进化,甚至跨越宿主屏障,而这极大的威胁着公共卫生安全和人类健康。因此,探索禽流感病毒的进化规律显得尤为重要。第8页 军事科学院博士学位论文1.3禽流感病毒传播规律的相关研究1.3.1禽流感病毒的主要传播方式禽流感病毒的传播方式主要分为两类,一类是水平传播,一类是垂直传播。水平传播是禽流感病毒传播的主要传播方式,可以细分为直接传播和间接传播。直接传播指的是易感禽类与已感染病毒禽类直接接触而被感染的传播方式。至于间接传播指的是易感禽类通过与感染病毒禽类的污染物如粪便,饮水等间接接触而导致感染禽流感病毒的传播方式。事实上禽流感病毒存在于感染禽的各个器官之中,可以随着眼鼻口的分泌物及粪便排出体外,并且可以长时间存活,从而易感染健康的禽类,进而为病毒的水平传播提供便利。禽流感病毒在禽类中广泛传播的主要动力之一就是野生水禽的大规模迁徙[35,36]。前面章节提到野生水禽是禽流感病毒的保藏宿主,几乎所有亚型的禽流感病毒都可以从野生水禽中分离出来,而这给病毒的水平传播创造了良好的基础。大规模迁徙中,野生水禽与其他家禽甚至其他哺乳动物直接接触机会增多,与此同时,还有可能在各处遗留含有病毒的粪便和分泌物,进而大大增加了禽流感病毒的水平传播的范围和几率,同时也给疾病防控带来巨大麻烦。此外活禽养殖和禽类制品流通也是禽流感病毒传播的主要途径。甲型禽流感病毒的垂直传播指的是病毒由种禽通过种蛋传播给下一代的方式。这种传播在流感病毒传播中比较罕见,2005年H5N1亚型禽流感病毒首次被证实可以发生垂直传播,无独有偶,2011年又有研究证明H1N1亚型禽流感病毒可以发生垂直传播。最新的研究中也证明了H9N2亚型禽流感病毒在种鹅也可以发生垂直传播[49]。禽流感病毒在世界范围内广泛传播,传播手段多样,其中更是以野生水禽的迁徙为主要传播动力,虽然目前相关研究已经探知候鸟迁徙的路线,但是在迁徙路线中野生水禽会在何时何地将何种亚型的禽流感病毒传播给家禽或者其他动物尚不可知。不同亚型禽流感病毒适宜生存的地理位置和地理传播路线是否也存在差异也不明确。如果可以探究出禽流感病毒在地理上的传播路线图或者探究出禽流感病毒的传播规律,则可以有效的为疾病防控和监测提供帮助和指导。1.3.2甲型禽流感病毒的系统地理发生学研究系统地理发生学(Phylogeography)是一个新兴的科研领域,关注的是物种在地理谱系中的分布和迁徙状况。这个方法依赖于物种的序列信息及其所生存的地理区域信息。通过数学模型将两者建立联系并通过建立分子钟模型和进化速率第9页 军事科学院博士学位论文估算出不同地理区域的同一物种的最近共同祖先可能存在于何时何地进而探究物种的迁徙路线。病原微生物的进化研究中,对系统地理发生学方法的应用越来越多,特别是以RNA为主要遗传物质的病毒领域。RNA病毒往往拥有较短的序列信息和较快的进化和传播速率,更适合使用系统地理发生学来探究病毒的进化史以及传播路线[50-52]。在禽流感病毒的进化研究中已经有很多研究者通过系统地理发生学的方法对不同亚型的禽流感病毒传播规律进行了探究。2014年靳远等人通过系统地理发生学方法对H9N2亚型禽流感病毒在中国的传播规律进行了研究[53]。研究发现,H9N2亚型禽流感病毒在中国的传播源头为广东省和香港特别行政区,在1980年以前传入我国的H9N2亚型禽流感病毒仅在中国香港内传播并没有向外省扩散。而在1980-1990年间,H9N2亚型禽流感病毒从香港特别行政区传播到了广东省,1990年-1995年间,该亚型禽流感病毒以广东省为第一传播中心继续北上,传播到了江苏以及河北等地。1995年以后H9N2亚型禽流感病毒的传播范围进一步扩张,以珠江三角洲地区为第一传播中心,以长江三角洲区域为第二传播中心向中国大陆各个地区广泛传播开来(图1.3)。此研究中不仅揭示了H9N2在中国的主要传播路线还指出了H9N2亚型禽流感在中国的主要传播中心,为疾病防控和监测提供了依据和帮助。第10页 军事科学院博士学位论文图1.3H9N2亚型禽流感病毒在中国的动态传播网络,引自文献[53]此外还有研究应用系统地理发生学方法对H5N1亚型禽流感病毒在世界的传播路线和规律进行了探索[54]。此研究收集了全球各个区域的H5N1亚型禽流感病毒的序列,并根据序列所处在的地理区域信息将这些序列划分为了9类,分别是欧洲,中西亚,非洲,西伯利亚,南亚,东南亚,中国大陆,中国香港以及韩日地区。通过系统地理发生学的分析,该研究探究出了H5N1亚型禽流感病毒在这九个区域间的传播效率,传播方向以及传播路线。研究中发现西伯利亚地区是H5N1亚型进行全球传播的核心区域,为传往世界各地的H5N1亚型禽流感病第11页 军事科学院博士学位论文毒充当中转站的作用(图1.4)。图1.4H5N1亚型禽流感在全球范围内的传播网络,引自文献[54]以上研究都表明,禽流感病毒的系统地理发生学研究具有重大科学意义并且对疾病防控具有深远的指导价值。从目前的研究中可以发现不同亚型的禽流感病毒的传播路线并不相同,不同亚型的禽流感病毒呈现的传播规律也有所差异,不同亚型禽流感病毒的传播规律之间是否有所联系也尚未明确。在禽流感病毒的进化与传播规律这一领域仍有很多科学问题需要解答。1.4论文的主要工作和创新点1.4.1本文的相关研究方法与科学问题禽流感病毒复杂的动态进化过程(抗原漂变,抗原转变)持续不断的造成新型禽流感病毒跨越宿主限制感染人类,如H5N1,H7N9,H10N8等,给人类的生命安全带来了严重威胁。近年来,不断暴发的禽流感疫情在带来危害的同时也不断提醒我们随时可能会发生新的流感大流行事件。为应对将来可能会出现的危机,当下我们能做的就是不断增加对禽流感病毒进化和传播规律的认识,进而帮助我们更好的预防和治疗。理解病毒进化和传播规律是进行防治的关键。目前,研究人员通过长期的监第12页 军事科学院博士学位论文测已经从各类宿主中分离出了大量的流感病毒毒株,构成了相对充分的原始研究样本。而高通量测序技术的发展又可以将这些原始研究样本转化为大量可用于分析的流感病毒全基因组序列数据[57-59],这为我们理解病毒的进化提供了基础条件。目前,越来越多的流感病毒数据库被建立,如GenBank建立了专门的流感病毒资源数据库(NCBIInfluenzaVirusResource,http://www.ncbi.nlm.nih.gov/genomes/FLU/FLU.html)[60];全球合作建立了全球共享禽流感数据倡议组织(GlobalInitiativeonSharingAllInfluenzaData,GISAID,http://platform.gisaid.org/)[61];另外还有流感研究数据库(InfluenzaResearchDatabase,IRD,http://wwww.fludb.org),OpenfluDB等在线资源[18]。系统发生学研究对重构流感病毒进化起源,追溯流感病毒的进化历程,以及传播扩散等规律至关重要。以分子进化理论的发展为基础,我们的技术方法和研究范畴也不断得到丰富和扩展,比如经典的最大似然法在进化分析上的应用范围不断扩大[62],除构建系统发生树外,还能模拟祖先序列重建,估算病毒的进化速率,计算病毒正选择作用压力等。基于贝叶斯马尔科夫蒙特卡洛(BayesianMarkovchainMonteCarlo,MCMC)[63]的“溯祖”分析理论和工具[64]让我们可以以分子钟模型为基础构建病毒的进化系谱树(Genealogy),还可以模拟估计病毒祖先的分歧时间,并提供与系统发生学推断不确定性相关的统计学支持。系统地理发生学模型是一种新型的生物信息学方法。通过对病毒传播地理路线的模拟估计,该模型已经帮助研究人员解释了H5N1亚型禽流感病毒的起源地理扩散规律,并揭示了H5N1亚型禽流感病毒的全球传播网络[63]以及H3N2亚型流感病毒季节性流行等进化规律[64]。协同进化分析是以信息论为基础的一种新型的生物信息学分析方法[65,66]。该方法通过计算不同氨基酸突变位点之间发生突变的协同关联程度,来确定病毒各氨基酸位点间的协同突变关系,进而可以用来探究病毒各基因节段之间的协同进化关系。大量公开可用的禽流感病毒数据与各种生物信息学进化分析方法为我们重新审视禽流感病毒进化中的重大科学问题提供了新的可能。利用这些数据和方法,我们能够深入探究禽流感病毒的起源,变异过程,传播规律以及进化模式,从而指导禽流感病毒的监测与防控。本文通过系统发生学分析,动态进化过程追踪分析,系统地理发生学分析,协同进化分析,分子进化理论等技术方法和理论,探究禽流感病毒的起源与遗传特征的变异,追踪和构建禽流感病毒的进化过程,揭示禽流感病毒的传播规律以及理解禽流感病毒协同进化模式等科学问题。第13页 军事科学院博士学位论文1.4.2论文内容的主要结构本论文以禽流感病毒基因序列为主要研究对象,通过运用多种经典以及新型生物信息学方法,对禽流感病毒的进化过程,遗传变异,传播规律以及协同进化模式进行了详细而系统的探究。第二章,我们以最近暴发的第五次H7N9亚型禽流感病毒疫情为入手点,试图通过系统发生学分析,密码子使用偏性对应分析,种群多样性变化分析以及进化速率估算等方法证明并找出第五次疫情与前几次疫情相比在遗传特征上存在的差异以及获得的新型变异。在探究过程中,我们不仅发现了第五次疫情存在新型变异和新的遗传特征,还发现了第四次疫情与第五次疫情存在密切且复杂的关系。在进一步验证过程中,我们结合了系统发生学分析结果,种群多样性变化,进化速率分布,氨基酸改变情况等多方面结果,推断出第四次疫情和第五次疫情共同构成了一个“两步”进化过程。这种进化过程在之前的研究从未被发现过。在进行H7N9亚型禽流感病毒基因重配分析时,我们发现H7N9亚型禽流感病毒频繁与H9N2亚型禽流感病毒发生重配。因此在第三章中我们将研究重点转向了H9N2亚型禽流感病毒。第三章,本章重点对H9N2亚型禽流感病毒的全球传播规律进行了系统的探究。并创新性的使用先分群后建立系统地理发生学重建模型的方法,细致的将H9N2亚型禽流感病毒的全球传播网络与路线揭示了出来。在本章研究中,首先通过系统发生学分析,发现H9N2亚型禽流感病毒在进化过程中衍生出了拥有独立进化过程,特定传播地理区域,不同遗传特征的三个种群。并根据每个种群的传播范围将其命名为“世界群”“亚非群”和“中国群”。并对每个种群的传播线路和传播模式进行了探究。第四章,本章中试图用协同突变方法对重点亚型禽流感病毒的协同进化模式进行详细而系统的探究。除了前面章节研究的H7N9亚型禽流感病毒,H9N2亚型禽流感病毒外,我们还重点研究了同样有着广泛的传播地理范围以及同样可以在人类中暴发疫情的H5N1亚型禽流感病毒。我们试图通过计算禽流感病毒中各氨基酸突变位点的协同突变关联程度,找出协同进化的氨基酸突变位点,进而绘制各基因节段间的协同进化关系,分析比较禽流感病毒协同进化模式的相关规律,尝试将病毒协同进化模式与重配限制性建立联系。本文的创新点主要体现在如下几个方面,第一,我们在H7N9亚型禽流感病毒的进化过程研究中,不仅发现了第五次疫情中病毒在各个方面都表现出了不同以往的遗传特征,还发现了第四次疫情和第五次疫情共同构成了一个特殊的“两步”进化过程,即病毒通过第四次疫情的暴发在NA基因节段完成了第一步的进第14页 军事科学院博士学位论文化过程,随即NA基因已经完成进化的病毒在第五次疫情中在HA基因节段又进行快速进化,完成了第二步的进化过程。这样一种特殊的进化过程很可能使得病毒获得了高传播性和高致病性。第二,我们在H9N2亚型禽流感病毒的全球传播规律研究中。我们对系统地理发生方法进行了改进和创新。不同于经典系统地理发生学,我们首先充分考虑了病毒的进化关系和地理分布,考察病毒在进化过程中是否已经衍生出了不同的种群。在对H9N2亚型禽流感病毒的进化分析中,我们发现了病毒在传播进化过程中已经分为了拥有独立进化过程,特定传播区域,不同遗传特征的三个种群。其次为了使得系统地理发生学分析结果更加准确,降低种群因素对传播线路估算的干扰,我们分种群分别进行系统地理发生学模型重建。最后,为了使得模拟结果更接近事实更加可靠,我们对数据集共进行了280次重采样,并进行了560次独立重复试验。之后对每条模拟估算出来的传播路线,我们还通过贝叶斯随机变量选择模型选取了后验概率较高的传播路线,最后在绘制传播网络时,我们还与其他流行病学研究结果相互印证确保传播路线准确可靠。此外,我们还发现了H9N2亚型禽流感病毒存在一种“全世界播种,区域性进化”的传播进化模式。第三,在重要亚型禽流感病毒的协同进化模式研究中,我们应用并改进了新型生物信息学方法,采用“归一化”互信息计算模型,对H7N9,H9N2,H5N1的协同进化模式进行了探究。不仅揭示了禽流感病毒内部氨基酸位点的协同突变关系,而且还发现了不同亚型禽流感病毒的协同进化模式存在差异。全文围绕禽流感病毒的进化与传播规律这一大命题,在起源追溯,进化过程,遗传特征变异,传播规律网络,协同进化模式等各方面展开了详细而系统的研究。研究结果对全面深化认识禽流感病毒起源,进化,变异与传播等各方面规律都有着指导性意义。第15页 军事科学院博士学位论文第二章H7N9亚型禽流感病毒在中国第五次流行的进化特征分析2.1研究背景H7N9亚型禽流感病毒的主要宿主是家禽和野生水禽,最早在1988年分离于美国的火鸡中。此后H7N9亚型禽流感病毒陆续在北美洲各地的禽类中被发现。21世纪初H7N9亚型禽流感病毒陆续在亚欧各国被分离到。2009年在中国的江西省,H7N9亚型禽流感病毒在野鸭中被分离出来,之后开始了在中国的传播[67,68]。2013年3月30日,在中国一名87岁的男性体内分离到了H7N9亚型禽流感病毒,这是全球首例H7N9亚型禽流感病毒跨越宿主限制感染到人的报道。之后很快,以长江三角洲地区为传播中心,在中国暴发了首次H7N9亚型禽流感病毒疫情。首次H7N9亚型禽流感病毒疫情从2013年3月30日持续到2013年5月21日,疫情以长江三角洲地区为传播中心短短两个月扩散到了中国的18个省和直辖市,感染人数135人,其中44人死亡。然而,就在人们还没有意识到这种新型的可以感染人的禽流感病毒究竟会给人类的生命安全带来多大威胁时,在首次疫情暴发之后的几个月,第二次全国范围内的H7N9亚型禽流感病毒疫情就这样卷土重来。第二次疫情开始于2013年8月结束于2014年6月,持续时间更长,传播范围更广,感染人数高达315人,死亡人数121人。此后H7N9亚型禽流感病毒,在中国人群中呈现出季节性流行的趋势,几乎每年的秋季到第二年的夏季,都会暴发一次疫情。然而,随着医疗水平的进步和对H7N9亚型禽流感病毒的研究逐渐深入,第三次和第四次H7N9亚型禽流感病毒感染的人数逐渐下降,流行趋势逐渐减缓。第三次疫情暴发感染人数173人,第四次疫情暴发仅感染116人。截止到2016年6月,在中国一共暴发了4次H7N9亚型禽流感病毒疫情,感染总人数806人,死亡总人数322人,死亡率高达40%[69]。然而,让人始料未及的是,2016年10月开始,H7N9亚型禽流感病毒在中国暴发了第五次疫情。此次疫情中,感染人数高达767人,死亡人数290人,几乎是前四次疫情暴发所感染的人数总和。此次疫情来势汹汹,是全球历次H7N9亚型禽流感病毒疫情中暴发最为快速,传播范围最广,感染人数最多,造成经济损失最为严重的一次[70-73]。第16页 军事科学院博士学位论文在前面的章节中,我们提到禽流感病毒根据在鸡宿主体内的治病情况,可以分为高致病性禽流感,低致病性禽流感和非致病性禽流感三类。在前四次暴发的疫情中,H7N9亚型禽流感病毒始终表现为低致病性。然而在第五次疫情暴发中,却有高致病性H7N9亚型禽流感病毒被持续发现[71]。根据WHO的最新报道,在第五次疫情中,高致病性H7N9亚型禽流感病毒在28位病人身上被分离出来,存在地域横跨中国6个省市。有研究表明,在中国暴发的前四次疫情中,H7N9亚型禽流感病毒的基因遗传特征并没有发生本质变化[74]。然而在第五次疫情中,不仅H7N9亚型禽流感病毒的传播能力大大加强,而且还出现了高致病性禽流感毒株。这说明H7N9亚型禽流感病毒正在快速进化,而伴随着这快速进化而来的是对人类生命安全的更大的威胁。那么新发H7N9病毒在基因遗传特征上究竟发生了怎样的变化,又是什么样的改变使得H7N9亚型禽流感病毒中进化出了高致病性毒株,以及H7N9亚型禽流感病毒正在经历怎样的动态进化模式都是当下急需探究的科学问题。为了探究以上科学问题,我们选取了H7N9亚型禽流感病毒的两个表面蛋白,血凝素蛋白和神经氨酸酶蛋白作为探究进化特征的研究对象。血凝素蛋白(HA)主要编码流感病毒识别宿主细胞表面受体的糖蛋白HA。HA是甲型流感病毒表面丰度最高的糖蛋白,是流感病毒最主要的表面抗原。主要功能是负责识别受体进入宿主细胞,并参与介导病毒包膜和宿主细胞内体的膜融合过程,进而使流感病毒可以将核酸释放到宿主细胞内,是影响病毒传播能力的主要因素。神经氨酸酶(NA)蛋白负责将细胞表面糖蛋白或者糖脂末端的唾液酸(SA)剪切掉,从而使病毒能够从宿主细胞释放,是影响病毒逃脱宿主免疫能力的主要因素[18]。2.2材料与方法2.2.1H7N9亚型禽流感病毒序列收集和多序列比对(SequenceAlignment)目前随着测序技术的发展,越来越多的病毒基因数据被收集起来制作成可供研究者使用的数据库。其中GISAID数据库是当前最全的流感病毒基因数据库之一[75]。在本研究中,我们从GISAID基因数据库中下载了所有可以获取到的H7N9亚型禽流感病毒的HA基因节段序列和NA基因节段序列。由于测序水平和测序标准的不同,这些数据中有很多不适合作为研究对象的低质量数据,因此在收集所有序列数据之后,我们对数据进行了筛选和整理。首先去除了基因序列第17页 军事科学院博士学位论文长度不足全长95%的序列,这样可以避免不完整数据对整个实验结果的影响。其次,我们将中国的H7N9数据筛选出来作为独立数据集,并通过采样时间和相关基因数据说明文件对这些序列的序列号,宿主,地点,时间,属于第几次疫情等信息进行标注,经过筛选后共有702株HA基因序列和626株NA基因序列可用于研究。最后我们按照序列所属的疫情暴发序数进行分类,形成Epidemic_1,Epidemic_2,Epidemic_3,Epidemic_4,Epidemic_5等五个数据集。此外为了分析H7N9亚型禽流感病毒与其他亚型禽流感病毒的重配情况,我们还通过BLAST(Basiclocalalignmentsearchtool)[76]工具收集了所有与H7N9亚型禽流感病毒内部节段基因序列同源性较高的其他亚型禽流感病毒序列。在多序列比对方面,通常被用到的工具是MEGA软件和MUSCLE软件[77,78],在本研究中,我们将各个节段的编码区序列用MUSCLE软件分别进行了多序列比对,使得相同节段的所有序列都被对齐,这样有利于我们接下来做的系统发生学分析。表2.1H7N9亚型禽流感病毒各次疫情的序列数量统计疫情代表序列HA基因节段序列数量NA基因节段序列数量第一次疫情A/Anhui/1-YK/RG202/2013123100第二次疫情A/Guangdong/24997/2013277236第三次疫情A/Zhejiang/34/2014152139第四次疫情A/Fujian/1/20162829第五次疫情A/Fujian/8/20171221222.2.2H7N9亚型禽流感病毒的系统发生学分析(Phylogeny)系统发生学分析是分析病毒进化关系的重要手段。通过系统发生学分析,我们可以从基因层面观察到不同毒株之间的进化关系和整个种群的发展趋势。一般来说系统发生学分析的方法有很多种,包括最大似然法,贝叶斯方法等[79,80],本实验中采取的是贝叶斯方法。通过系统发生学分析工具MrBayes可以构建病毒的系统进化树,在构建过程中,我们调整了MrBayes工具的参数,使其进行一千万次的重复迭代取样,用以保证最后数据的稳定性和准确性。然后将生成的20000棵系统进化树的前2000棵剔除(Burnin),防止最开始抽样的不稳定数据影响结果。然后将剩余18000棵进行合并生成最终的系统发生树[81]。对系统进化树进行分析和观察时,需要给树形确定树根的位置,为了得到最合理的树根位置,我们使用工具TempEst对树形进行整理确定了最佳的树根位置。最后采用FigTree工具对生成的树形进行可视化观察和信息标注[82,83]。第18页 军事科学院博士学位论文2.2.3H7N9亚型禽流感病毒的密码子使用偏向对应分析(CorrespondenceAnalysis,COA)相对同义密码子使用度(RelativeSynonymousCodonUsage,RSCU)是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率[84]。密码子偏性分析通常会计算序列的RSCU值来判断序列的偏好性。然而这种方法会对每一个序列生产几个参数,一旦序列的数量过多,则很难从中探寻出密码子使用的规律。因此我们引入了另外一个方法密码子使用偏向的对应分析。对应分析是基于序列的RSCU值,通过欧拉平方距离公式,将两个序列间密码子使用的相对偏性转换成三维空间中的距离进而直观的观察到不同序列间密码子使用的相似程度[48,86]。在本研究中,我们利用CodonW工具对H7N9亚型禽流感病毒的HA节段和NA节段进行了密码子使用偏性的对应分析[85]。2.2.4H7N9亚型禽流感病毒的种群多样性动态变化分析(Populationdynamics)与氨基酸进化速率分析(Substitutionrates)在计算H7N9亚型禽流感病毒的种群多样性动态变化和氨基酸替换速率时,我们使用了BEASTv1.8.0工具中的贝叶斯MarkovChainMonteCarlo(MCMC)采样方法。此方法是通过不断的随机模拟过程,对系统发生树的拓扑结构,进化模型,分支枝长等参数进行抽样和计算,通过足够长的时间和迭代次数模拟得到带有祖先预测节点和分歧时间的系统发生树以及氨基酸进化速率等参数。采用此工具计算时要选定一系列参数和模型,在本实验中,我们为了进行分歧时间的估计,在计算过程中选择应用了uncorrelatedlog-normalrelaxedclock分子钟模型,该模型假设基因序列在进化过程符合一个分子钟,但系谱树的不同分支可以采用不同分子钟速率进行进化,而且所有分支上的分子钟应该符合一个对数正态分布[18,63]。为了分析种群多样性变化还需要选择一个溯祖模型,我们选择使用了Bayesianskyline溯祖模型,此模型中的Piecewiseconstant模型可以用来描绘H7N9亚型禽流感病毒流行期间的种群大小的动态变化过程。此外为了使得最后的参数稳定,我们选择的迭代次数是1亿代。第19页 军事科学院博士学位论文2.2.5H7N9亚型禽流感病毒的氨基酸替换状况统计与互信息计算分析为了观察到H7N9亚型禽流感病毒在每次疫情暴发中获得了哪些新的突变以及几次疫情之间的关系,我们对进行了多序列比对分析后的HA节段序列和NA节段序列分别按照时间先后的顺序排序。然后分别对这两个序列数据集中重复的序列进行去冗余处理,即相同时间相同序列的数据仅随机保留一条。然后分别对这两个数据集进行密码子翻译得到两个氨基酸序列集。使用Python编程语言,对每个氨基酸序列集中每个位点是否发生突变进行统计。并保留发生了突变并且突变率超过5%的位点形成新的数据文件。然后对数据文件进行统计并画出氨基酸替换状况变化图。最后得到每个位点不同疫情暴发时的突变情况。第五次暴发的H7N9亚型禽流感病毒出现了高致病性毒株。研究表明,高致病性毒株较低致病性毒株在HA蛋白段多出了四个氨基酸。为了探究其他位点是否与高致病性相关,我们采用了互信息的方法计算了每个位点与高致病性毒株插入的位点的相关协同性。互信息方法是信息论中重要的计算两个变量之间相关性的方法。在生物领域,常常用来寻找基因中相互协同进化的位点。如果两个位点间计算的MI值很高,则说明它们之间的变异是关联协同的,如果MI值几乎为0,则说明两个位点的突变进化是独立的。MI值的计算是基于一个蛋白家族的多序列比对(Multiplesequencealignment,MSA)中每列所出现的氨基酸分布,通过计算比对两个不同列的氨基酸分布的关联性就能量化两氨基酸位点之间的关联性[65]。根据这个原理,我们计算时MI定义为:(2.1)H(X)是序列比对中第X列的熵值,p(x)是第X列出现的氨基酸x的观察频率。(2.2)MI(A,B)是序列比对中第A列和第B列的互信息值。互信息值MI是一个相对值,任何一个位点X在计算与位点A的相关性时,MI(A,X)小于等于MI(A,A),但是MI(A,A)并不等于1,因此有时为了便于比较会将MI值进行归一化处理。在本章节中,我们仅需要比较高致病性位点与其他位点的协同性,因此不必对MI值做归一化处理。而在本文后面的章节中,当我们探究所有位点间的协同性时,会详细介绍MI值的归一化处理。第20页 军事科学院博士学位论文2.3结果分析2.3.1H7N9亚型禽流感病毒的基因进化特征为了探究H7N9亚型禽流感病毒各个毒株之间的进化,我们利用收集到的所有HA节段序列和NA节段序列分别通过贝叶斯方法构建了H7N9亚型禽流感病毒HA基因系统发生树和NA基因系统发生树。一般来说,系统发生树的树根的选取直接影响到对整棵系统发生树的观察和分析,因此我们利用TempEst工具,结合分子钟模型和序列的采样时间,将序列Minghang/S01/2013序列定做系统发生树的树根。为了便于探究病毒在五次疫情之间的进化关系,我们又将系统发生树的分支结点进行信息的染色和标注(图2.1)。从系统发生树中我们可以看到,第五次暴发疫情的毒株分别处于三个比较大的分支中,而根据这三个分支中毒株所在地理位置的分布,我们发现这三个分支中毒株主要集中在长江三角洲地区和珠江三角洲地区。这说明第五次暴发的疫情是起源于两大三角洲地区,而第五次的毒株所继承的基因型有三种起源。而其中新出现的高致病性H7N9亚型禽流感毒株产生于珠江三角洲地区。系统发生树中根据枝端节点到根节点所通过的最短路径而经过的中间节点个数被称为枝端节点的层数。在进化关系中,同一节点生长出的层数相同的枝端节点的进化关系我们一般认为是兄弟关系。而同一祖先节点生长出来层数不同的枝端节点,则层数高的节点是层数低的节点的子代。从H7N9亚型禽流感病毒的HA节段系统发生树和NA节段系统发生树中,我们可以看到,第二次暴发疫情的病毒毒株都是从第一次暴发疫情的病毒毒株分支中生长出来的。这说明第二次暴发疫情的病毒是第一次暴发疫情的病毒的直接子代,亲缘关系比较近。通过进一步观察,第二次暴发疫情的毒株在系统发生树上迅速生长并产生了很多新的分支,这说明第二次暴发的疫情,给H7N9亚型禽流感病毒进化带来了巨大的改变,不仅传播范围广泛,而且通过抗原漂移和抗原转变等方式产生了很多新的基因型,极大的丰富了H7N9亚型禽流感病毒的基因库。第21页 军事科学院博士学位论文第三次暴发疫情的毒株产生于进化树的多个分支之中,但是都是从第二次暴发疫情的毒株所在的分支中生长出来的,这说明第三次暴发疫情的毒株是第二次暴发疫情的毒株的子代,而且第二次暴发疫情而产生的H7N9亚型禽流感病毒的新型分支几乎都被第三次暴发疫情的病毒所继承和延续。这样的典型的“父子关系”延续,有利于提高H7N9亚型禽流感病毒生存能力。图2.1H7N9亚型禽流感病毒的HA基因和NA基因的系统发生树第四次和第五次暴发疫情的H7N9亚型禽流感病毒的毒株的进化关系比较特殊。从系统发生树上看,第四次暴发疫情的毒株既有由第三次疫情毒株分支中生长出来的,也有从第五次疫情毒株分支中生长出来的。相似的是第五次暴发疫情的毒株所在的分支中既有第三次疫情毒株分支的子代又有第四次疫情毒株分支的子代。这说明第四次和第五次疫情之间的进化关系并没有像之前疫情间的关系一样是典型的“父子关系”,而更像是混杂在一起的“兄弟关系”。而如果将第四次疫情的毒株和第五次疫情的毒株看作是一个整体则这个整体完全是由第三次暴发疫情的毒株分支中生长出来的,在进化关系上看又是非常典型的“父子关系”。这是否意味第五次暴发疫情的病毒毒株经历了一场特殊的与以往不同的进化过程,而第四次疫情对第五次疫情的影响究竟是怎样的,我们将会在后面的章节中对这些问题进行进一步探究和讨论。2.3.2H7N9亚型禽流感病毒的密码子使用偏性变化特征病毒的密码子使用偏性改变可以在一定程度上反映出病毒的进化方向,而拥有相似的密码子使用偏性的同种病毒毒株可以认定为来自同一个群体。在第一章我们提到有研究对流感病毒的密码子使用偏性进行了宏观研究,发现了流感病毒第22页 军事科学院博士学位论文不同亚型间随时间的推移存在着相似的进化方向。在本研究中,我们为了探究第五次暴发疫情的H7N9亚型禽流感病毒的毒株是否拥有特殊的不同于以往疫情的基因特征以及H7N9亚型禽流感病毒在几次疫情中密码子使用偏性是否存在特定进化方向,我们对H7N9亚型禽流感病毒的HA基因和NA基因分别进行了密码子使用偏性的对应分析。图2.2H7N9亚型禽流感病毒HA基因和NA基因的密码子使用偏性对应分析图我们将密码子对应分析后所得到的毒株之间的密码子使用差异距离信息,呈第23页 军事科学院博士学位论文现在三维坐标系中(图2.2)。图中,每个圆点代表着一个毒株序列的密码子使用偏性特征,圆点之间的距离代表不同序列的密码子使用偏性的差异大小。距离越远差异越大。此外,我们还对每个毒株所在的疫情信息进行染色标注,这样便于更好的分析H7N9亚型禽流感病毒的密码子使用特征。从结果来看,我们发现无论是HA基因还是NA基因,代表毒株密码子使用偏性的圆点都存在聚集性。在HA基因中,代表第一次疫情暴发的毒株的圆点和第二次疫情的圆点聚集在了一起成为了一个群体,第四次疫情的圆点与第五次疫情的圆点聚集在了一起成为了一个群体,而第三次疫情的圆点似乎充当了一个桥梁的作用连接了前面叙述的两个群体。不过从聚集性上观察,第三次疫情还是更接近第一第二次疫情的群体。这说明,在HA基因中,第一次第二次疫情的病毒毒株的密码子使用偏性差异很小是来自于同一个种群,而从第三次疫情开始,毒株的密码子使用偏性开始发生变化,而到了第四次第五次疫情密码子使用偏性则发生了较大的改变,形成了独立的种群。在NA基因的密码子使用偏性特征分析图中,虽然三维坐标系下圆点形成的形状与HA基因的形状完全不同。但是密码子使用偏性的变化趋势和几次疫情间的进化规律却是很相似的。在NA基因中,同样第一次疫情的圆点与第二次疫情的圆点聚集在了一起形成了一个群体,第四次疫情的圆点和第五次疫情的圆点聚集在了一起形成了一个群体,而第三次疫情的圆点起到了连接两个群体的桥梁作用,并且更接近第四次疫情和第五次疫情的群体。以上结果说明,首先,H7N9亚型禽流感病毒正在持续的改变其密码子使用偏性的特征用来提高自己的生存能力。其次,从第四次疫情开始到目前的第五次疫情结束,H7N9亚型禽流感病毒的毒株已经获得了新的密码子使用偏性,从第五次暴发的疫情来看,这种新的密码子使用偏性更利于H7N9亚型禽流感病毒生存和传播。此外,第三次疫情是密码子使用偏性改变的过渡期,从结果上看,在HA基因中,第三次疫情的毒株的密码子使用偏性的改变较小与第一次第二次疫情的密码子使用偏性特征的差异不大,而在NA基因中,第三次疫情的密码子使用偏性的改变较大,为第四次第五次疫情的密码子使用偏性的改变提供了基础。通过本节分析,我们从密码子角度发现了H7N9亚型禽流感病毒的动态进化历程一部分特征,并且再一次看到了第四次疫情和第五次疫情存在更加密切的进化关系,而第五次疫情的病毒毒株在基因特征上也确实被证明拥有与以往疫情不同的新的密码子使用偏性。2.3.3H7N9亚型禽流感病毒的种群动态变化情况追踪H7N9亚型禽流感病毒的动态进化过程除了考察病毒密码子使用偏性第24页 军事科学院博士学位论文的改变外,我们还探究了病毒种群多样性的动态变化。我们采用BEAST工具的MCMC方法,并应用Bayesianskyline数学模型模拟估算了H7N9亚型禽流感病毒自2013年首次暴发疫情以来的种群多样性变化情况(图2.3)。图2.3H7N9亚型禽流感病毒HA基因和NA基因的种群多样性变化曲线图图中的曲线表示种群多样性随时间的变化趋势,而紫色带部分为估计值的误差范围,色带越窄说明模拟估测的准确度越高。从图中的曲线走势我们可以观察到从第一次疫情暴发到第五次疫情暴发,H7N9亚型禽流感病毒的种群多样性并没有显著增加,但是几乎每次疫情暴发种群多样性都会有明显的波动,除了第四第25页 军事科学院博士学位论文次疫情外,每次疫情到来的时候种群多样性曲线都会有明显的上升形成波峰,然后随之缓慢下降,这样的曲线变化我们称之为疫情波动。这说明H7N9亚型禽流感病毒处于一个相对稳定的进化状态,而每次疫情的暴发都会给H7N9亚型禽流感病毒提供增加种群多样性的进化动力。此外,对比两个基因节段的走势图,不难发现相比于HA基因,NA基因的种群多样性波动更为显著。第四次疫情感染人数最少在种群多样性的变化曲线中并没有出现先上升又下降的疫情波动,然而仔细观察会发现第四次疫情暴发的时间(2015年年末到2016年年中),种群多样性变化曲线一直保持缓慢上升的态势,并且这种缓慢上升的态势一直延续到第五次疫情暴发。从曲线上看,第四次疫情更像是第五次疫情的准备阶段,与第五次疫情连在一起,更像是一次周期更长的疫情波动。如果将每次疫情波动的到来视为一次H7N9亚型禽流感病毒的进化过程,那么H7N9亚型禽流感病毒共经历了四个进化过程,其中第四次疫情很可能和第五次疫情共同构成了一个进化过程。2.3.4H7N9亚型禽流感病毒五次疫情之间的氨基酸进化速率比较病毒的进化速率估算往往是对病毒威胁评价的重要指标之一,也是探究病毒进化历程的重要因素。我们同样利用BEAST工具中的MCMC方法分别计算了每次H7N9亚型禽流感病毒的疫情中,HA基因和NA基因的氨基酸进化速率(图2.4)。图中不同颜色的曲线表示不同疫情暴发时,H7N9亚型禽流感病毒的氨基酸进化速率分布。曲线的峰值对应的横坐标是进化速率的几何平均数,也是我们通常用来比较进化速率高低的标准。除了几何平均数外,曲线分布的面积与时间的比值是数学平均数,也是用来衡量进化速率高低标准。从图中结果我们不难发现,HA基因中,第五次疫情的进化速率最高,其次是第二次疫情,第四次疫情的进化速率最低。而在NA基因中,第二次疫情的进化速率与第四疫情的进化速率最高。而第五次疫情的进化速率则处于第三位。这说明第五次疫情暴发中H7N9亚型禽流感病毒的HA基因以极高的速率完成自身的进化过程,而相比较之下,NA基因则处于一个相对低速的进化过程。而HA基因的快速进化可以增强病毒识别受体的能力,进而提升病毒的传播性,这样就解释了第五次疫情中病毒传播能力增强的原因。其次,我们发现第四疫情的HA进化速率极低而NA进化速率极高,这说明第四疫情中病毒在NA基因上处于一个高速进化的过程,而HA基因却保持着低速进化。而有意思的是第一次疫情的HA基因和NA基因都保持了较低的进化速第26页 军事科学院博士学位论文率,第二次疫情的HA基因和NA基因都保持了较高的进化速率,而第三次疫情的HA基因和NA基因都处于中等的进化速率。也就是说,除了第四次和第五次疫情,其他的疫情暴发时,HA基因和NA基因的进化速率都处于同等的水平。而第四次疫情和第五次疫情出现的这种进化速率不同步的现象很有可能说明,第四次疫情和第五次疫情都无法单独构成一次完整的进化过程。结合之前的结果,从本节的进化速率结果上看,H7N9亚型禽流感病毒很可能在第四次疫情暴发中以较高的进化速率完成了NA基因的进化过程,而第五次疫情暴发时,病毒在完成了NA基因进化的基础上又以较高的进化速率完成了HA基因的进化过程。进而第四次疫情和第五次疫情共同构成了一次“两步”进化过程,而病毒毒株也因此具有了与以往都不相同的基因特征和抗原特性。图2.4H7N9亚型禽流感病毒历次疫情中氨基酸进化速率曲线图第27页 军事科学院博士学位论文2.3.5H7N9亚型禽流感病毒的氨基酸突变的动态变化特征我们在之前几节的结果中发现第五次疫情中H7N9亚型禽流感病毒具有与以往不同的进化特征和基因特征,那么究竟H7N9亚型禽流感病毒发生了哪些氨基酸突变,这些突变又是如何动态变化的?我们将就此问题展开接下来的研究。图2.5H7N9亚型禽流感病毒HA基因各突变位点的动态变化情况我们分别将收集到的HA基因和NA基因的编码区序列比对之后翻译成氨基酸序列,并编程对每个氨基酸位点的突变情况进行了统计和标注。并且将序列按时间顺序进行排列,图2.5和图2.6分别展现的是HA基因和NA基因的各突变位点随时间的变化情况。图中第一行标注的是HA基因发生突变的各个位点所在位置,第二行标注的是该位点发生的氨基酸替换情况。左侧标注的是时间年份,右侧标注的是疫情暴发的起始位置。图中每一行代表一个基因序列,黄色点代表未发生氨基酸突变,而绿色点则表示发生了氨基酸突变。因此从图中我们可以观察到氨基酸替换的动态发生过程。此外,为了更清楚的看到每次疫情暴发中具体的氨基酸突变,我们统计整理了各疫情中突变位点的氨基酸改变情况形成了表2.2和表2.3。在HA基因的氨基酸突变变化图中,我们发现了三种氨基酸突变变化类型。类型一,氨基酸突变位点的选择固定。从第二次疫情开始,H7N9亚型禽流感病第28页 军事科学院博士学位论文毒在HA基因上出现了大量突变。这些突变随时间的推移在后面的传播中逐渐被积累以越来越高的出现频率连续出现,一直延续到了第五次疫情暴发。这些位点被我们称为选择固定位点,其中A123T,S129N,A136V,R141K,L177I,L226Q,M236I,E388A,V431I和S491R这些突变都是被选择固定下来的突变。类型二,氨基酸突变的消失。第五次疫情中的病毒毒株不仅会继承固定之前出现的突变位点,还可能会对之前出现过的突变进行“修正”和“清洗”,进而使得一些氨基酸突变消失。R58K,T133A,V186G,M264I和E395G这些在之前疫情中大量出现的突变在第五次疫情都被清洗而消失。类型三,新出现的氨基酸突变位点及氨基酸突变。第五次疫情中出现了很多新的氨基酸突变和氨基酸突变位点。除了有可以形成高致病性毒株的327K,328R,329T和330A四个氨基酸插入位点外,还有R58L,E115R,A123P,K173E,V186I,G326R,E395K和V422M这些新出现的突变。而这些新突变很有可能与H7N9亚型禽流感病毒在第五次疫情拥有极高的传播能力相关。图2.6H7N9亚型禽流感病毒NA基因各突变位点的动态变化情况在NA基因的氨基酸突变位点变化图中,我们并没有发现第五次疫情中出现新的氨基酸突变,也没有看到第五次疫情对之前出现的大量出现的氨基酸突变位点进行明显的清洗和修正。然而有意思的是,第四次疫情出现了很多新的突变,包括A21T,S44T,和V212I,并且有对之前出现的氨基酸位点进行修正和清洗的过程。而第五次疫情各突变位点出现的突变几乎全部继承了第四次疫情各位点出第29页 军事科学院博士学位论文现的突变包括新产生的这些突变(表2.3)。以上结果与上一节的结果互相印证,说明第四次疫情暴发中H7N9亚型禽流感病毒在NA基因中产生了新的突变并且以较高的进化速率完成了NA基因的进化。而第五次疫情暴发中病毒在继承了第四次疫情暴发中NA基因产生的新突变的基础上,在HA基因中产生了大量新突变并完成了对之前出现过的突变的选择和清洗过程,从而进化出了更高的生存能力和传播能力。此外,我们知道第五次疫情暴发中出现了高致病性H7N9亚型禽流感病毒,而高致病性毒株与低致病性毒株的差异则反映在HA基因中出现了四个氨基酸插入位点。而从图2.1中,我们发现有其他的氨基酸突变位点似乎与高致病性氨基酸插入位点存在协同突变的趋势,也就是说这些协同突变的位点很有可能与病毒的高致病性相关,因此为了探究这些位点是否与高致病性相关,我们计算了对各氨基酸突变位点与高致病性氨基酸插入位点的互信息值(表2.4),并发现I49T,K173E,L226Q和E395K这四个突变与高致病性插入位点高度协同,可能与高致病性的产生有相关关系。第30页 军事科学院博士学位论文表2.2H7N9亚型禽流感病毒HA基因中氨基酸突变位点在各次疫情的变化情况EPIDEMIC_1EPIDEMIC_2EPIDEMIC_3EPIDEMIC_4EPIDEMIC_5I49IIVITR58RKKRLE115KKKNK/RA123EE/SSTT/P/SS129SNNNNT133TATTTA136T/SV/S/TVVVR141RK/G/MKKKK173KRKR/GEL177LIIIIV186GG/AG/AVIL226Q/I/PQQ/IQ/IQM236MII/VIIM264MIIIMN274DDDDDR310RK/GKKKG326GGGGRE388EAAAAE395EGEEKK406RTEKRV422VLLLL/MV431VVVIIS491SR/NRRR第31页 军事科学院博士学位论文表2.3H7N9亚型禽流感病毒NA基因中氨基酸突变位点在各次疫情的变化情况EPIDEMIC_1EPIDEMIC_2EPIDEMIC_3EPIDEMIC_4EPIDEMIC_5I16TTT/A/V/RTTA21AAPTTV22AAI/AAAS44SPSP/TP/TH45HNQ/RR/NR/NM75MII/TIIR81RK/NKKKR129RTKKKY169NHYHHT181TAAAAV205VIIVIV212VVAIIV236VIIVIV239VIIVVS245SPPPPE283KEKEKI303VIVVVN325NT/ST/SSSV348IIIIIA357AE/G/TT/V/DT/DT/DR427KKKKKK460KRRKK第32页 军事科学院博士学位论文表2.4H7N9亚型禽流感病毒HA基因的部分位点与高致病性插入位点的互信息值统计表(MI>0.1)HPAIINSERTIONSITE(A)HAPROTEINSITES(X)MI(A,X)327,328,329,3301230.961237327,328,329,3303270.961237327,328,329,3303280.961237327,328,329,3303290.961237327,328,329,3303300.961237327,328,329,330490.85689327,328,329,3303950.85689327,328,329,3301730.782772327,328,329,3302260.721363327,328,329,3301410.604324327,328,329,3304310.563927327,328,329,3303260.48122327,328,329,330330.138341327,328,329,3304220.133759327,328,329,3301780.113579327,328,329,3302690.1135792.3.6H7N9亚型禽流感病毒与其他亚型禽流感病毒的重配情况调查我们从GISAID数据库中下载了各次疫情中H7N9亚型禽流感病毒的MP,NP,PA,NS,PB1,PB2等基因节段序列。并采用BLAST工具将同源性较高的其他亚型的禽流感病毒的内部节段序列下载收集形成数据集。然后通过系统发生学分析,对每个内部蛋白基因节段绘制系统发生树,进而观察H7N9亚型禽流感病毒内部基因节段的重配情况。(图2.7到图2.12)第33页 军事科学院博士学位论文图2.7重点亚型禽流感病毒MP基因节段的系统发生树图2.8重点亚型禽流感病毒NP基因节段的系统发生树第34页 军事科学院博士学位论文图2.9重点亚型禽流感病毒NS基因节段的系统发生树图2.10重点亚型禽流感病毒PA基因节段的系统发生树第35页 军事科学院博士学位论文图2.11重点亚型禽流感病毒PB1基因节段的系统发生树图2.12重点亚型禽流感病毒PB2基因节段的系统发生树通过对图中6棵系统发生树的分析,我们发现H7N9亚型禽流感病毒存在与其他亚型禽流感病毒发生重配的现象。其中H9N2亚型禽流感病毒的内部节段为H7N9亚型禽流感病毒的“祖先”,也就是说H7N9亚型禽流感病毒的内部基因节段全部继承于H9N2亚型禽流感病毒的内部基因节段。此外我们发现第三次H7N9亚型禽流感病毒疫情暴发中的毒株还会与其他亚型禽流感病毒(H6N6,H5N2,H7N3)进行重配,而第四次疫情和第五次疫情的毒株则没有发生与其他类型禽流感病毒重配的现象。第36页 军事科学院博士学位论文2.4讨论与结论从2013年起,H7N9亚型禽流感病毒几乎每年都会在中国暴发一次大规模疫情,感染人数众多死亡率也高达39%。更让人害怕的是单单第五次暴发的疫情感染人数和死亡人数就接近前四次疫情的总和。H7N9亚型禽流感病毒的传播能力急剧上升甚至出现了高致病性毒株。而这为人类的生命健康和社会带来巨大危害。在综合研究了历次H7N9亚型禽流感病毒的进化特征变化和进化过程,我们发现了第五次疫情中,病毒确实在密码子使用以及氨基酸突变方面获得了新型的变异,并且以较高的速率进行进化。根据系统发生学分析,第五次H7N9亚型禽流感病毒疫情在地理传播上主要以长江三角洲地区和珠江三角洲地区为传播中心,而从基因同源性上看,则此次疫情中的毒株来源于进化树上三个分支并且继承自第三次疫情和第四次疫情毒株,这说明第五次疫情的毒株起源复杂,并不是由单一一种类型的H7N9亚型禽流感病毒进化而来。其次,第五次疫情中,H7N9亚型禽流感病毒获得了与前几次疫情不同新的密码子使用偏性。而在估算第五次疫情的氨基酸进化速率时,我们发现在HA基因段,第五次疫情的进化速率是历来几次疫情最高,而在NA基因段则保持了一个相对较低的进化速率。这说明第五次疫情的毒株在进化速率方面也获得了极大的提升。此外,第五次疫情中,病毒在HA基因段中,氨基酸突变的情况呈现出了三种类型,分别是选择固定,修正清洗和新型突变。这说明病毒在HA基因段通过基因突变和抗原漂移已经进化出了利于自身存活并极大提升传播能力的特性。值得注意的是,在HA基因段我们通过互信息的方法还发现了与高致病性插入位点高度相关的氨基酸突变,分别是I49T,K173E,L226Q和E395K。而NA基因段第五次疫情中的毒株却没有出现新型突变,几乎是完全继承了第四次疫情中出现的氨基酸突变。总之,在遗传特征与进化方面,H7N9亚型禽流感病毒在第五次疫情中都表现出了与以往不同的新型特征。在追踪H7N9亚型禽流感病毒的动态进化过程中,我们发现第四次疫情与第五次疫情关系复杂且紧密。在系统发生学分析中,我们发现每一次疫情暴发的毒株从基因同源性上看都是上一次疫情暴发的毒株的子代,从进化关系上讲是“父子关系”,然而第五次疫情和第四次疫情之间的进化关系却更为复杂相比于“父子”更像是都以第三次疫情毒株作为“先祖”而衍生出的“兄弟”关系。在密码子使用偏好性的对应分析中,我们也发现第四次疫情的毒株拥有和第五次疫情的毒株极为相似的密码子使用偏好并且都与之前疫情有较大区别。在接下来的种群多样性分析中,我们发现前三次疫情中每次疫情暴发都会使得H7N9亚型禽流感病毒经历一次进化过程,而第四次疫情和第五次疫情很可能是共同构成了一次进第37页 军事科学院博士学位论文化过程。而这也解释了之前系统发生学分析和密码子使用偏性分析中存在的第四次疫情与第五次疫情之间关系不明的问题。事实上,第四次疫情和第五次疫情本就是一个进化过程,是一个整体,因此在系统发生树上两者的关系并不是遗传与继承这样典型的“父子”关系而是相互合作共同进化的“兄弟”关系,在密码子使用方面两者本就是一个整体当然拥有极为相似的密码子使用偏性。那么第四次疫情和第五次疫情分别为H7N9亚型禽流感病毒的进化提供了怎样的动力?在接下来的氨基酸进化分析中我们渐渐找到了答案。第四次疫情中NA基因段的进化速率是几次疫情中最高的,并且第四次疫情中NA基因段不仅产生了新的氨基酸突变A21T,S44T,和V212I并且对之前的氨基酸突变位点有着选择固定和清洗的现象(表2.2)。而在HA基因段却保持着极低的进化速率。与之相反的是,第五次疫情在NA基因段保持着较低的进化速率并且几乎在各个氨基酸突变位点完全继承和沿用第四次疫情的氨基酸突变情况。但是在HA基因段不仅保持了极高的进化速率并且进化出了高致病性毒株,以及和高致病性氨基酸插入位点高度相关的氨基酸突变I49T,K173E,L226Q和E395K。这说明第四次疫情和第五次疫情共同构成了一个“两步”进化过程,第一步在第四次疫情中先完成了NA基因段的进化,而第二步在第五次疫情中病毒沿用了第四次疫情中已经进化完善的NA基因并且进一步完善了HA基因段的进化。通过这样一个“两步”进化过程,使得第五次疫情中的H7N9亚型禽流感病毒拥有了与以往不同的高传播性和高危害性。在第一章我们讨论过病毒所面临的正选择压力会影响病毒的进化方向,正选择压力下,病毒会保留并积累有利于自身生存的氨基酸突变,而在负选择压力下病毒会对不利于自身的突变进行回复和清洗保持病毒生存能力的稳定。而我们发现第四次疫情和第五次疫情毒株不仅在进化关系上出现了相互衍生的现象,而且在氨基酸替换方面也都有对之前发生的突变进行清洗或积累的过程。这说明病毒面临的选择压力也是H7N9亚型禽流感病毒快速进化的影响因素之一。禽流感病毒进化动力主要来源于抗原漂移和抗原转变。而抗原转变的前提则是不同基因型病毒之间内部蛋白的重配。在H7N9亚型禽流感病毒内部蛋白重配规律分析中,我们发现H7N9的内部蛋白节段绝大多数来源于H9N2亚型禽流感病毒,此外还有部分第三次疫情的H7N9亚型禽流感病毒毒株与H6N6,H5N2,H7N3等亚型禽流感病毒发生了重组。而我们关注的第四次疫情和第五次疫情毒株的内部蛋白重配方面并没有表现出特殊性,与大多数H7N9亚型禽流感病毒的毒株一样都仅仅与H9N2亚型禽流感病毒发生了重配或继承自其他H7N9亚型禽流感病毒。近年来对禽流感病毒的研究中,发现几乎所有可以对人类造成威胁的禽流感亚型都与H9N2亚型禽流感病毒发生过重配或者直接完全来源于H9N2亚型禽流第38页 军事科学院博士学位论文感病毒[87-89]。这说明H9N2亚型禽流感病毒在所有禽流感病毒中扮演着十分重要的角色,很可能是禽流感病毒获得跨宿主感染人能力的中间平台[53]。因此对H9N2亚型禽流感病毒的传播规律研究具有非常重要的科学意义,在第一章我们曾提到有研究已经对H9N2病毒在中国的传播规律进行了研究,而目前对H9N2亚型禽流感病毒的全球传播规律的研究仍不完善,我们将在下面的章节中以进化的角度进一步研究H9N2亚型禽流感病毒的进化特征和全球传播规律。第39页 军事科学院博士学位论文第三章H9N2亚型禽流感病毒的全球传播规律研究3.1研究背景1966年,研究人员从美国的一只火鸡中首次分离出来了H9N2亚型禽流感病毒,从此以后H9N2亚型禽流感病毒在北美洲的家禽和水禽中陆续被发现。在亚洲,直到20世纪70年代中期,H9N2亚型禽流感病毒才在香港被首次分离。之后的几十年里,H9N2亚型禽流感病毒的传播逐渐活跃,频繁在香港活禽市场的鸭子中被检测到[90]。而在中国大陆,H9N2亚型禽流感病毒的首次暴发发生在1994年的广东省。从此,H9N2亚型禽流感病毒开始成为了鸡,鸭,鹌鹑,火鸡等家禽中主要流行的禽流感病毒[91,92],并蔓延扩散到了欧洲,非洲,中东地区,东亚,南亚以及东南亚地区,几乎在世界的各个国家和地区都可以看到H9N2亚型禽流感病毒传播事件的发生。H9N2亚型禽流感病毒是正黏液病毒科的禽流感病毒以其致病性低,跨越宿主种类多,传播渠道多样,而成为禽流感病毒中传播最为广泛,进化过程和传播路线最为完整的病毒之一。H9N2亚型禽流感病毒不仅会在家禽中频繁暴发疫情,还可以在野生水禽,野生陆禽间广泛传播。此外,H9N2亚型禽流感病毒是禽流感病毒中跨越宿主传播能力最强的亚型,其宿主也从禽类逐渐跨越到了猫,狗,猪,马甚至人类等哺乳类动物身上,给人类的生产生活以及生命健康带来了巨大的威胁[93-96]。H9N2亚型禽流感病毒不仅自身跨越宿主传播能力强大,还可以以提供内部蛋白功能节段的方式通过抗原转变和重配等进化手段为其他亚型禽流感病毒获得跨宿主传播能力提供帮助和进化动力。对1997年发生的H5N1亚型禽流感病毒疫情的系统发生学研究证实了H9N2亚型禽流感病毒以重配的方式将自己的内部基因节段PA,NP,NS,PB1,PB2以及MP中的基因片段提供给了引发这次疫情的高致病性H5N1亚型禽流感病毒[89]。此外在上一章中重点研究的H7N9亚型禽流感病毒,自2013年第一次疫情暴发起就与禽流感病毒H9N2的毒株在全部6个内部节段中发生了极为频繁的重配事件。而有研究进一步证明[97,98],目前流行的H7N9亚型禽流感病毒的内部节段继承自多个谱系的H9N2亚型禽流感病毒,而且这样的重配事件可能仍在持续发生。除了H5N1和H7N9这两种比较引起人们关注的禽流感病毒亚型外,近年来给人类生命安全带来越来越大威胁的H6N2,H5N2和H10N8等其他亚型禽流感病毒[87-89],也都获得了与H9N2第40页 军事科学院博士学位论文亚型禽流感病毒的部分内部基因节段片段。这说明H9N2亚型禽流感病毒不仅可以通过直接传播的方式威胁到人类的生命安全,还可以通过产生新型可跨越宿主限制传播到人的禽流感病毒来给人类社会造成巨大损害。目前,对H9N2亚型禽流感病毒的研究多数局限于基因水平层面,研究热点也主要是抗原特性和基因进化[93-96,99-103]。然而对H9N2亚型禽流感病毒宏观传播规律却比较缺乏认识。而H9N2亚型禽流感病毒是全球范围内广泛传播的病毒,不同地域间流行的H9N2亚型禽流感病毒基因特征都可能存在明显差异。因此如果我们掌握了H9N2亚型禽流感病毒全球传播网络和迁移规律,就可以在疾病监测和防控上获得指导性参考,可以对地区性的流感疫情暴发进行预测和控制,甚至可以进一步窥测到H9N2亚型禽流感病毒区域化进化特征和抗原改变情况。在第一章中我们已经详细介绍了我们之前有关对H9N2亚型禽流感病毒在中国传播规律的研究。而由于H9N2亚型禽流感病毒的进化与传播过程复杂,全球范围内传播区域广泛,各地区内病毒的传播源头和迁移模式都有所差异,研究难度较大,因此目前对H9N2亚型禽流感病毒的全球传播规律还没有很好的认知和研究。而我们将通过下面的研究,试图探究出H9N2亚型禽流感病毒在全球范围的传播规律,迁徙模式,主要传播动力以及主要传播中心,进而绘制出H9N2亚型禽流感病毒全球传播网络。3.2材料与方法3.2.1H9N2亚型禽流感病毒的序列收集与多序列比对目前随着测序技术的发展,越来越多的病毒基因数据被收集起来制作成可供研究者使用的数据库,如前面章节提到的GISAID数据库,以及在本章研究中使用的NCBIGenBank流感病毒数据库[60]。为了获取更多的数据以及数据所包含的信息,我们从NCBI流感病毒数据库中下载了所有可以获取到的H9N2亚型禽流感病毒的HA蛋白序列和NA蛋白序列。由于测序水平和测序标准的不同,这些数据中有很多不适合作为研究对象的冗余数据,标注缺失数据,序列异常数据和质量过差的数据,因此在收集所有序列数据之后,我们对数据进行了筛选和整理。经过筛选后我们得到了一个共有2127株HA基因序列和1591株NA基因序列的总数据集。其次,我通过采样时间和相关基因数据说明文件对这些序列的序列号,宿主,地点,时间等信息进行标注。多序列比对是做系统发生学和系统地理发生学的基础,通常被用到的工具是第41页 军事科学院博士学位论文MEGA软件和MUSCLE软件[77,78],在本研究中,我们将各个节段的编码区序列用MUSCLE软件分别进行了多序列比对,并进行了人工校对和微调保证了序列比对的正确性为之后的研究做好准备。3.2.2H9N2亚型禽流感病毒的系统发生学分析和系统地理发生学分析H9N2亚型禽流感病毒进化过程十分复杂,不同地区的H9N2亚型禽流感病毒可能存在不同的进化特征,不同的传播起源,不同的传播路线。而基于进化特征和基因同源性计算的系统地理发生学对基因数据自身的同源性要求较高。因此,为了得到的结果更加准确,我们首先对H9N2亚型禽流感病毒进行了系统发生学分析,来观察H9N2亚型禽流感病毒各进化分支的同源性状况。我们采用了MrBayes工具对总数据集中的H9N2亚型禽流感病毒的HA基因节段和NA基因节段分别构建了系统发生进化树。MrBayes工具采用的是简单贝叶斯方法构建进化树,在我们的研究中,为了使得结果稳定可靠,我们设定了贝叶斯采样次数为一千万次。系统发生学分析中,进化树的树根选取十分重要,为了保证树形中的进化信息完整准确,我们采用了TempEst工具中的最佳树根匹配算法确定了进化树的树根和树形,为之后的分析打下基础。系统地理发生学分析,主要是基于进化分子钟模型和贝叶斯马尔科夫方法[65]将基因同源性与所在地理信息间建立联系,进而推测出病毒的进化起源时间和地理传播线路。主要使用到的工具是生物信息学软件BEAST[64]。此方法的大致原理是在大量的随机模拟过程中,对系谱树的拓扑结构,树分支长度,进化模型等相关参数进行抽样,通过足够长时间的模拟得到系谱树的结构和所有相关参数的一个估计。在建模核苷酸替换过程时,我们使用了SRD06密码子模型,该模型的核苷酸替换模型框架为HKY85。这个模型是对基因序列的编码区进行划分。将密码子的第一位和第二位作为一组建模参数,而将密码子的第三位作为单独一组,使用不同的参数建模。另外考虑到基因序列不同区域的突变速率会有所差异,SRD06模型使用了Gamma分布来模拟序列不同区域位点的突变速率。此外,为了进行分歧时间的估计,在计算过程中还需要应用一个uncorrelatedlog-normalrelaxedclock分子钟模型,该模型假设基因序列在进化过程符合一个分子钟,但系谱树的不同分支可以采用不同分子钟速率进行进化,而且所有分支上的分子钟应该符合一个对数正态分布。溯祖模型是用来在进行系统发育推断过程中,确定哪些后代具有共同祖先的模型,我们选择使用了Bayesianskyline溯祖模型[18,64]。为了保证系统地理发生学分析的结果更加准确和稳定,我们对系统发生树上不同分支进行了分层重采样,即在进化树的每个子系(Lineage)按照地理信息,第42页 军事科学院博士学位论文年代信息,宿主信息等对序列进行随机抽样,每次抽样的数据集所包含的数据总数会根据所在树上分支大小会在200株到300株之间浮动。为了排除数据偏性的影响我们一共做了280次独立重复随机采样。对每次重复随机采样得到的数据集,我们都会进行迭代次数为1亿次的贝叶斯系统地理发生学分析。并且会根据所得到结果的参数稳定性,再进行2到3次重复的贝叶斯系统地理发生学分析以确保结果结论的准确可靠。3.2.3H9N2亚型禽流感病毒的密码子使用偏性对应分析与上一章的方法类似,我们都是使用相对同义密码子使用度(RSCU)来进行H9N2亚型禽流感病毒的密码子使用偏性对应分析。一般情况下,密码子偏性分析通常会计算序列的RSCU值来判断序列的偏好性。然而在本次研究中所包含的序列数量庞大,很难用这种方法探寻出密码子使用的规律。因此我们仍旧采用了密码子使用偏向的对应分析的方法进行探寻不同分支的H9N2亚型禽流感病毒的密码子使用规律。对应分析是基于序列的RSCU值,通过欧拉平方距离公式,将两个序列间密码子使用的相对偏性转换成三维空间中的距离进而直观的观察到不同序列间密码子使用的相似程度。在本研究中,我们利用CodonW工具对H9N2亚型禽流感病毒的HA节段和NA节段进行了密码子使用偏性的对应分析。3.2.4H9N2亚型禽流感病毒的正选择作用压力分析正选择作用压力分析的方法有很多,大体上可以分为三类:计数方法[38,39](Countingmethod)随机效应似然法[40-42](REL)和固定效应似然法[43-45](FEL).FEL方法可以认为是REL方法的扩展。FEL方法会固定系谱树上支长和氨基酸替代速率偏差参数,对氨基酸位点逐个进行独立的替代速率计算。并使用似然比检测(Likelihoodratiotest,LRT)来确定氨基酸位点是否受到选择压力的作用。但是FEL方法的缺点是计算量大、比较耗时[38]。此外其他两类方法中,计数方法要求序列的数量要足够大(比如序列数大于50)才能得到有意义的结果,而REL方法在计算较小的数据集时对第一型误差比较敏感。为了对H9N2亚型禽流感病毒的正选择作用压力分析的结果更加准确和稳定。我们使用Datamonkey(http://classic.datamonkey.org/dataupload.php)网站提供的正选择作用压力工具中的四种模型方法[104]:固定效应似然模型(FEL),单一祖先计数方法(Single-likelihoodancestorcounting,SLAC),混合效应进化模型方法(MixedEffectsModelofEvolution,MEME),快速无约束贝叶斯选择模型(FastUnconstrainedBayesianApproximationforinferringSelection,FUBARD)等同时进行计算,并选择至少有两种方法都监测到的正选择作用氨基酸位点作为可靠的结第43页 军事科学院博士学位论文果进行分析和整理。3.2.5H9N2亚型禽流感病毒的全球传播网络绘制通过系统地理发生学分析,我们会得到一棵带有溯源时间和地理迁移信息估计的H9N2亚型禽流感病毒的MCC系谱树。通过对系谱树的分析,我们会得到相关的传播时间和传播路线的模拟结果。而这些模拟结果的可信度都不相同。为了筛选出可信的H9N2亚型禽流感病毒的传播事件模拟结果,我们使用了贝叶斯随机搜索变量选择模型[105-107](Bayesianstochasticsearchvariableselection,BSSVS)筛选出可信度较高的传播模拟事件进而绘制H9N2亚型禽流感病毒的全球传播网络。此外通过ArcGIS地理信息系统工具[108,109],我们可以将模拟传播事件直观明确的标注在地理地图上以便于规律探究和分析。3.3结果分析3.3.1H9N2亚型禽流感病毒的系统发生学进化特征系统发生学分析是基于序列之间的同源性通过生成系统发生进化树来探究病毒各毒株之间的进化关系的一种生物信息学常用方法。H9N2亚型禽流感病毒的两个表面糖蛋白HA蛋白和NA蛋白是影响病毒传播能力的主要功能蛋白,因此在进行H9N2亚型禽流感病毒的全球传播规律研究中我们选取了所有可以获得的病毒的HA基因序列和NA基因序列,并通过MrBayes工具分别对两个基因节段构建了系统发生进化树(图3.1,图3.2)。图3.1展示的是H9N2亚型禽流感病毒的HA基因节段的系统发生进化树,通过对树形的分析,我们发现H9N2亚型禽流感病毒在HA基因段进化过程中分为了三个子系(Lineage),每个子系都存在独立的进化过程,子系中的毒株也都在沿着各自进化方向在进化树上持续生长,子系之间没有明显的竞争与淘汰关系。这说明H9N2亚型禽流感病毒在进化过程中很可能已经衍生出了三个种群,每个种群都有自己独立的淘汰进化过程,甚至拥有不同的进化特征。为了探究不同子系之间的关系和特征,我们将序列所在的地理位置信息以不同的颜色标注在进化树不同的分支。并且对每个子系所包含病毒的毒株的地理信息和宿主信息进行统计分析。我们发现HA基因系统发生进化树的第一个子系所包含的国家数目最多,涵盖了来自美洲,欧洲,非洲以及亚洲的41个国家和第44页 军事科学院博士学位论文地区。此外包含的宿主种类包括野鸟,家禽,甚至还有猪。其中野鸟宿主所占的比例超过60%,是所有宿主中比例最高的宿主。第二个子系中,包含的国家仅来自与亚洲和非洲,宿主种类也仅包含野鸟和家禽,而其中鸡宿主所占的比例最大,接近75%。第三子系所包含的序列总数最多,而包含的国家仅有中国,越南和日本。而且其中来自中国的序列所占比例最高接近95%。而包含的宿主种类除了野鸟和家禽外还有人类等其他哺乳类动物。其中鸡宿主所占的比例最高接近80%。从地理位置信息结果上看,每个子系都有自己独立的传播区域,子系之间有着相对明显的地理区域界限。为了便于之后的讨论,我们根据子系中病毒传播的主要地理范围,分别称HA基因系统进化树种第一子系为“世界群”,第二子系为“亚非群”,第三子系为“中国群”。第45页 军事科学院博士学位论文图3.1H9N2亚型禽流感病毒的HA基因节段系统发生进化树第46页 军事科学院博士学位论文与HA基因系统发生进化树相似,我们也同样对NA基因节段进行了分析。我们发现H9N2亚型禽流感病毒的NA节段也同样分为了不同的子系。这说明H9N2亚型禽流感病毒在NA基因节段也分成不同的群体。NA基因节段中,一共存在四个子系,通过对每个子系的地理信息和宿主信息进行统计我们发现,NA节段的第一个子系与HA节段的第一个子系相对应,也是包含的国家涵盖了美洲,欧洲,非洲以及亚洲等几个大洲,宿主比例中也是野鸟所占比例最高。而NA基因节段的第二个子系与HA基因节段的第三个子系相似,包含的国家仅为中国,越南和日本,其中中国的比例远高于其他国家。而宿主分布上,也是鸡宿主所占的比例最高。NA基因的第三个子系与HA基因节段的第二个子系相对应,包含的国家仅来自于亚洲和非洲,而宿主分布上,鸡宿主比例最高,其次野鸟。NA的第四个子系与HA的第三个子系相对应,国家分布上,中国所占比例远高于越南和日本,宿主分布上也是鸡宿主占最高比重。比较两个基因节段,我们发现在进化关系上两个基因节段的进化过程是相互对应的,HA基因的第一个子系与NA基因的第一个子系互相对应,HA基因的第二个子系与NA基因的第三个子系相对应,而HA基因的第三个子系对应的是NA基因的第二和第四子系。同样的为了便于之后的讨论,我们按照子系中序列的地理传播范围命名各个子系,称NA基因的第一子系为“世界群”,第三子系为“亚非群”,第二子系为“中国1群”,第四子系为“中国2群”。每群中所包含的序列数量统计分布情况见表3.1和表3.2。第47页 军事科学院博士学位论文图3.2H9N2亚型禽流感病毒的NA基因节段系统发生进化树第48页 军事科学院博士学位论文表3.1HA基因各种群的序列数量统计HA基因种群代表序列序列数量世界群A/turkey/Wisconsin/1966176亚非群A/chicken/Iran/THLBM865/2007409中国群A/chicken/Guangdong/SIC14/20131538表3.2NA基因各种群的序列数量统计NA基因种群代表序列序列数量世界群A/turkey/Wisconsin/1966173亚非群A/chicken/Israel/54/2008351中国1群A/chicken/Guangdong/10/00155中国2群A/chicken/Shanghai/2/20029113.3.2H9N2亚型禽流感病毒的密码子使用偏性特征在上一节中,我们通过对H9N2亚型禽流感病毒的系统发生学分析,发现H9N2亚型禽流感病毒,在进化过程中衍生出了不同的进化子系,并且每个子系都有独立的进化过程以及地理传播区域,因此根据地理分布我们将病毒分为了“世界群”“亚非群”和“中国群”。然而这样的分群方式是否合理,不同群之间是否存在进化特征上的差异还不明确。因此为了验证不同群之间是否存在特征差异,我们对H9N2亚型禽流感病毒进行了密码子使用偏性对应分析(图3.3)。密码子使用偏性对应分析可以直观的将不同毒株的密码子使用差异以三维坐标的方式呈现出来。图3.3中每个圆点为一个病毒毒株序列,圆点之间的距离长短则表示不同毒株间的密码子使用差异,距离越大说明密码子使用偏性上的差异越大。我们将所有H9N2亚型禽流感病毒的HA基因节段序列和NA基因节段序列都分别进行了密码子使用偏性分析。我们发在HA基因节段中所有圆点分别集中在三个群落中,每个群落内的圆点之间拥有着十分相似的密码子使用偏性,而群落之间则存在相对明显的密码子使用差异。这说明HA基因节段在密码子使用方面也分为了三个群体。而当我们对这些病毒毒株所在子系信息进行颜色标注之后,我们发现这三个密码子使用群落的圆点分别对应了HA基因进化树上的三个不同子系。同样的,我们在NA基因节段的密码子使用偏性上也发现了类似规律,四个不同的密码子使用偏性群落对应着进化树中四个不同子系。这说明H9N2亚型禽流感病毒在进化过程中,确实被分成了不同的种群,而且不同种群有着各自独特的密码子使用偏好性。第49页 军事科学院博士学位论文图3.3H9N2亚型禽流感病毒密码子使用偏性对应分析三维坐标图第50页 军事科学院博士学位论文3.3.3H9N2亚型禽流感病毒的正选择作用压力位点统计通过密码子使用偏性对应分析,我们发现了H9N2亚型禽流感病毒确实分成了不同的种群,并且种群间有着相对明显的密码子使用差异。为了进一步验证,不同种群的进化特征差异和面临的选择压力,我们又分别对各个种群进行了正选择作用压力分析(表3.3,表3.4)。表3.3HA基因节段各种群的正选择氨基酸位点HA基因节段种群正选择作用位点数量正选择氨基酸位点世界群63,13,38,40,287,337亚非群842,168,198,201,204,234,282,537中国群123,4,15,149,168,182,198,234,353,381,556,557表3.4NA基因节段各种群的正选择氨基酸位点NA基因节段种群正选择作用位点数量正选择氨基酸位点世界群2358,414亚非群819,42,77,356,403,416,432,468中国-1群573,81,149,296,384,中国-2群39,249,468从表中我们可以看出不同种群除了密码子使用偏好性存在明显差异外,所面临的选择压力也各不相同。其中在HA基因段,“中国群”面临的选择压力最大,正选择位点数量最多,而“世界群”面临的选择压力最小。在NA基因段,“中国群”与“亚非群”面临的选择压力最大,正选择位点最多,“世界群”面临的选择压力最小,正选择位点最少。而且不同种群所获得正选择氨基酸位点也都不相同,这说明各种群在自己特定的地理区域范围内完成了各自独立的进化过程,拥有了各自不同的遗传特征,并且通过正选择作用,获得了不同的有利于自身在各自生存环境下生存的氨基酸突变位点。第51页 军事科学院博士学位论文3.3.4全球H9N2亚型禽流感病毒的系统地理发生学重建在前面章节的论述中,我们已经发现了H9N2亚型禽流感病毒在全球传播进化过程中分为了拥有各自进化过程和遗传特性的多个种群。而这些种群都有着特定的地理区域传播范围,意味着不同种群很可能有着不同的传播路线,因此在研究H9N2亚型禽流感病毒的全球传播规律时,为了使得模拟估算的结果更加准确,传播线路更加细致,我们分别对不同种群进行了系统地理发生学分析。通过贝叶斯系统地理发生学原理,我们重建了全球H9N2亚型禽流感病毒各种群的系统地理发生学MaximumCladeCredibility系谱树,并且利用病毒样本的分离时间和地点推断了系谱树上祖先节点的时间与地理位置(图3.4-图3.6)。图3.4H9N2亚型禽流感病毒“世界群”的系统地理发生学MCC系谱树第52页 军事科学院博士学位论文MCC系谱树上不同颜色的分支代表不同国家,中间节点的颜色和所处位置的横坐标值分别是模拟推测出的共同祖先的地理位置和分歧时间。从祖先节点到子节点的过程可以理解为一次模拟的传播事件。每个模拟的传播事件都会有相应后验概率值,我们会在之后绘制传播图时,通过BSSVS模型选取可信的传播线路进行绘制。从“世界群”的MCC系谱树中我们可以看到无论HA基因节段还NA基因节段“世界群”都起源自20世纪初的美国,其中NA基因节段估测的起源时间稍微早于HA基因节段。在到1960年到1970年之间,H9N2亚型禽流感病毒从美国逐渐传播到了中国香港地区。在此之后,“世界群”病毒分为两个群体,一个群体在美洲各国间传播进化,另外一群则在香港,韩国以及美国之间频繁传播交流。直到1990年后以香港和韩国为传播中心,H9N2亚型禽流感病毒的“世界群”蔓延传播到了亚洲,欧洲甚至非洲国家。第53页 军事科学院博士学位论文图3.5H9N2亚型禽流感病毒“亚非群”的系统地理发生学MCC系谱树图3.5呈现的是“亚非群”的系统地理发生学MCC系谱树。根据系统地理发生学模拟估测,从树形结构上可以看出“亚非群”病毒于1995年前后由香港和日本的毒株衍生进化而来。在之后的十几年中,“亚非群”H9N2亚型禽流感病毒在南亚,西亚,中东以及东南亚地区广泛传播,一直到2010年前后经由尼泊尔传入埃及并在埃及广泛传播。图3.6呈现的是“中国群”的系统地理发生学MCC系谱树。为了更明确“中国群”病毒的传播线路,在进行系统地理发生学分析时我们将中国各省份作为地理信息对系谱树进行了染色标注。HA基因节段“中国群”毒株通过模拟估计,推测出起源时间大约在1975年前后,传播源头为中国的广东省。在之后的几十第54页 军事科学院博士学位论文年间,病毒以广东省和江苏省为主要传播中心活跃传播于中国各个省份之间甚至传播到了日本和越南。NA基因节段的“中国群”分为了“中国1群”和“中国2群”。“中国1群”的起源时间1995年前后,传播源头和传播中心都是中国的广东省。而“中国2群”的起源时间大约在1990年前后,传播源头是中国的上海市,传播中心为上海市和江苏省。为了更直观的观测到全球H9N2亚型禽流感病毒的传播规律,我们将从模拟估测到的所有传播事件中,通过BSSVS模型去除结果不稳定或可信度不高的传播事件并且与相关的研究报道[110-115]相互印证,筛选出可靠且与客观事实相符的传播事件。绘制出了各种群的传播路线图(图3.7-3.9)。第55页 军事科学院博士学位论文图3.6H9N2亚型禽流感病毒“中国群”的系统地理发生学MCC系谱树第56页 军事科学院博士学位论文图3.7呈现的是“世界群”的传播路线图,各颜色曲线闭环是候鸟迁徙线路,带箭头的曲线代表一次传播事件形成传播路线。从图中我们可以发现H9N2亚型禽流感病毒的HA基因节段与NA基因节段在传播规律上几乎保持一致。“世界群”的源头起于美国,之后传播到了加拿大以及东亚和东南亚地区。以韩国日本以及中国为主要传播中心病毒继续向欧洲扩散,总体迁移方向自东向西,传播的地理区域范围遍布全球。而具体到欧洲的传播情况,HA基因节段“世界群”以荷兰为主要传播中心向周围邻国扩散传播。而在NA基因节段则是以瑞典为传播中心。在传播图中我们发现有很多跨越了较大地理区域的传播线路,并且整体传播线路和节点与候鸟迁徙线路相吻合以及在之前的研究中我们知道“世界群”中野鸟宿主所占比例最高,这样就说明,在H9N2亚型禽流感病毒“世界群”的毒株很可能以候鸟迁徙为主要传播动力,频繁的在各大洲各国家之间大肆传播和扩散。第57页 军事科学院博士学位论文图3.7“世界群”H9N2亚型禽流感病毒传播路线图第58页 军事科学院博士学位论文图3.8“亚非群”H9N2亚型禽流感病毒传播路线图图3.8呈现的是H9N2亚型禽流感病毒“亚非群”的传播路线图。从图中我们可以看出HA基因节段和NA基因节段的传播规律大体上保持一致。“亚非群”病毒的传播线路起源于日本并通过香港传入中国大陆。与此同时病毒又以日本为第一传播中心传到了南亚和中东地区。在南亚和中东地区,又以伊朗,巴基斯坦,以色列为第二传播中心向周边国家扩散甚至传播到了非洲的埃及。从传播路线上观察,我们发现既有从日本横跨东亚传播到中东地区的大距离跃迁,也有以伊朗和巴基斯坦为传播中心向周边邻国广泛传播的短距离扩散。而且总体传播方向由第59页 军事科学院博士学位论文东向西,横切候鸟迁徙线。此外“亚非群”病毒的宿主分布中,鸡宿主占到了较大比例而野鸟宿主的比例次之。结合以上现象推断,“亚非群”H9N2亚型禽流感病毒的主要传播动力既受到候鸟迁徙的影响又受到家禽养殖和贸易的影响。图3.9“中国群”H9N2亚型禽流感病毒传播路线图“中国群”H9N2亚型禽流感病毒的进化特征在HA基因段和NA基因段是存在一定差异的。HA基因段的系统发生进化树中“中国群”为一个整体而NA基因段的系统发生进化树中“中国群”被分为了两个子系,“中国1群”和“中国2群”。从HA基因节段“中国群”的传播路线中,我们可以发现传播事件起第60页 军事科学院博士学位论文源于广东和香港,而此后病毒在江苏和上海等地建立了第二传播中心。病毒以这两个传播中心频繁的在中国各个省市之间扩散传播,甚至经由江苏和广东传播到了日本和越南。而在NA基因段,“中国1群”起源于江苏和上海并以此为传播中心向中国各省份传播扩散甚至跨国传播到了日本,而“中国2群”起源于广东和香港并以此为传播中心向中国各省市传播扩散甚至跨国传播到了越南。在传播线路图中,我们将“中国1群”和“中国2群”视为一个整体绘制到了一张地图上之后与HA基因节段的“中国群”传播线路相比对,发现“中国群”H9N2亚型禽流感病毒的传播规律在HA基因段和NA基因段是大体保持一致的。“中国群”的传播图中,传播中心有两个,分别处于长江三角洲地区和珠江三角洲地区,传播线路大多是临近省份间的频繁传播,相比于“世界群”和“亚非群”很少出现大距离跃迁。而且“中国群”的宿主分布中,鸡宿主所占比例接近80%,在结合相关的流行病学研究[117-120],我们推断“中国群”的主要传播动力来源于家禽的养殖与贸易。3.4讨论与结论H9N2亚型禽流感病毒是禽流感病毒中进化规律最为复杂传播范围最为广泛的亚型之一。在其他的研究中,大多针对于某一种类型H9N2亚型禽流感病毒或者某一个地理范围内的H9N2亚型禽流感病毒进行进化分析或者传播规律研究[99-103]。而本研究着眼宏观,力图构建全球H9N2亚型禽流感病毒的传播网络。本研究在进行系统地理发生学重建之前,首先对H9N2亚型禽流感病毒的进化规律进行研究,并发现H9N2亚型禽流感病毒在进化过程衍生出了有独特遗传特征,独立进化过程以及各自特定地理区域范围的三大种群,通过分别对每个种群构建系统地理发生学模型,我们得到了H9N2亚型禽流感病毒在全球范围内的三条主要传播线路,这三条传播线路也共同构成了H9N2亚型禽流感病毒全球传播网络。这种方法既充分考虑到了病毒进化与传播之间的相互影响,又细致合理的解构了H9N2亚型禽流感病毒在全球范围内复杂的传播路线和传播规律,此外这种结合进化特征分群分析的方法是对经典系统地理发生学方法的一次创新。通过密码子使用偏性分析和正选择作用压力分析,我们发现H9N2亚型禽流感病毒的不同种群有着独特的密码子使用偏好性,并且在各自的生存环境中面临的选择压力各不相同。而出现这种现象的原因很可能与病毒在不同种群中的宿主分布以及进化所处的生存背景有关。有意思的是,“世界群”的地理传播范围最为广泛,然而得到正选择压力作用位点却最少,面临的选择压力也最小,于此相第61页 军事科学院博士学位论文反的是“中国群”的传播范围最小,却得到了最多的正选择压力作用位点,面临的选择压力最大。通过比较“世界群”和“中国群”地理分布差异,我们推测出现这种现象的原因可能是更大的地理传播范围会给病毒带来更多样的生存环境,使得不同类型的病毒都可以找到适宜自己生存的环境进而“世界群”面临的选择压力更小,而“中国群”传播范围较小,生存环境相对单一,因此面临的选择压力也相对更大一些。H9N2亚型禽流感病毒的三个种群中“世界群”的起源时间最早,而通过系统地理发生学模拟估算,“世界群”病毒首次传入香港和日本的时间仍早于“亚非群”和“中国群”的起源时间。也就是说在“世界群”病毒传入香港和日本后,“亚非群”病毒和“中国群”病毒才开始在各自的区域范围内繁衍进化和传播。这个现象暗示出了H9N2亚型禽流感病毒在进化中三大种群的形成很可能是经历了一个全球“播种”,区域性进化的过程,即“世界群”病毒经由候鸟迁徙传播“播种”到了香港和日本,并产生了大量的变异之后传播到了中国大陆和中东地区,而在中国大陆和中东地区,为了适应各自不同的生存环境,病毒发生区域性进化和地理隔离衍生出了更适合本地生存的新的种群,并在传播中逐渐壮大形成了“亚非群”和“中国群”。通过系统地理发生学系谱树和传播网络图,我们可以很直观找到H9N2亚型禽流感病毒的地理传播中心在全球的分布。从图中可以看出,东亚地区包括中国大陆,中国香港,韩国和日本在三群中都扮演着传播中心的角色,是H9N2亚型禽流感病毒最活跃的地理位置,此外中东和东南亚地区如巴基斯坦,伊朗和越南,也是各自传播路线上的重要传播中心。结合最近的相关研究,我们发现这些通过系统地理发生学模拟估测出的传播中心确实频繁暴发H9N2亚型禽流感疫情[110-115],并且向外传播的线路也与我们模拟估测的线路相吻合。禽流感病毒的传播动力来源一般认为有两个,一是家禽的贸易和养殖,另一个是候鸟的迁徙。通过先根据进化特征分群然后分群研究地理传播规律的方法,我们发现H9N2亚型禽流感的不同种群在各自的传播线路上有着不同的主要传播动力来源。传播图中若出现长距离传播的路线,则一般认为其传播动力来源于候鸟迁徙[54,116]。在“世界群”中不仅大量出现了长距离的传播路线而且传播网络与候鸟迁徙线大体吻合,此外“世界群”病毒的宿主分布中野鸟的比例又是最大的,因此我们认为“世界群”的主要传播动力来源于候鸟迁徙。而“亚非群”中既存在长距离的传播路线又存在邻国之间的短距离传播扩散,说明其主要传播动力来源既受到候鸟迁徙的影响又受到家禽养殖与贸易的影响。“中国群”中大距离传播线路几乎不存在,大多是国内各省份之间的频繁交互传播,此外结合其他的对中国活禽市场和禽流感关系的研究[117-120],我们认为“中国群”病毒的主要传播动力来源于家禽的养殖和贸易。第62页 军事科学院博士学位论文通过对H9N2亚型禽流感病毒全球传播规律的研究,我们发现三大种群的三条传播线路都经过中国大陆和香港。这说明中国大陆和香港对H9N2亚型禽流感病毒三大种群的形成和传播都有着重大影响。而有意思的是,虽然“世界群”和“亚非群”病毒都曾传播到中国,但是在中国大陆广泛流行的病毒仍旧是“中国群”病毒,并且疫情暴发的频率和采样数量都是三群中最高的。这说明H9N2亚型禽流感病毒在中国大陆经历了更为严峻的选择清洗的进化过程,并通过这种进化获得了更高的适合度(Fitness)和更强的生存能力。而很可能正是由于H9N2亚型禽流感病毒在中国产生了高适合度的病毒类型,之后又发生了与H7N9亚型禽流感病毒等的重配事件,使得H7N9亚型禽流感病毒获得了在中国暴发疫情的遗传基础。H9N2亚型禽流感病毒正在持续发生进化并获得了更高的生存能力,此外在家禽中H9N2亚型禽流感病毒还会与其他各种亚型禽流感病毒发生重配,已经产生了并且可能继续产生可以威胁到人类生命的新型病毒。因此应该加大对H9N2亚型禽流感病毒的防控与监测。禽流感病毒的危害日益增大,为了更好的了解禽流感病毒的进化模式和变异特征,我们应该继续对其进行更为深入的研究和探讨。在下一章中,我们将通过协同进化分析手段对H9N2,H7N9,H5N1等重要亚型禽流感病毒的各氨基酸突变位点及各基因节段之间的协同进化关系进行深入研究。第63页 军事科学院博士学位论文第四章重点亚型禽流感病毒的协同进化模式研究4.1研究背景近年来越来越多的禽流感病毒通过变异和快速进化获得了感染人类的能力,并对人类的生命安全带来了巨大的威胁。除了前面章节中讨论的H7N9亚型禽流感病毒外,有着广泛传播地理区域的H5N1亚型禽流感病毒也频繁与H9N2亚型禽流感病毒发生重配[119,123],并在近年来频繁暴发疫情,给人类社会带来了巨大的经济损失和严重危害。1996年,在中国广东省,第一株H5N1亚型禽流感病毒高致病性毒株从鹅宿主体内被分离出来。1997年首次发生H5N1亚型高致病性禽流感病毒感染人事件,此次事件中,18人感染,6人死亡。2003年亚洲东部和东南亚地区陆续暴发了H5N1亚型禽流感病毒疫情,其中包含中国香港,韩国,日本,越南和泰国等。此次感染不仅带来了巨大的经济损失同时被感染的病例中也呈现出了更高的死亡率。在此之后,H5N1亚型禽流感病毒传播到了马来西亚,印度尼西亚,非洲,欧洲以及部分中东国家和地区,开始了全球范围内的广泛扩散[121-125]。目前全球范围内,H5N1亚型禽流感病毒已经出现在了60多个国家,感染总人数860人,其中446人死亡,死亡率高达53%。禽流感病毒的进化有两个主要动力来源,其一是以氨基酸随机突变为基础进而改变病毒抗原特性的抗原漂移,其二是以不同亚型禽流感病毒间内部蛋白节段重配为基础进而获得新抗原特性的抗原转变。禽流感病毒经过自身不断的进化,获得了更高的生存能力甚至给人类带来了更大的威胁,而对禽流感病毒的研究中大多局限于探究禽流感病毒单一蛋白的抗原漂移规律,或者寻找某些重要氨基酸突变位点以及正选择压力作用位点等[102,111,121]。这些研究确实很有效的识别了禽流感病毒的进化机制中重要的相关突变位点并对禽流感病毒进化规律的探索做出了巨大贡献[18]。然而,禽流感病毒的进化是一个更加复杂的机制,不仅依赖于重要氨基酸位点的突变,还受到不同氨基酸位点间的相互协调以及不同蛋白间的相互作用的影响,流感病毒往往需要突变之间的互补与合作来达到最优适应性[18,126]。当前一些研究中已经注意到了不同人流感病毒中氨基酸替换之间会存在协同性与关联性[127],但是对禽流感病毒中存在的协同进化模式的探究却仍旧缺乏认识。本章中,我们尝试对H9N2,H7N9,H5N1等重要亚型禽流感病毒进行协同进第64页 军事科学院博士学位论文化分析,试图找出禽流感病毒进化过程中发生协同突变的氨基酸位点,以及不同亚型禽流感病毒间各基因节段的协同进化关系是否存在差异,进而揭示禽流感病毒进化过程中存在的协同进化模式,为进一步探究禽流感病毒的进化规律打下基础。4.2材料与方法4.2.1序列收集筛选与多序列比对病毒的协同进化关系研究对病毒的序列质量要求比较高,为了得到更高质量的序列信息,我们分别从GISAID数据库中下载了所有可以获得的H9N2,H7N9,H5N1亚型禽流感病毒的全基因组序列,然后分基因节段分别进行筛选和多序列比对。在下载的序列数据集中,存在很多测序质量低序列长度不全的序列,为了使得研究结果准确可靠,我们首先去除了质量低的序列(表4.1)。其次,为了更好的统计氨基酸位点的突变情况,我们选择了各基因节段的编码区序列作为研究对象。其中MP基因节段,NS基因节段,PB1基因节段都存在多个编码区,为了便于计算和探究各个基因节段之间的协同进化关系,我们选择了这些基因节段最长的编码区序列作为该基因节段的编码区。表4.1重点亚型禽流感病毒序列数量统计禽流感亚型代表毒株序列数量H5N1A/chicken/Yamaguchi/7/2004654H7N9A/Shanghai/1/2013432H9N2A/parakeet/Chiba/1/97334在进行多序列比对时,我们使用MUSCLE工具对每一种亚型禽流感病毒的每个基因节段分别进行多序列比对,然后将比对之后对齐的各个基因节段序列通过序列所在毒株信息连接成该毒株的全长序列,便于之后的分析和计算。4.2.2氨基酸突变位点的协同进化分析在进行关联突变计算之前,我们对氨基酸各位点的突变情况进行了统计。我们使用Python程序语言编写程序,对各氨基酸位点的突变情况做了统计和可视化显示。协同进化分析的可靠性与氨基酸位点的突变频率相关,突变频率越低的氨基酸位点产生随机突变的可能性越大,分析结果的可靠性则越低。为了排除随第65页 军事科学院博士学位论文机突变对结果造成的误差,我们筛选出突变频率在15%以上的氨基酸位点作为协同进化分析的实验对象[65]。协同进化分析依赖于对氨基酸位点的关联突变计算,而目前关联突变计算的主要计算方法都以香农信息论中的互信息计算方法为基础。在2.2.5章节中,我们介绍了互信息的计算方法。(2.1)是序列中x列的熵值,表示e突变在x列的观察频率即e突变在x列出现的频率。(2.2)是氨基酸突变位点A与氨基酸突变位点B之间的互信息值,值越大说明关联程度越高,越小则说明关联程度越低。在第二章中,我们曾提到,,但是值却不一定等于1,这样在比较不同氨基酸位点间的关联程度时会出现很大麻烦。因此为了便于比较各氨基酸位点间的协同进化程度,我们将互信息值进行归一化处理,引入联合熵参数。(3.1)(3.2)其中表示氨基酸突变对在A氨基酸位点和B氨基酸位点的联合观察频率。是对互信息的归一化处理,可以用于比较蛋白内甚至蛋白间两两氨基酸位点之间协同突变程度的参考值[65]。在实际计算中,我们选择的氨基酸位点对作为存在协同进化关系的氨基酸突变位点[65,127]。4.2.3重点亚型禽流感病毒蛋白间协同进化关联网络的构建通过前面的协同进化分析,我们可以计算出各亚型禽流感病毒中氨基酸协同进化位点的分布。为了进一步研究各蛋白之间的协同进化关系,我们使用Cytoscape工具,以关联网络图的形式将各蛋白之间存在的氨基酸协同进化位点第66页 军事科学院博士学位论文对数进行量化标注和展示,以便于进一步探究各类型禽流感病毒的协同进化模式。4.3结果分析4.3.1H5N1亚型禽流感病毒的协同进化分析为了便于氨基酸突变位点的协同进化分析,我们首先对H5N1亚型禽流感病毒的各基因节段中氨基酸突变情况进行了统计,选取了219个突变频率超过15%的氨基酸位点,并对这些氨基酸突变位点进行关联突变计算。表4.2是各基因节段中部分协同突变位点的互信息数值计算统计。从表4.2中我们选取了互信息值大于0.7的氨基酸突变位点对,绘制了氨基酸位点突变情况示意图(图4.1)。图4.1中每一簇表示一组协同突变氨基酸位点组合,每一列表示一个氨基酸突变位点的突变情况。黄色的部分为未发生突变而保持原有氨基酸的情况,而红色的部分表示该位点发生了氨基酸突变。每一横行中的所有氨基酸位点都来自同一个毒株。第67页 军事科学院博士学位论文图4.1H5N1亚型禽流感病毒协同突变氨基酸位点变化示意图第68页 军事科学院博士学位论文表4.2H5N1亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计HA268HA339HA373HA492MP59NA253NA436NS190NS214NS70PA613PB1261PB1353PB2494PB2618PB265HA26810.7460.0340.770.9030.0450.0330.0420.0260.0540.0310.0340.8660.0260.0310.054HA3390.74610.0420.5980.720.0460.0410.0430.0260.0510.0350.0390.6630.0260.0390.05HA3730.0340.04210.0270.0340.0290.7730.0270.0170.0350.7880.0180.0340.0180.7150.035HA4920.770.5980.02710.7060.0460.0270.0440.0260.0570.0250.030.690.0270.0240.056MP590.9030.720.0340.70610.0460.0340.0430.0260.0560.0310.0340.8390.0270.0320.055NA2530.0450.0460.0290.0460.04610.0230.7860.3020.0190.0280.2780.0450.2740.0210.019NA4360.0330.0410.7730.0270.0340.02310.0210.0110.0370.6650.0120.0340.0110.6180.037NS1900.0420.0430.0270.0440.0430.7860.02110.3080.0460.0270.3060.0430.3030.0190.047NS2140.0260.0260.0170.0260.0260.3020.0110.30810.0280.0170.7430.0260.7940.010.028NS700.0540.0510.0350.0570.0560.0190.0370.0460.02810.0340.0310.0540.0280.0340.755PA6130.0310.0350.7880.0250.0310.0280.6650.0270.0170.03410.0170.0310.0170.7530.034PB12610.0340.0390.0180.030.0340.2780.0120.3060.7430.0310.01710.0340.7470.0110.031PB13530.8660.6630.0340.690.8390.0450.0340.0430.0260.0540.0310.03410.0260.0310.055PB24940.0260.0260.0180.0270.0270.2740.0110.3030.7940.0280.0170.7470.02610.010.029PB26180.0310.0390.7150.0240.0320.0210.6180.0190.010.0340.7530.0110.0310.0110.034PB2650.0540.050.0350.0560.0550.0190.0370.0470.0280.7550.0340.0310.0550.0290.0341第69页 军事科学院博士学位论文表4.3H5N1亚型禽流感病毒氨基酸协同突变位点组合分布序号氨基酸协同突变位点组合1MP59,HA268,HA339,HA492,PB13532NA253,NS1903NS70,PB2654PB2494,PB1261,NS2145HA373,PA613,NA436,PB2618表4.3是H5N1亚型禽流感病毒中氨基酸协同突变位点的分布。我们从中可以发现H5N1亚型禽流感病毒中存在多个协同突变位点组合,其中包含氨基酸位点最少的组合仅含有2个氨基酸位点,而最多的组合包含多达5个氨基酸位点。这些协同突变位点不仅存在于单一基因节段内部,还出现了跨越多个基因节段的多重协同突变位点组合。为了进一步探究各个基因节段之间的协同进化关系,我们绘制了节段间的协同突变位点关联网络(图4.2)。图4.2中两两基因节段之间的连线表明两个基因节段间存在协同突变位点,线上的数字表示协同突变位点对数。图4.2H5N1亚型禽流感病毒各基因节段间的协同进化关联网络第70页 军事科学院博士学位论文分析图4.2,我们发现H5N1亚型禽流感病毒在多个基因节段间存在协同进化关系。其中HA基因节段不仅在自身内部存在协同进化位点,还分别于PB1,PB2,MP,PA以及NA基因节段间存在协同进化关系,是关联基因节段数最多的基因节段。从结果中我们可以看出,H5N1亚型禽流感病毒中有5个氨基酸协同突变组合。每个协同突变的组合中,位点间会发生多次协同突变,不断在两种氨基酸组合中切换,并保持高度的协同性。这些组合跨越了多个基因节段,跨越节段数最少的组合也包含两个基因节段,如NA基因节段的第253位氨基酸位点与NS基因节段的190位氨基酸位点存在协同突变,以及NS基因节段第70位氨基酸位点与PB2基因节段的第65位氨基酸位点间发生协同突变。而跨越基因节段最多的组合则包含四个基因节段,分别是HA基因节段的373位氨基酸位点,PA基因节段的第613位氨基酸位点,NA基因节段的436位氨基酸位点以及PB2基因节段的第618位氨基酸位点。4.3.2H7N9亚型禽流感病毒的协同进化分析H7N9亚型禽流感病毒在2013年首次被发现可以感染人之后就在中国频繁暴发疫情。在第二章中我们已经对H7N9亚型禽流感病毒的HA基因节段和NA基因节段的进化过程和基因特征进行分析。而在本章中,我们要针对H7N9亚型禽流感病毒全部8个基因节段的协同进化关系做更进一步的探究。特别注意的是,H7N9亚型禽流感病毒第五次疫情中出现的高致病性毒株的全基因组序列,截止到撰稿时尚未收录到GISAID基因数据库中。所以本节研究内容的主要研究对象都为H7N9亚型禽流感病毒的低致病性毒株。通过对H7N9亚型禽流感病毒各基因节段的氨基酸位点突变情况进行细致统计后,我们筛选出了31个突变频率在15%以上的氨基酸突变位点。我们对这些位点两两之间进行了互信息值的计算并整理成表(表4.4)。从表4.4中我们又筛选出互信息值大于0.7的氨基酸突变位点组合,绘制成各位点氨基酸突变情况变化图(图4.3)。第71页 军事科学院博士学位论文表4.4H7N9亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计NA236NA460NS111NS212NS216NS80PA100PA394PB2511PB2535PB2647NA23610.9160.0410.0450.0410.0420.0230.0150.2480.2220.257NA4600.91610.040.0440.040.0410.0210.0130.2420.2150.25NS1110.0410.0410.7210.7270.6650.0580.0410.010.0090.011NS2120.0450.0440.72110.7240.6650.0550.0380.0110.0110.012NS2160.0410.040.7270.72410.7920.0570.0360.0110.0110.012NS800.0420.0410.6650.6650.79210.0570.0390.0140.010.015PA1000.0230.0210.0580.0550.0570.05710.7240.0280.0370.034PA3940.0150.0130.0410.0380.0360.0390.72410.0170.020.017PB25110.2480.2420.010.0110.0110.0140.0280.01710.7920.898PB25350.2220.2150.0090.0110.0110.010.0370.020.79210.851PB26470.2570.250.0110.0120.0120.0150.0340.0170.8980.8511第72页 军事科学院博士学位论文图4.3H7N9亚型禽流感病毒协同突变氨基酸位点变化示意图图4.3中每一簇表示一组协同突变氨基酸位点组合,每一列表示一个氨基酸突变位点的突变情况。黄色的部分为未发生突变而保持原有氨基酸的情况,而红色的部分表示该位点发生了氨基酸突变。每一横行中的所有氨基酸位点都来自同一个毒株。表4.5H7N9亚型禽流感病毒氨基酸协同突变位点组合分布序号氨基酸协同突变位点组合1NA236,NA4602NS111,NS80,NS2163NS212,NS111,NS2164PA100,PA3945PB2511,PB2535,PB2647第73页 军事科学院博士学位论文表4.5是H7N9亚型禽流感病毒中氨基酸协同突变位点的分布。从中可以发现,H7N9亚型禽流感病毒存在多个协同突变位点组合,其中包含氨基酸位点最少的组合仅含有2个氨基酸位点,而最多的组合包含3个氨基酸位点。与H5N1亚型禽流感病毒不同的是,这些协同突变位点仅存在于单一基因节段内部,并未出现跨越多个基因节段的情况。我们将H7N9亚型禽流感病毒的协同进化情况绘制成了关联网络图(图4.2)。图4.4H7N9亚型禽流感病毒各基因节段间的协同进化关联网络分析图4.4,我们发现H7N9亚型禽流感病毒的协同进化过程多存在于基因节段内部,而在基因节段间并不存在明显的协同进化关系。从结果中我们可以看出,H7N9亚型禽流感病毒中有5个氨基酸协同突变组合。每个协同突变的组合中,位点间会发生多次协同突变,不断在两种氨基酸组合中切换,并保持高度的协同性。这些组合仅出现在NA基因节段,PA基因节段以及PB2基因节段内部,并没有出现基因节段间的协同进化现象。总体上来说,H7N9亚型禽流感病毒在进化过程中呈现出的协同度相比于H5N1亚型禽流第74页 军事科学院博士学位论文感病毒,仍处于相对较低的水平。4.3.4H9N2亚型禽流感病毒的协同进化分析在上一章中,我们针对H9N2亚型禽流感病毒的进化与传播规律进行了系统的研究,并发现H9N2亚型禽流感病毒在进化的过程中衍生出了有各自独立传播区域和进化过程的三个种群。三个种群的病毒在进化特征上有明显差异,而如果将H9N2亚型禽流感病毒视为一个整体进行协同进化分析,则会因为种群间的差异而引起较大的计算误差。因此,为了减小种群差异对协同进化分析结果的影响,我们将进行种群内部的协同进化分析。通过收集和筛选H9N2亚型禽流感病毒的全基因组序列,我们发现“世界群”和“亚非群”的病毒的可用全基因组序列总数均不足50条,数据量过小以至于不足以进行有效的协同进化分析。因此我们仅选择了数据样本数较多的H9N2亚型禽流感病毒的“中国群”序列进行协同进化分析。通过对“中国群”的H9N2亚型禽流感病毒各氨基酸突变位点的突变情况统计,我们筛选出了185个突变频率在15%以上的氨基酸突变位点。并对这些位点两两之间进行了互信息值的计算并整理成表(表4.6)。从表4.6中我们又筛选出互信息值大于0.7的氨基酸突变位点组合,绘制成各位点氨基酸突变情况变化图(图4.5)。图4.5中每一簇表示一组协同突变氨基酸位点组合,每一列表示一个氨基酸突变位点的突变情况。黄色的部分为未发生突变而保持原有氨基酸的情况,而红色的部分表示该位点发生了氨基酸突变。每一横行中的所有氨基酸位点都来自同一个毒株。第75页 军事科学院博士学位论文表4.6“中国群”H9N2亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计(分表1)HA180HA285HA287HA315HA334MP140MP142MP157MP158MP219MP222MP224MP227MP242MP248MP46MP95NA16NA302NA432HA18010.6820.6760.6120.720.2560.2540.2540.2540.2290.2490.240.2110.240.2610.2290.2330.0470.0480.137HA2850.68210.7930.7220.8520.2570.2550.2550.2550.2360.2310.1980.2150.1980.2360.2360.1870.0340.0340.103HA2870.6760.79310.7610.9230.2770.2760.2760.2760.2490.2440.20.230.20.2490.2490.1860.0370.0370.128HA3150.6120.7220.76110.8180.2780.2760.2760.2760.2480.2430.2330.2280.2330.2480.2480.2150.0380.0380.117HA3340.720.8520.9230.81810.2830.2820.2820.2820.2540.2480.2050.2330.2050.2540.2540.1890.0370.0370.12MP1400.2560.2570.2770.2780.28310.9510.9510.9510.8710.8410.4140.6990.4140.8710.8710.4140.0930.0940.116MP1420.2540.2550.2760.2760.2820.9511110.9130.880.4110.730.4110.9130.9130.4110.0920.0940.119MP1570.2540.2550.2760.2760.2820.9511110.9130.880.4110.730.4110.9130.9130.4110.0920.0940.119MP1580.2540.2550.2760.2760.2820.9511110.9130.880.4110.730.4110.9130.9130.4110.0920.0940.119MP2190.2290.2360.2490.2480.2540.8710.9130.9130.91310.8060.4240.6910.4240.8350.8350.4240.0940.0960.115MP2220.2490.2310.2440.2430.2480.8410.880.880.880.80610.3650.6690.3650.8060.8060.3650.0930.0940.117MP2240.240.1980.20.2330.2050.4140.4110.4110.4110.4240.36510.33910.4240.3740.8560.1390.1190.141MP2270.2110.2150.230.2280.2330.6990.730.730.730.6910.6690.33910.3390.6910.8020.3390.0890.0910.141MP2420.240.1980.20.2330.2050.4140.4110.4110.4110.4240.36510.33910.4240.3740.8560.1390.1190.141MP2480.2610.2360.2490.2480.2540.8710.9130.9130.9130.8350.8060.4240.6910.42410.8350.4240.0940.0960.127MP460.2290.2360.2490.2480.2540.8710.9130.9130.9130.8350.8060.3740.8020.3740.83510.3740.0940.0960.127MP950.2330.1870.1860.2150.1890.4140.4110.4110.4110.4240.3650.8560.3390.8560.4240.37410.1170.1040.127NA160.0470.0340.0370.0380.0370.0930.0920.0920.0920.0940.0930.1390.0890.1390.0940.0940.11710.7860.069第76页 军事科学院博士学位论文NA3020.0480.0340.0370.0380.0370.0940.0940.0940.0940.0960.0940.1190.0910.1190.0960.0960.1040.78610.071NA4320.1370.1030.1280.1170.120.1160.1190.1190.1190.1150.1170.1410.1410.1410.1270.1270.1270.0690.0711NA450.1220.1030.1160.1050.1070.1050.1080.1080.1080.1040.1070.1270.1280.1270.1150.1150.1150.0530.0540.841NA540.1270.1040.1190.1070.110.0990.1010.1010.1010.0980.1010.1270.1190.1270.1090.1070.1140.0670.0680.755PA4050.1570.1220.1330.1260.1290.2530.2220.2220.2220.2140.2110.320.240.320.2140.2140.2870.0670.0560.11PA6070.1590.1120.1220.1150.1170.2130.2190.2190.2190.2110.2080.3280.2370.3280.2330.2110.2940.0680.0570.123PA610.1490.1140.1260.1180.1210.2320.2390.2390.2390.2310.2270.3070.2590.3070.2310.2310.2740.0650.0530.102PA630.1550.10.1080.1010.1030.1920.1970.1970.1970.1890.1870.2650.1940.2650.2080.1890.2410.0760.0640.107PB11130.1650.1280.1390.1320.1350.2450.2520.2520.2520.2420.2390.3280.2730.3280.2660.2420.2950.0860.070.159PB12140.1270.1030.1060.0950.0970.1640.1690.1690.1690.1630.1640.2710.1810.2710.1830.1630.2330.0690.0520.092PB13750.1410.1170.1170.1080.1110.1750.180.180.180.1740.1750.2990.1940.2990.1940.1740.2590.0740.0570.108PB13980.1770.1370.1480.1420.1460.2590.2670.2670.2670.2570.2520.3740.2890.3740.2830.2570.3280.0870.0690.175PB1480.1730.1450.1460.1680.1490.3420.340.340.340.350.3010.6010.2810.6010.350.3080.5460.1590.1390.117PB15730.190.1570.1650.1610.1650.3190.3290.3290.3290.3140.3080.3630.3640.3630.3450.3140.3310.1040.0860.169PB1620.1320.1080.1090.0990.1010.1740.1790.1790.1790.1730.1740.280.1920.280.1940.1730.2410.0710.0540.102PB16380.1910.1550.1640.1590.1630.3570.3690.3690.3690.3530.3450.40.4070.40.3880.3530.360.0980.080.168PB1750.1320.1080.1090.0990.1010.1740.1790.1790.1790.1730.1740.280.1920.280.1940.1730.2410.0710.0540.102PB25350.090.0870.0870.0930.0920.050.050.050.050.0510.050.0720.0480.0720.0510.0510.0720.0280.0220.038PB26470.090.0870.0870.0930.0920.050.050.050.050.0510.050.0720.0480.0720.0510.0510.0720.0280.0220.038PB26480.2130.1640.1660.190.1690.3490.3470.3470.3470.3570.3090.6320.2880.6320.3570.3150.5730.1480.1290.122第77页 军事科学院博士学位论文表4.6“中国群”H9N2亚型禽流感病毒氨基酸协同突变位点的互信息值计算结果统计(分表2)NA45NA54PA405PA607PA61PA63PB1PB1PB1PB1PB148PB1PB162PB1PB175PB2PB2PB2113214375398573638535647648HA1800.1220.1270.1570.1590.1490.1550.1650.1270.1410.1770.1730.190.1320.1910.1320.090.090.213HA2850.1030.1040.1220.1120.1140.10.1280.1030.1170.1370.1450.1570.1080.1550.1080.0870.0870.164HA2870.1160.1190.1330.1220.1260.1080.1390.1060.1170.1480.1460.1650.1090.1640.1090.0870.0870.166HA3150.1050.1070.1260.1150.1180.1010.1320.0950.1080.1420.1680.1610.0990.1590.0990.0930.0930.19HA3340.1070.110.1290.1170.1210.1030.1350.0970.1110.1460.1490.1650.1010.1630.1010.0920.0920.169MP1400.1050.0990.2530.2130.2320.1920.2450.1640.1750.2590.3420.3190.1740.3570.1740.050.050.349MP1420.1080.1010.2220.2190.2390.1970.2520.1690.180.2670.340.3290.1790.3690.1790.050.050.347MP1570.1080.1010.2220.2190.2390.1970.2520.1690.180.2670.340.3290.1790.3690.1790.050.050.347MP1580.1080.1010.2220.2190.2390.1970.2520.1690.180.2670.340.3290.1790.3690.1790.050.050.347MP2190.1040.0980.2140.2110.2310.1890.2420.1630.1740.2570.350.3140.1730.3530.1730.0510.0510.357MP2220.1070.1010.2110.2080.2270.1870.2390.1640.1750.2520.3010.3080.1740.3450.1740.050.050.309MP2240.1270.1270.320.3280.3070.2650.3280.2710.2990.3740.6010.3630.280.40.280.0720.0720.632MP2270.1280.1190.240.2370.2590.1940.2730.1810.1940.2890.2810.3640.1920.4070.1920.0480.0480.288MP2420.1270.1270.320.3280.3070.2650.3280.2710.2990.3740.6010.3630.280.40.280.0720.0720.632MP2480.1150.1090.2140.2330.2310.2080.2660.1830.1940.2830.350.3450.1940.3880.1940.0510.0510.357MP460.1150.1070.2140.2110.2310.1890.2420.1630.1740.2570.3080.3140.1730.3530.1730.0510.0510.315MP950.1150.1140.2870.2940.2740.2410.2950.2330.2590.3280.5460.3310.2410.360.2410.0720.0720.573第78页 军事科学院博士学位论文NA160.0530.0670.0670.0680.0650.0760.0860.0690.0740.0870.1590.1040.0710.0980.0710.0280.0280.148NA3020.0540.0680.0560.0570.0530.0640.070.0520.0570.0690.1390.0860.0540.080.0540.0220.0220.129NA4320.8410.7550.110.1230.1020.1070.1590.0920.1080.1750.1170.1690.1020.1680.1020.0380.0380.122NA4510.7550.0960.1090.0890.0940.1410.0920.1080.1560.1050.1520.1020.1510.1020.0380.0380.11NA540.75510.1010.1130.0930.0980.1480.0960.1120.1630.1050.1730.1060.1710.1060.0370.0370.11PA4050.0960.10110.8660.8640.640.5370.330.3860.5720.2660.4370.3480.4380.3480.0460.0460.273PA6070.1090.1130.86610.8470.7020.5880.370.4310.6330.2720.4720.390.4760.390.0470.0470.279PA610.0890.0930.8640.84710.6340.530.3180.3750.5620.2560.4330.3360.4340.3360.0460.0460.262PA630.0940.0980.640.7020.63410.4520.3050.350.4860.2180.3590.3190.3670.3190.0340.0340.257PB11130.1410.1480.5370.5880.530.45210.4770.5420.770.3090.6070.4980.6050.4980.0460.0460.317PB12140.0920.0960.330.370.3180.3050.47710.7790.5510.230.4050.90.4440.90.0380.0380.236PB13750.1080.1120.3860.4310.3750.350.5420.77910.5490.2530.4550.8350.4360.8350.0410.0410.258PB13980.1560.1630.5720.6330.5620.4860.770.5510.54910.3110.6060.5780.5970.5780.0470.0470.318PB1480.1050.1050.2660.2720.2560.2180.3090.230.2530.31110.3230.2380.3710.2380.0810.0810.779PB15730.1520.1730.4370.4720.4330.3590.6070.4050.4550.6060.32310.4210.8090.4210.0560.0560.333PB1620.1020.1060.3480.390.3360.3190.4980.90.8350.5780.2380.42110.46310.0390.0390.243PB16380.1510.1710.4380.4760.4340.3670.6050.4440.4360.5970.3710.8090.46310.4630.0530.0530.379PB1750.1020.1060.3480.390.3360.3190.4980.90.8350.5780.2380.42110.46310.0390.0390.243PB25350.0380.0370.0460.0470.0460.0340.0460.0380.0410.0470.0810.0560.0390.0530.039110.075PB26470.0380.0370.0460.0470.0460.0340.0460.0380.0410.0470.0810.0560.0390.0530.039110.075PB26480.110.110.2730.2790.2620.2570.3170.2360.2580.3180.7790.3330.2430.3790.2430.0750.0751第79页 军事科学院博士学位论文图4.5“中国群”H9N2亚型禽流感病毒协同突变氨基酸位点变化示意图第80页 军事科学院博士学位论文表4.7“中国群”H9N2亚型禽流感病毒氨基酸协同突变位点组合分布序号氨基酸协同突变位点组合1HA287,HA334,HA285,HA315,HA1802MP142,MP157,MP219,MP158,MP46,MP248,MP140,MP222,MP2273MP242,MP95,MP2244NA16,NA3025NA432,NA45,NA546PA405,PA61,PA63,PA6077PB148,PB26488PB1113,PB13989PB162,PB175,PB1375,PB121410PB1573,PB163811PB2535,PB2647表4.7是“中国群”H9N2亚型禽流感病毒中氨基酸协同突变位点的分布。从表中可以发现,H9N2亚型禽流感病毒存在11个协同突变位点组合,其中包含氨基酸位点最少的组合仅含有2个氨基酸位点,而最多的组合包含多达9个氨基酸位点。这些协同突变位点多存在于单一基因节段内部,仅有PB1基因节段的第48位氨基酸位点和PB2基因节段的第648位氨基酸位点间出现了跨越两个基因节段协同突变的情况。我们将H9N2亚型禽流感病毒的协同进化情况绘制成了关联网络图(图4.6)。图4.6“中国群”H9N2亚型禽流感病毒各基因节段间的协同进化关联网络第81页 军事科学院博士学位论文从结果中我们可以看出,“中国群”H9N2亚型禽流感病毒中有11个氨基酸协同突变组合。每个协同突变的组合中,位点间会发生多次协同突变,不断在不同种氨基酸组合中切换,并保持高度的协同性。这些组合大多数出现在同一基因节段内部,仅有一组协同突变组合跨越了基因节段,在PB1基因节段和PB2基因节段出现了协同进化关系。此外“中国群”H9N2亚型禽流感病毒中仅有NP基因节段和NS基因节段中没有出现协同进化位点。而出现协同突变位点最多的基因节段是MP基因节段,共有35对协同突变位点对。4.4讨论我们分别对H5N1亚型禽流感病毒,H7N9亚型禽流感病毒以及“中国群”的H9N2亚型禽流感病毒的协同进化模式进行了研究。并通过计算各突变氨基酸位点“归一化”后的互信息将各亚型中出现的协同位点分布以图表的形式详细的呈现了出来。为了保证计算结果的准确性和可靠性,我们首先收集了所有可获得的测序质量高的全基因组序列,保证了研究数据本身的质量。其次,我们选用了各基因节段序列中的最长编码区作为各个基因节段的代表,既最大程度的保证了基因节段信息的完整性,又降低了由于编码序列过短而带来的统计学误差。此外,我们在对H9N2亚型禽流感病毒研究时,排除了不同种群H9N2亚型禽流感病毒对研究带来的偏差和影响,并选择了样本量足够的“中国群”作为H9N2亚型禽流感病毒协同进化分析的研究对象。H5N1亚型禽流感病毒和H7N9亚型禽流感病毒都仅出现了5组氨基酸协同进化位点组合,然而H5N1亚型禽流感病毒的这些组合大多跨越了多个基因节段,说明各个基因节段之间存在复杂的协同进化关系。而H7N9亚型禽流感病毒,全部5组氨基酸协同进化位点组合都只出现在单一基因节段内部,不同基因节段间不存在明显的协同进化关系。而“中国群”H9N2亚型禽流感病毒共出现11组氨基酸协同进化位点组合,比H5N1亚型禽流感病毒和H7N9亚型禽流感病毒出现的氨基酸协同进化位点组合的总和还要多。这说明“中国群”H9N2亚型禽流感病毒在进化过程中氨基酸突变位点之间存在更强的协同进化关系。然而,“中国群”H9N2亚型禽流感病毒的这些组合中,仅有一组组合跨越了PB1基因节段和PB2基因节段,其他组合都只出现在单一基因节段内部。三种重要亚型禽流感病毒在协同进化模式上存在差异,结合各亚型的进化与传播规律我们认为这种差异的产生可能与基因节段间重配的限制性有关。H5N1亚型禽流感病毒从1997年起开始广泛传播在全世界60多个国家,传播宿主多样,第82页 军事科学院博士学位论文以野鸟迁徙为主要传播动力,病毒的生存环境多样[126]。因此在H5N1亚型禽流感病毒的进化过程中,为了保持病毒在各种生存环境下都可以具有一定生存能力,需要保持其遗传特性的稳定并有效滤除掉因随机重配而产生的降低其生存能力的重配类型[128-130]。因此,H5N1亚型禽流感病毒各基因节段之间可能存在较强的重配限制性。进而各个基因节段间出现了这种跨基因节段的协同进化关系,有助于病毒在面临环境改变或宿主改变时保持自身基因的稳定性进而提高生存概率。而H7N9亚型禽流感病毒和“中国群”H9N2亚型禽流感病毒主要的传播地理范围都在中国大陆及周边地区,主要的宿主都是鸡宿主。病毒在进化过程中主要的挑战并不是面临生存环境改变的威胁,而是如何更多的利用资源来完善自身的进化提高自身的生存能力。“中国群”H9N2亚型禽流感病毒与H7N9亚型禽流感病毒除了两个表面糖蛋白基因节段HA和NA外,其他的6个基因节段会在彼此之间以及与其他亚型禽流感病毒之间频繁发生重配,进而丰富自身的基因库,进而达到提高自身生存能力的目的[131-133]。而基因节段间的协同进化关系越多则会对基因节段间的重配造成越多的限制,达不到病毒进化过程中最大化利用重配资源的目的。因此很有可能,“中国群”H9N2亚型禽流感病毒和H7N9亚型禽流感病毒为了达到最大化与其它亚型禽流感病毒内部基因节段资源重配的目的,而降低了甚至消除了各基因节段之间的重配限制性,进而基因节段之间的协同进化关系也随之消失,转而更注重基因节段内部的协同进化关系。“中国群”H9N2亚型禽流感病毒相比于H5N1亚型禽流感病毒,H7N9亚型禽流感病毒拥有更长的进化与传播时间,因此经历的进化过程的完成度也更高,进而得到的氨基酸协同突变位点组合也越多。而H7N9亚型禽流感病毒拥有的进化和传播时间相对较短,因此进化出的协同突变位点组合数和突变位点数也相对较低。第83页 军事科学院博士学位论文第五章全文总结与展望全篇论文围绕禽流感病毒的进化和传播规律这一大主题,进行多方面的探索和研究。这些研究涉及到了新发禽流感病毒的起源追溯,进化演变,遗传特征,传播规律以及协同进化模式等各个方面。我们通过生物信息学方法,发现并证明了第五次H7N9亚型禽流感病毒疫情中毒株获得了新的遗传特性,在密码子使用,进化速率以及氨基酸突变等各个方面都与以往有明显差异。甚至还通过互信息计算方法在HA基因节段中发现了可能与高致病性相关的四个氨基酸突变位点。目前对第五次疫情中H7N9亚型禽流感病毒进化的最新研究[134],详细描述了H7N9亚型禽流感病毒高致病性毒株和低致病性毒株的地理分布和传播特性,并发现第五次疫情共出现了36个基因型,其中有27个基因型是第一次出现。这说明第五次疫情在进化过程中确实获得了新的遗传特性这与本文的研究结果相互印证。在此基础上本文更进一步的追踪了H7N9亚型禽流感病毒在几次疫情中动态的进化过程,并发现H7N9亚型禽流感病毒在每次疫情中都会完成一次进化过程进而缓慢改变自己遗传特性,而与前三次疫情不同,H7N9亚型禽流感病毒的第四次疫情和第五次疫情却呈现出了更加复杂的关系。通过多方面论证探究,我们发现第四疫情和第五次疫情共同构成了一个“两步”进化过程,使得病毒在第四次疫情中率先完成NA基因节段的进化,之后又在此基础上通过第五次疫情完成HA基因节段的进化,而这样的进化过程加快了病毒遗传特性的改变进而获得了与以往不同的高传播力和高危害性。这样的“两步”进化过程在禽流感病毒的进化历程中十分罕见。此外,通过重配分析我们发现H7N9亚型禽流感病毒的6个内部基因节段都与H9N2亚型禽流病病毒频繁发生重配,因此在接下来的研究中,我们的研究重点转向了H9N2亚型禽流感病毒。H9N2亚型禽流感病毒不仅是进化过程最为复杂,传播范围最为广泛,传播时间最为漫长,跨越宿主种类最为多样的禽流感病毒之一,而且频繁通过与其他亚型流感病毒重配不断产生可以威胁到人类生命安全的新型病毒。而以往对H9N2亚型禽流感病毒的研究多着眼于某一种类型或者某一个地理位置的病毒传播规律和进化过程,缺乏对H9N2亚型禽流感病毒全球传播规律的探索。本文中对经典系统地理发生学方法进行了创新,使用进化分析与系统地理发生学结合的方式,依据遗传特性和进化关系将H9N2亚型禽流感病毒分为“世界群”“亚非群”和第84页 军事科学院博士学位论文“中国群”三个种群后分别对三个种群构建系统地理发生学模型重建,揭示了H9N2亚型禽流感病毒在全球范围内三条主要的传播线路,各种群间的传播动力差异以及世界范围内各个病毒传播中心的地理位置。此外还通过三群病毒的宿主分布,起源时间,选择压力,传播线路以及进化特征,推测出H9N2亚型禽流感病毒是通过全球“播种”,区域性进化的模式,产生了拥有不同遗传特性并且在特定地理传播范围内具有优势生存能力的三大种群。对禽流感病毒进化的研究,大多局限于探究禽流感病毒单一蛋白的抗原漂移规律,或者寻找某些重要氨基酸突变位点以及正选择压力作用位点。然而,禽流感病毒的进化是一个更加复杂的机制,不仅依赖于单一重要氨基酸位点的突变,还受到不同氨基酸位点间的协同突变以及不同蛋白间的协同进化的影响。目前对禽流感病毒中存在的协同进化模式仍缺乏探索,本文通过协同进化分析方法分别对H5N1,H7N9以及“中国群”H9N2亚型禽流病病毒的氨基酸突变位点的协同性进行了详细而系统的分析。不仅计算出每种亚型禽流感病毒的氨基酸协同突变位点组合,还绘制了不同基因节段间的协同进化关联网络。通过比较三种亚型禽流感病毒协同进化模式,我们发现传播地理地域最为广泛的H5N1亚型禽流感病毒不同基因节段中的协同进化关联程度较高,尤其是HA基因节段会与多个基因节段保持协同进化关系。而主要传播范围局限于中国大陆及周边地区的H7N9亚型禽流感病毒和“中国群”H9N2亚型禽流感病毒中,各基因节段间的协同进化关系关联度极低。此外,传播时间最久的“中国群”H9N2亚型禽流感病毒拥有最多的氨基酸协同突变位点,而传播时间最短的H7N9亚型禽流感病毒获得的氨基酸协同突变位点数最少。尽管本文从起源追溯,进化演变,遗传特征,传播规律以及协同进化模式等各个方面对禽流感病毒的进化与传播规律进行了较为详细而系统的研究。但仍存在一些不足,比如H9N2亚型禽流感病毒的协同进化模式研究中,由于目前可用的序列数量不足,以至于无法对“世界群”和“亚非群”的H9N2亚型禽流感病毒进行协同进化分析。而如果可以得到充足的序列信息,我们就可以分析得到“世界群”H9N2亚型禽流感病毒协同进化模式。进而可以将其与同样在世界范围内大肆传播的H5N1亚型禽流感病毒的协同进化模式相比较,而得出更系统的禽流感病毒协同进化模式的相关规律。此外,禽流感病毒可感染的宿主越来越多,可感染人的新型禽流感也层出不穷,禽流感病毒给人类带来的威胁也越来越大。因此研究禽流感病毒进化与宿主相互作用将会是将来的重要发展方向,尤其是禽流感病毒进化与宿主个体的遗传多样性,发病状况以及禽流感病毒在不同宿主体内的进化变异等方面。尽管目前禽流感病毒的基因组数据较为庞大,但仍不够完备,在未来研究病原体与宿主之第85页 军事科学院博士学位论文间的关系中将会需要更多的基因组数据支撑。使用科学的方法如机器学习等将这些数据与分子遗传学,流行病学,临床医学甚至人工智能等学科相互结合,会对未来研究带来更深层的意义和更新更远的前景。第86页 军事科学院博士学位论文参考文献:[1].BaigentSJ,MccauleyJW.InfluenzatypeAinhumans,mammalsandbirds:determinantsofvirusvirulence,host-rangeandinterspeciestransmission[J].Bioessays,2003,25(7):657-671.[2].YoonSW,WebbyRJ,WebsterRG.EvolutionandEcologyofInfluenzaAViruses[J].CurrentTopicsinMicrobiology&Immunology,1992,56(1):152-79.[3].TaubenbergerJK,MorensDM:1918influenza:themotherofallpandemics.EmergingInfectiousDiseases2006,12(1):15-22.[4].WebsterRG,GuanY,PeirisM,etal.CharacterizationofH5N1influenzavirusesthatcontinuetocirculateingeeseinsoutheasternChina.[J].JournalofVirology,2002,76(1):118-26.[5].CheungCL,RaynerJM,SmithGJD,etal.DistributionofAmantadine-ResistantH5N1AvianInfluenzaVariantsinAsia[J].JournalofInfectiousDiseases,2006,193(12):1626.[6].GovorkovaEA,RehgJE,KraussS,etal.LethalitytoferretsofH5N1influenzavirusesisolatedfromhumansandpoultryin2004[J].JournalofVirology,2005,79(4):2191-8.[7].GovorkovaEA,BaranovichT,SeilerP,etal.AntiviralresistanceamonghighlypathogenicinfluenzaA(H5N1)virusesisolatedworldwidein2002–2012showsneedforcontinuedmonitoring[J].AntiviralRes,2013,98(2):297-304.[8].VijaykrishnaD,BahlJ,RileyS,etal.EvolutionaryDynamicsandEmergenceofPanzooticH5N1InfluenzaViruses[J].PlosPathogens,2008,4(9):e1000161.[9].NagarajanS,ToshC,SmithDK,etal.Avianinfluenza(H5N1)virusofclade2.3.2indomesticpoultryinIndia.[J].PlosOne,2012,7(2):e31844.[10].GuanY,SmithGJ.TheemergenceanddiversificationofpanzooticH5N1influenzaviruses[J].VirusResearch,2013,178(1):35-43.[11].GaoR,CaoB,HuY,FengZ,WangD,HuW,ChenJ,JieZ,QiuH,XuKetal:HumanInfectionwithaNovelAvian-OriginInfluenzaA(H7N9)Virus.NewEnglandJournalofMedicine2013,368(20):1888-1897.[12]CuiL,LiuD,ShiW,etal.Dynamicreassortmentsandgeneticheterogeneityofthehuman-infectinginfluenzaA(H7N9)virus[J].NatureCommunications,2014,5(1):3142.[13].ChenH,YuanH,GaoR,ZhangJ,WangD,XiongY,FanG,YangF,LiX,ZhouJetal:ClinicalandepidemiologicalcharacteristicsofafatalcaseofavianinfluenzaAH10N8virusinfection:adescriptivestudy.Lancet2014,第87页 军事科学院博士学位论文383(9918):714-721[14].HommePJ,EasterdayBC.AvianInfluenzaVirusInfections.I.CharacteristicsofInfluenzaA/Turkey/Wisconsin/1966Virus[J].AvianDiseases,1970,14(1):66-74.[15].LiKS,XuKM,PeirisJS,etal.CharacterizationofH9subtypeinfluenzavirusesfromtheducksofsouthernChina:acandidateforthenextinfluenzapandemicinhumans?[J].JournalofVirology,2003,77(12):6988.[16].ButtKM,SmithGJ,ChenH,etal.HumaninfectionwithanavianH9N2influenzaAvirusinHongKongin2003.[J].JournalofClinicalMicrobiology,2005,43(11):5760-7.[17].XuKM,SmithGJ,BahlJ,etal.ThegenesisandevolutionofH9N2influenzavirusesinpoultryfromsouthernChina,2000to2005.[J].JournalofVirology,2007,81(19):10389-401.[18].靳远.甲型流感病毒重要亚型的进化研究[D].中国人民解放军军事医学科学院解放军军事医学科学院,2015.[19].VasinAV,TemkinaOA,EgorovVV,KlotchenkoSA,PlotnikovaMA,KiselevOI:MolecularmechanismsenhancingtheproteomeofinfluenzaAviruses:Anoverviewofrecentlydiscoveredproteins.VirusResearch2014,185:53-63.[20].SchrauwenEJA,GraafMD,HerfstS,etal.DeterminantsofvirulenceofinfluenzaAvirus[J].EuropeanJournalofClinicalMicrobiology&InfectiousDiseasesOfficialPublicationoftheEuropeanSocietyofClinicalMicrobiology,2014,33(4):479.[21].WeiS-H,YangJ-R,WuH-S,ChangM-C,LinJ-S,LinC-Y,LiuY-L,LoY-C,YangC-H,ChuangJ-Hetal:HumaninfectionwithavianinfluenzaAH6N1virus:anepidemiologicalanalysis.LancetRespiratoryMedicine2013,1(10):771-778.[22].KoopmansM:Theexpandinglistofzoonoticinfluenzaviruses.LancetRespiratoryMedicine2013,1(10):756-757.[23].NelsonMI,HolmesEC:Theevolutionofepidemicinfluenza.NatureReviewsGenetics2007,8(3):196-205.[24].FitchWM,BushRM,BenderCA,CoxNJ:LongtermtrendsintheevolutionofH(3)HA1humaninfluenzatypeA.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica1997,94(15):7712-7718.[25].SoltanialvarM,GoodarziR,AkbarnejadF.Geneticanalysisofpolymerasecomplex(PA,PB1andPB2)genesofH9N2avianinfluenzavirusesfromIran(1999to2009)[J].AsianPacificJournalofTropicalBiomedicine,2012,2(11):858.[26].HattaM,GaoP,HalfmannP,KawaokaY:MolecularbasisforhighvirulenceofHongKongH5N1influenzaAviruses.Science2001,293(5536):1840-1842.[27].FouchierRA,SchneebergerPM,RozendaalFW,BroekmanJM,KeminkSA,MunsterV,KuikenT,RimmelzwaanGF,SchuttenM,VanDoornumGJetal:Avian第88页 军事科学院博士学位论文influenzaAvirus(H7N7)associatedwithhumanconjunctivitisandafatalcaseofacuterespiratorydistresssyndrome.ProcNatlAcadSciUSA2004,101(5):1356-1361.[28].ChenY,LiangW,YangS,WuN,GaoH,ShengJ,YaoH,WoJ,FangQ,CuiDetal:HumaninfectionswiththeemergingavianinfluenzaAH7N9virusfromwetmarketpoultry:clinicalanalysisandcharacterisationofviralgenome.Lancet2013,381(9881):1916-1925.[29].WolfYI,ViboudC,HolmesEC,KooninEV,LipmanDJ:LongintervalsofstasispunctuatedbyburstsofpositiveselectionintheseasonalevolutionofinfluenzaAvirus.BiologyDirect2006,1:34[30].SmithGJD,BahlJ,VijaykrishnaD,ZhangJ,PoonLLM,ChenH,WebsterRG,PeirisJSM,GuanY:Datingtheemergenceofpandemicinfluenzaviruses.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica2009,106(28):11709-11712.[31].WorobeyM,HanG-Z,RambautA:Genesisandpathogenesisofthe1918pandemicH1N1influenzaAvirus.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica2014,111(22):8107-8112.[32].ReidAH,TaubenbergerJK,FanningTG:Evidenceofanabsence:thegeneticoriginsofthe1918pandemicinfluenzavirus.NatureReviewsMicrobiology2004,2(11):909-914.[33].NakajimaK,DesselbergerU,PaleseP:RecenthumaninfluenzaA(H1N1)virusesarecloselyrelatedgeneticallytostrainsisolatedin1950.Nature1978,274(5669):334-339[34].BushRM,FitchWM,BenderCA,etal.PositiveselectionontheH3hemagglutiningeneofhumaninfluenzavirusA[J].MolecularBiology&Evolution,1999,16(11):1457.[35].CampitelliL,CiccozziM,SalemiM,etal.H5N1influenzavirusevolution:acomparisonofdifferentepidemicsinbirdsandhumans(1997-2004)[J].JournalofGeneralVirology,2006,87(4):955-960.[36].SmithGJD,NaiposposTSP,NguyenTD,etal.EvolutionandadaptationofH5N1influenzavirusinavianandhumanhostsinIndonesiaandVietnam[J].Virology,2006,350(2):258-268.[37].史卫峰,MarkJGibbs,张彦周,等.H5N1禽流感病毒血凝素基因密码子的变异[J].中国科学:,2008(10):949-955.[38].NielsenR.Mappingmutationsonphylogenies.[J].SystematicBiology,2002,51(5):729-739.[39].SuzukiY,GojoboriT.Amethodfordetectingpositiveselectionatsingleaminoacidsites.[J].MolecularBiology&Evolution,1999,16(10):1315-1328.[40].HuelsenbeckJP,DyerKA.BayesianEstimationofPositivelySelected第89页 军事科学院博士学位论文Sites[J].JournalofMolecularEvolution,2004,58(6):661-672.[41].NielsenR,YangZ.LikelihoodmodelsfordetectingpositivelyselectedaminoacidsitesandapplicationstotheHIV-1envelopegene.[J].Genetics,2009,148(3):929.[42].YangZ,NielsenR,GoldmanN,etal.Codon-SubstitutionModelsforHeterogeneousSelectionPressureatAminoAcidSites[J].Genetics,2000,155(1):431-449.[43].KosakovskyPondSL,FrostSD.Notsodifferentafterall:acomparisonofmethodsfordetectingaminoacidsitesunderselection.[J].MolecularBiology&Evolution,2005,22(5):1208.[44].SuzukiY.NewMethodsforDetectingPositiveSelectionatSingleAminoAcidSites[J].JournalofMolecularEvolution,2004,59(1):11-19.[45].YangZ,SwansonWJ.Codon-substitutionmodelstodetectadaptiveevolutionthataccountforheterogeneousselectivepressuresamongsiteclasses[J].MolecularBiology&Evolution,2002,19(1):49.[46].HumphreysDP,SehdevM,ChapmanAP,etal.High-levelperiplasmicexpressioninEscherichiacoliusingaeukaryoticsignalpeptide:importanceofcodonusageatthe5'endofthecodingsequence.[J].ProteinExpression&Purification,2000,20(2):252.[47].VervoortEB,RavesteinAV,PeijNNMEV,etal.OptimizingheterologousexpressioninDictyostelium:importanceof5′codonadaptation[J].NucleicAcidsResearch,2000,28(10):2069-2074.[48].RahmanSU,MaoY,TaoS.CodonusagebiasandevolutionaryanalysesofZikavirusgenomes[J].Genes&Genomics,2017,39(8):855-866.[49].LiebermanRW,BagdasarianN,ThomasD,etal.SeasonalInfluenzaA(H1N1)InfectioninEarlyPregnancyandSecondTrimesterFetalDemise[J].EmergingInfectiousDiseases,2011,17(1):107.[50].AviseJ:Phylogeography:thehistoryandformationofspecies.Cambridge,Mass:HarvardUniversityPress;2000.[51].HolmesEC:Thephylogeographyofhumanviruses.MolEcol2004,13(4):745–756.[52].ScotchM,MeiC,MakonnenYJ,etal.PhylogeographyofinfluenzaAH5N1clade2.2.1.1inEgypt[J].BmcGenomics,2013,14(1):871.[53].JinY,YuD,RenH,etal.PhylogeographyofAvianinfluenzaAH9N2inChina[J].BmcGenomics,2014,15(1):1110.[54].LiX,ZhangZ,YuA,etal.GlobalandLocalPersistenceofInfluenzaA(H5N1)Virus[J].EmergingInfectiousDiseases,2014,20(8):1287-1295.[55].LinYP,ShawM,GregoryV,etal.Avian-to-humantransmissionofH9N2subtypeinfluenzaAviruses:RelationshipbetweenH9N2andH5N1humanisolates[J].第90页 军事科学院博士学位论文ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2000,97(17):9654-9658.[56].SharpPM,EmeryLR,ZengK.Forcesthatinfluencetheevolutionofcodonbias.[J].PhilosophicalTransactionsoftheRoyalSocietyofLondon,2010,365(1544):1203.[57].GhedinE,SengamalayNA,ShumwayM,ZaborskyJ,FeldblyumT,SubbuV,SpiroDJ,SitzJ,KooH,BolotovPetal:Large-scalesequencingofhumaninfluenzarevealsthedynamicnatureofviralgenomeevolution.Nature2005,437(7062):1162-1166.[58].ObenauerJC,DensonJ,MehtaPK,SuXP,MukatiraS,FinkelsteinDB,XuXQ,WangJH,MaJ,FanYPetal:Large-scalesequenceanalysisofavianinfluenzaisolates.Science2006,311(5767):1576-1580.[59].VijaykrishnaD,SmithGJD,PybusOG,ZhuH,BhattS,PoonLLM,RileyS,BahlJ,MaSK,CheungCLetal:Long-termevolutionandtransmissiondynamicsofswineinfluenzaAvirus.Nature2011,473(7348):519-U263.[60].BaoY,BolotovP,DernovoyD,KiryutinB,ZaslavskyL,TatusovaT,OstellJ,LipmanD:Theinfluenzavirusresourceatthenationalcenterforbiotechnologyinformation.JournalofVirology2008,82(2):596-601.[61].EnserinkM:Datasharing-NewSwissinfluenzadatabasetotestpromisesofaccess.Science2007,315(5814):923-923.[62].RambautA:Estimatingtherateofmolecularevolution:incorporatingnon-contemporaneoussequencesintomaximumlikelihoodphylogenies.Bioinformatics2000,16(4):395-399.[63].DrummondAJ,HoSYW,PhillipsMJ,RambautA:Relaxedphylogeneticsanddatingwithconfidence.PlosBiology2006,4(5):699-710.[64].DrummondAJ,RambautA.BEAST:Bayesianevolutionaryanalysisbysamplingtrees[J].BmcEvolutionaryBiology,2007,7(1):214.[65].WeilP,HoffgaardF,HamacherK.Estimatingsufficientstatisticsinco-evolutionaryanalysisbymutualinformation[J].ComputationalBiology&Chemistry,2009,33(6):440-444.[66].ShannonCE.Amathematicaltheoryofcommunication[J].BellSystemTechnicalJournal,2014,27(3):379-423.[67].GaoR,CaoB,HuY,etal.Humaninfectionwithanovelavian-origininfluenzaA(H7N9)virus[J].NewEnglandJournalofMedicine,2013,368(20):1888.[68].GaoR,SongJ,ZhangY,etal.UltrastructuralcharacterizationofavianinfluenzaA(H7N9)virusinfectinghumansinChina[C]//VacuumElectronSourcesConferenceandNanocarbon(IVESC),20108thInternational.IEEE,2010:525-525.[69].IulianoAD,JangY,JonesJ,etal.IncreaseinHumanInfectionswithAvianInfluenzaA(H7N9)VirusDuringtheFifthEpidemic—China,October2016–February第91页 军事科学院博士学位论文2017[J].MmwrMorbidity&MortalityWeeklyReport,2017,66(9):254.[70].UyekiTM,CoxNJ.GlobalConcernsRegardingNovelInfluenzaA(H7N9)VirusInfections[J].NewEnglandJournalofMedicine,2013,368(20):1862.[71].ZhouL,TanY,KangM,etal.PreliminaryEpidemiologyofHumanInfectionswithHighlyPathogenicAvianInfluenzaA(H7N9)Virus,China,2017:[J].EmergingInfectiousDiseases,2017,23(8):1355.[72].ZhouL,RenR,YangL,etal.SuddenincreaseinhumaninfectionwithavianinfluenzaA(H7N9)virusinChina,September–December2016[J].WesternPacificSurveillance&ResponseJournalWpsar,2017,8(1):6-14.[73].SubbaraoK.AvianinfluenzaH7N9viruses:araresecondwarning.[J].CellResearch,2017,28(1).[74].XiangN,LiX,RenR,etal.AssessingChangeinAvianInfluenzaA(H7N9)VirusInfectionsDuringtheFourthEpidemic-China,September2015-August2016.[J].MmwrMorbMortalWklyRep,2016,65(49):1390-1394.[75].ShuY,MccauleyJ.GISAID:Globalinitiativeonsharingallinfluenzadata–fromvisiontoreality[J].Eurosurveillance,2017,22(13).[76].AltschulSF,MaddenTL,SchäfferAA,etal.GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms.[J].NucleicAcidsResearch,1997,25(17):3389.[77].McnishI.DictionaryofBioinformaticsandComputationalBiology[M]//Dictionaryofbioinformaticsandcomputationalbiology/.Wiley-Liss,2004:641–661.[78].EdgarRC.MUSCLE:multiplesequencealignmentwithhighaccuracyandhighthroughput[J].NucleicAcidsResearch,2004,32(5):1792-1797.[79].RukhinAL.BayesandEmpiricalBayesMethodsforDataAnalysis[M]//BayesandEmpiricalBayesmethodsfordataanalysis.Chapman&Hall/CRC,2000:153-154.[80].DempsterAP,LairdNM,RubinDB.MaximumLikelihoodfromIncompleteDataviatheEMAlgorithm[J].JournaloftheRoyalStatisticalSociety,1977,39(1):1-38.[81].HuelsenbeckJP,RonquistF.MRBAYES:Bayesianinferenceofphylogenetictrees.[J].Bioinformatics,2001,17(8):754-755.[82].ReinhardtSK,LarusJR,WoodD/.Tempestandtyphoon:user-levelsharedmemory[J].21stISCA,1994,1994,22(2):325-336.[83].McnishI.DictionaryofBioinformaticsandComputationalBiology[M]//Dictionaryofbioinformaticsandcomputationalbiology/.Wiley-Liss,2004:641–661.[84].GreenacreMJ.TheoryandApplicationsofCorrespondenceAnalysis[J].JournaloftheAmericanStatisticalAssociation,1984,80(392).[85].PedenJF.Analysisofcodonusage.[J].UniversityofNottingham,2011,90(1):73–74.第92页 军事科学院博士学位论文[86].WongEHM,SmithDK,RabadanR,etal.CodonusagebiasandtheevolutionofinfluenzaAviruses.Codonusagebiasesofinfluenzavirus.[J].BmcEvolutionaryBiology,2010,10(1):253.[87].AbolnikC,BisschopS,GerdesT,etal.OutbreaksofavianinfluenzaH6N2virusesinchickensarosebyareassortmentofH6N8andH9N2ostrichviruses[J].VirusGenes,2007,34(1):37-45.[88].QiW,ZhouX,ShiW,etal.Genesisofthenovelhuman-infectinginfluenzaA(H10N8)virusandpotentialgeneticdiversityofthevirusinpoultry,China[J].Eurosurveillance:bulletinEuropeensurlesmaladiestransmissibles=Europeancommunicablediseasebulletin,2014,19(25).[89].GuanY,ShortridgeKF,KraussS,etal.MolecularCharacterizationofH9N2InfluenzaViruses:WereTheytheDonorsofthe"Internal"GenesofH5N1VirusesinHongKong?[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,1999,96(16):9363-9367.[90].ShortridgeKF:Pandemicinfluenza:azoonosis?Seminarsinrespiratoryinfections1992,7(1):11-25.[91].LiCJ,YuKZ,TianGB,YuDD,LiuLL,JingB,PingJH,ChenHL:EvolutionofH9N2influenzavirusesfromdomesticpoultryinMainlandChina.Virology2005,340(1):70-83.[92].LiKS,XuKM,PeirisJSM,PoonLLM,YuKZ,YuenKY,ShortridgeKF,WebsterRG,GuanY:CharacterizationofH9subtypeinfluenzavirusesfromtheducksofsouthernChina:Acandidateforthenextinfluenzapandemicinhumans?JournalofVirology2003,77(12):6988-6994.[93].ShahsavandiS,SalmanianAH,GhorashiSA,etal.EvolutionarycharacterizationofhemagglutiningeneofH9N2influenzavirusesisolatedfromAsia.[J].ResearchinVeterinaryScience,2012,93(1):234-239.[94].LindhE,EkkommonenC,VäänänenVM,etal.MolecularepidemiologyofH9N2influenzavirusesinNorthernEurope.[J].VeterinaryMicrobiology,2014,172(3–4):548-554.[95].SlomkaMJ,HannaA,MahmoodS,etal.PhylogeneticandmolecularcharacteristicsofEurasianH9avianinfluenzavirusesandtheirdetectionbytwodifferentH9-specificRealTimereversetranscriptasepolymerasechainreactiontests.[J].VeterinaryMicrobiology,2013,162(2–4):530-542.[96].LiX,ShiJ,GuoJ,etal.Genetics,ReceptorBindingProperty,andTransmissibilityinMammalsofNaturallyIsolatedH9N2AvianInfluenzaViruses[J].PlosPathogens,2014,10(11):e1004508.[97].ZhangL,ZhangZ,WengZ:RapidReassortmentofInternalGenesinAvianInfluenzaA(H7N9)Virus.ClinicalInfectiousDiseases2013,57(7):1059.[98].LuJ,WuJ,ZengX,GuanD,ZouL,YiL,LiangL,NiH,KangM,ZhangX第93页 军事科学院博士学位论文etal:ContinuingReassortmentLeadstotheGeneticDiversityofInfluenzaVirusH7N9inGuangdong,China.JournalofVirology2014,88(15):8297-8306.[99].HomayounimehrAR,DadrasH,ShoushtariA,etal.SequenceandphylogeneticanalysisofthehaemagglutiningenesofH9N2avianinfluenzavirusesisolatedfromcommercialchickensinIran[J].TropAnimHealthProd,2010,42(6):1291-1297.[100].PerkS,Banet-NoachC,ShihmanterE,etal.GeneticcharacterizationoftheH9N2influenzavirusescirculatedinthepoultrypopulationinIsrael[J].ComparativeImmunologyMicrobiology&InfectiousDiseases,2006,29(4):207-223.[101].Dong-HunL,SongCS.H9N2avianinfluenzavirusinKorea:evolutionandvaccination[J].Clinical&ExperimentalVaccineResearch,2013,2(1):26.[102].KandeilA,ElsheshenyR,MaatouqAM,etal.GeneticandantigenicevolutionofH9N2avianinfluenzavirusescirculatinginEgyptbetween2011and2013.[J].ArchivesofVirology,2014,159(11):2861.[103].WangB,ChenQ,ChenZ.CompletegenomesequenceofanH9N2avianinfluenzavirusisolatedfromegretinLakeDongtingwetland.[J].JournalofVirology,2012,86(21):11939.[104].DelportW,PoonAFY,FrostSDW,etal.Datamonkey2010:asuiteofphylogeneticanalysistoolsforevolutionarybiology[J].Bioinformatics,2010,26(19):2455-2457.[105].VeerkampRF,WallE,BerryDP,etal.BayesianstochasticsearchvariableselectionusingphenotypescollectedacrossresearchherdsinEU[J].Genetics&Breeding,2012.[106].HoCS.Identifyinghistoricalfinancialcrisis:Bayesianstochasticsearchvariableselectioninlogisticregression[J].Ho,Chi-San,2009.[107].SwartzMD,YuRK,SheteS.Findingfactorsinfluencingrisk:ComparingBayesianstochasticsearchandstandardvariableselectionmethodsappliedtologisticregressionmodelsofcasesandcontrols[J].StatisticsinMedicine,2008,27(29):6158-6174.[108].WongDWS,LeeJ.StatisticalanalysisofgeographicinformationwithArcViewGISandArcGIS[J].HobokenNJ,2005.[109].JohnstonK,HoefJMV,KrivoruchkoK,etal.UsingArcGISgeostatisticalanalyst[J].CinderellaManual,2008.[110].Jong-TaeW,KyunPB.Seroprevalenceoflowpathogenicavianinfluenza(H9N2)andassociatedriskfactorsintheGyeonggi-doofKoreaduring2005-2006[J].JournalofVeterinaryScience,2008,9(2):161-168.[111].JakhesaraSJ,BhattVD,PatelNV,etal.IsolationandcharacterizationofH9N2influenzavirusisolatesfrompoultryrespiratorydiseaseoutbreak.[J].Springerplus,2014,3(1):196.第94页 军事科学院博士学位论文[112].DalbyAR,IqbalM.AglobalphylogeneticanalysisinordertodeterminethehostspeciesandgeographydependentfeaturespresentintheevolutionofavianH9N2influenzahemagglutinin[J].Peerj,2014,2:e655.[113].SoltanialvarM,GoodarziR,AkbarnejadF.Geneticanalysisofpolymerasecomplex(PA,PB1andPB2)genesofH9N2avianinfluenzavirusesfromIran(1999to2009)[J].AsianPacificJournalofTropicalBiomedicine,2012,2(11):858.[114].ShanmuganathamK,FeerozMM,JonesengelL,etal.AntigenicandMolecularCharacterizationofAvianInfluenzaA(H9N2)Viruses,Bangladesh[J].EmergingInfectiousDiseases,2013,19(9):1393-1402.[115].MaseM,EtoM,ImaiK,etal.CharacterizationofH9N2influenzaAvirusesisolatedfromchickenproductsimportedintoJapanfromChina.[J].Epidemiology&Infection,2007,135(3):386-391.[116].ScotchM,MeiC,MakonnenYJ,etal.PhylogeographyofinfluenzaAH5N1clade2.2.1.1inEgypt[J].BmcGenomics,2013,14(1):871.[117].LiC,YuK,TianG,etal.EvolutionofH9N2influenzavirusesfromdomesticpoultryinMainlandChina[J].Virology,2005,340(1):70.[118].XuKM,SmithGJD,BahlJ,etal.ThegenesisandevolutionofH9N2influenzavirusesinpoultryfromsouthernChina,2000to2005.[J].JournalofVirology,2007,81(19):10389-401.[119].WangG,ZhangJ,KongF,etal.Generationandapplicationofreplication-competentVenus-expressingH5N1,H7N9,andH9N2influenzaAviruses[J].ScienceBulletin,2018(3).[120].CongYL,PuJ,LiuQF,etal.AntigenicandgeneticcharacterizationofH9N2swineinfluenzavirusesinChina.[J].JournalofGeneralVirology,2007,88(Pt7):2035.[121].BeigelJH,FarrarJ,HanAM,etal.AvianinfluenzaA(H5N1)infectioninhumans.[J].NewEnglandJournalofMedicine,2005,353(13):1374.[122].MountsAW,KwongH,IzurietaHS,etal.Case-controlstudyofriskfactorsforavianinfluenzaA(H5N1)disease,HongKong,1997.[J].JournalofInfectiousDiseases,1999,180(2):505-508.[123].LinYP,ShawM,GregoryV,etal.Avian-to-humantransmissionofH9N2subtypeinfluenzaAviruses:relationshipbetweenH9N2andH5N1humanisolates.[J].ProcNatlAcadSciUSA,2000,97(17):9654-9658.[124].PfeifferDU,OtteMJ,RolandholstD,etal.ImplicationsofglobalandregionalpatternsofhighlypathogenicavianinfluenzavirusH5N1cladesforriskmanagement.[J].VeterinaryJournal,2011,190(3):309-316.[125].KilpatrickAM,ChmuraAA,GibbonsDW,etal.PredictingtheglobalspreadofH5N1avianinfluenza[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,2006,103(51):19368.第95页 军事科学院博士学位论文[126].deVriesRP,deVriesE,Martinez-RomeroC,McBrideR,vanKuppeveldFJ,RottierPJM,Garcia-SastreA,PaulsonJC,deHaanCAM:EvolutionoftheHemagglutininProteinoftheNewPandemicH1N1InfluenzaVirus:MaintainingOptimalReceptorBindingbyCompensatorySubstitutions.JournalofVirology2013,87(24):13868-13877.[127].DuX,WangZ,WuA,SongL,CaoY,HangH,JiangT:Networksofgenomicco-occurrencecapturecharacteristicsofhumaninfluenzaA(H3N2)evolution.GenomeResearch2008,18(1):178-187.[128].OwoadeAA,GerloffNA,DucatezMF,etal.Replacementofsublineagesofavianinfluenza(H5N1)byreassortments,sub-SaharanAfrica.[J].EmergingInfectiousDiseases,2008,14(11):1731-1735.[129].EefjeJ.A.Schrauwen,TheoM.Bestebroer,GuusF.Rimmelzwaan,AlbertD.M.E.Osterhaus,RonA.M.Fouchier,SanderHerfst.ReassortmentbetweenAvianH5N1andhumaninfluenzavirusesismainlyrestrictedtothematrixandneuraminidasegenesegments.[J].PlosOne,2013,8(3):e59889.[130].NguyenTH,ThanVT,ThanhHD,etal.IntersubtypeReassortmentsofH5N1HighlyPathogenicAvianInfluenzaVirusesIsolatedfromQuail[J].PlosOne,2016,11(2):e0149608.[131].ZhuB,WuB,LiuD,etal.Dynamicreassortmentsandgeneticheterogeneityofthehuman-infectinginfluenzaA(H7N9)virus[J].NatureCommunications,2014,5(1):3142.[132].LuJ,WuJ,ZengX,etal.ContinuingreassortmentleadstothegeneticdiversityofinfluenzavirusH7N9inGuangdong,China.[J].JournalofVirology,2014,88(15):8297-8306.[133].QiW,ShiW,LiW,etal.ContinuousreassortmentswithlocalchickenH9N2virusunderliethehuman-infectinginfluenzaA(H7N9)virusinthenewinfluenzaseason,Guangdong,China.[J].Protein&Cell,2014,5(11):878-882.[134].QuanC,ShiW,YangY,etal.NewthreatsofH7N9influenzavirus:thespreadandevolutionofhighlyandlowpathogenicvariantswithhighgenomicdiversityinWaveFive.[J].JournalofVirology,2018.第96页 军事科学院博士学位论文作者在学期间取得的学术成果[1]HuM,JinY,ZhouJ,etal.GeneticCharacteristicandGlobalTransmissionofInfluenzaAH9N2Virus[J].FrontiersinMicrobiology,2017,8:2611.doi:10.3389/fmicb.2017.02611,IF=4.076.[2]RenH,YuanJ,HuM,etal.EcologicaldynamicsofinfluenzaAviruses:cross-speciestransmissionandglobalmigration[J].ScientificReports,2016,6:36839.doi:10.1038/srep36839,IF=4.259[3]YuD,YinZ,JinY,ZhouJ,RenH,HuM,LiB,ZhouW,LiangL,YueJ.EvolutionofbopAGeneinBurkholderia:ACaseofConvergentEvolutionasaMechanismforBacterialAutophagyEvasion[J].BiomedResInt.2016,2016(2016):6745028.doi:10.1155/2016/6745028,IF=2.476[4]JinY,YuD,RenH,YinZ,HuangZ,HuM,LiB,ZhouW,YueJ,LiangL.PhylogeographyofAvianinfluenzaAH9N2inChina[J].BmcGenomics,2014,15(1):1110.doi:10.1186/1471-2164-15-1110,IF=3.729第97页 军事科学院博士学位论文第98页 军事科学院博士学位论文主要简历1.基本信息:姓名:胡明达政治面貌:中共党员性别:男出生年月:1990年10月民族:汉出生地:辽宁本溪专业:生物信息学导师:梁龙研究员毕业院校:军事科学院军事医学研究院生物工程研究所研究方向:流感病毒的进化,病原微生物的进化2.教育背景:2015.04--2018.06博士军事科学院军事医学研究院生物工程研究所2015.04通过院选拔转为硕博连读博士研究生2013.08--2015.04硕士军事科学院军事医学研究院生物工程研究所2013.06免试推荐至军事科学院军事医学研究院攻读硕士2009.08--2013.06本科北京大学信息科学技术学院计算机系2010.08--2013.06本科(双学位)北京大学心理学系3.荣获奖励:2018.01获得军事科学院军事医学研究院生物工程研究所嘉奖2017.01获得军事科学院军事医学研究院生物工程研究所嘉奖2016.09获得后勤保障部“风采杯”才艺大赛歌舞类二等奖“风采杯”才艺大赛语言类二等奖2016.01获得军事科学院军事医学研究院优秀学员奖章2015.08获得军事科学院军事医学研究院文体骨干标兵称号2014.10获得全军首届军事建模大赛二等奖2013.08获得军事科学院军事医学研究院优秀学员嘉奖2013.06获得北京大学国防生优秀干部奖励2013.03获得北京大学“特格尔”奖学金2012.03获得北京大学优秀团员嘉奖2010.07获得北京地区国防生军政训练“文体先进个人”荣誉称号第99页 军事科学院博士学位论文2010.06获得北京ACM选拔赛三等奖2009.10获得北京大学优秀志愿者称号4.科研成果:[1]HuM,JinY,ZhouJ,etal.GeneticCharacteristicandGlobalTransmissionofInfluenzaAH9N2Virus[J].FrontiersinMicrobiology,2017,8:2611.doi:10.3389/fmicb.2017.02611,IF=4.076.[2]RenH,YuanJ,HuM,etal.EcologicaldynamicsofinfluenzaAviruses:cross-speciestransmissionandglobalmigration[J].ScientificReports,2016,6:36839.doi:10.1038/srep36839,IF=4.259[3]YuD,YinZ,JinY,ZhouJ,RenH,HuM,LiB,ZhouW,LiangL,YueJ.EvolutionofbopAGeneinBurkholderia:ACaseofConvergentEvolutionasaMechanismforBacterialAutophagyEvasion[J].BiomedResInt.2016,2016(2016):6745028.doi:10.1155/2016/6745028,IF=2.476[4]JinY,YuD,RenH,YinZ,HuangZ,HuM,LiB,ZhouW,YueJ,LiangL.PhylogeographyofAvianinfluenzaAH9N2inChina[J].BmcGenomics,2014,15(1):1110.doi:10.1186/1471-2164-15-1110,IF=3.729第100页 军事科学院博士学位论文致谢2013年8月我从北京大学毕业,怀着激动心情进入了军事科学院军事医学研究院生物工程研究所攻读生物信息学硕士。两年后在各位师长的指导下我顺利转博,继续攻读生物信息学博士学位。五年来,在科研道路上我历经磨砺,从懵懂无知的少年,逐渐蜕变成独当一面的能手,在这个蜕变过程中有太多人给予了我关怀与指导。也正是有这些人的帮助,我才能顺利完成这篇博士论文。首先,我要感谢我的导师梁龙研究员。梁主任的思维敏锐,视野高远,其独到的科学思想与大局观深深令我折服。每当我课题进展不顺,逻辑混乱时,梁主任都会悉心教导,有些难题往往在梁主任的三言两语之间就迎刃而解。梁主任还注重培养我的科学素养,鼓励我们自己寻找科学问题,探索研究方向。这样的培养模式使我受益良多。其次,我要感谢岳俊杰研究员。岳老师为人和善,工作高效。经常对我的选题方向和课题进展做出指导和监督。岳老师在科研上嗅觉敏锐,引领的课题也都是当下科研领域中最前沿的问题。从岳老师身上,我学会了踏实,高效的工作态度和工作方法。此外,我还要特别感谢任洪广老师和靳远师兄。五年来朝夕相处,任老师和靳远师兄无时无刻不在关心着我的生活和学业。在课题进展方面,靳远师兄事无巨细的指导我具体的科研方法,锻炼我的科研视野,以及培养我对待科研的态度和完成工作应有的效率。任老师则时刻对我在科研工作中的不足与缺点进行指正和教导。在论文发表方面,任老师对我的英文论文进行十分详细的修改和润色,最终发表在FrontiersinMicrobiology。我还要感谢周围老师,戴红梅老师,宋婷老师,周静老师,李北平老师,黄志松师兄,喻东师兄,殷志秋师兄。是他们在科研内外对我的细心关怀与照顾,才使得我的博士生活有声有色,科研进展一帆风顺。我还要感谢实验室的李凯武同学,王玉洁同学,彭小川同学,吴哲丹同学,周江林同学,张琪同学,孔娜同学。在他们的陪伴与帮助下,我的科研生活更加多彩,科研工作更加顺利。最后,我要感谢我的父母亲人和我的女朋友,是他们的支持,他们的鼓励,才让我能坚持到今天,让我可以毫无后顾之忧的全身心投入到科研工作中来。感谢国家,感谢军队,感谢军事科学院军事医学研究院,在这里我收获了我在科研道路上的第一桶财富,我也将永不忘怀这段难得的经历。第101页

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭