分布式系统中容错技术课件.ppt

分布式系统中容错技术课件.ppt

ID:57102417

大小:458.50 KB

页数:66页

时间:2020-07-31

分布式系统中容错技术课件.ppt_第1页
分布式系统中容错技术课件.ppt_第2页
分布式系统中容错技术课件.ppt_第3页
分布式系统中容错技术课件.ppt_第4页
分布式系统中容错技术课件.ppt_第5页
资源描述:

《分布式系统中容错技术课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第7章分布式系统中容错技术1一台计算机由各种各样的硬件和软件组成,这些部件时不时地会出现故障或错误,导致死机或运行失败。这些故障或错误往往是随机出现的,计算机用户无法预料这些情况的出现,有时甚至察觉不到错误的出现。如果一个计算机系统能够对非预期的软件/硬件故障有适当的对策和应变措施,则我们说这个系统具备一定的容错(Faulttolerance)能力。分布式系统的特殊之处在于故障的局部化,即系统的某个(些)局部成份出现故障,这种故障可能会影响到系统的局部功能,而对系统的其它部分毫无影响。本章讨论内

2、容包括容错处理的基本概念、要求和模型,如何实现可靠的通信,以及当发现故障时如何排除并恢复运行。27.1分布式系统中的故障模型7.1.1基本概念属性:可用性可靠性安全性可维护性保密性完整性后果:失效错误故障策略:防止故障故障容错故障恢复故障预报什么是“可信赖的系统”?如何区分各种故障?如何处理故障?3可用性:可用性反映的是系统随时可被用户使用的特性。可靠性:一个系统可以无故障持续运行的程度。与可用性相反,可靠性以时间周期为基准,而不是以某个时刻为基准。也就是说,一个高度可靠的系统在相当长的时间周期

3、里可以无间断地为用户提供服务安全性:安全性指的是在系统出现暂时错误的情况下,不出现灾难性后果的能力。可维护性:可维护性指的是系统一旦出现故障,系统易于修复的能力。保密性:保密性要求系统资源不被非法用户访问。可信赖系统的性质4当系统不能提供所承诺的服务时就认为系统失效一个系统在正常工作时会在若干种运行状态之间变迁,一旦出现异常,则该系统进入错误(Error)状态。一个系统的错误状态可能是导致系统失效的原因造成错误的原因称为故障。归于导致故障错误失效故障的种类繁多,软件和硬件都有可能产生故障,而且在

4、某些场合下,与系统无关的外部环境也可能引发故障。通常分为:暂时性的(transient)、间歇性的(intermittent)和永久性的(permanent)57.1.2基本的故障模型拜占庭故障故障类故障子类故障语义崩溃故障服务器崩溃(停机),但停机前工作正常失忆型崩溃服务器只能从初始状态启动,遗忘了崩溃前的状态中顿型崩溃服务器可以从崩溃前的状态启动停机型崩溃服务器完全停机失职故障(遗漏故障)服务器对输入的请求没有响应接收型失职服务器无法接收信件发送型失职服务器无法发送信件应答故障服务器对服务请

5、求做出错误反应返回值故障返回值出现错误状态变迁故障服务器偏离正确的运行轨迹时序故障服务器反应迟缓,超出规定的时间间隔随意故障服务器在任意时间产生的随意错误故障分类(与语义有关)6要建立可靠系统就必须控制故障。对用户来讲最重要的是容错,即系统发生故障时也能提供服务(对其他进程隐藏故障的发生)。容错是建立在冗余的基础上的,冗余类型有四种:哺乳动物的两只眼睛、两个耳朵、两个肾,747飞机的四个引擎只用了三个,多个体育裁判硬件冗余使用多个硬件软件冗余使用多个软件信息冗余海明(Hamming)校验检查和奇

6、偶位时间冗余超时重发技术:如原子操作和原子事务处理重复计算物理冗余77.1.3故障的基本处理方法(进程容错机制):(1)主动复制。所有的复制模块协同进行,并且它们的状态紧密同步。用到了错误屏蔽的概念——隐藏出现的故障或防止故障造成错误。把相同进程的集合组织到一个平等组中。在分布式系统中使用主动复制相对比较昂贵。编组故障屏蔽(2)被动复制。以等级方式组织进程组,其中只有一个模块(主进程)处于动态,其他模块的交互状态由这一模块的检查点定期更新。如果主进程崩溃,后备进程执行选举算法选择一个新的主进程。

7、动态方法层次故障屏蔽(3)半主动复制。是主动复制和被动复制的混合方法。此种方法所需的恢复开销相对较低。失效的检测可分为外部检测和内部检测两类:外部检测是指将检测节点失效的职责赋予被检测节点的外部附件。内部检测将节点的失效检测机制置于该节点内部,通常检测部件被假定为一个可以完全信赖的“硬核”。8Passive(Primary-Backup)ReplicationRequestCommunication:therequestisissuedtotheprimaryRMandcarriesauniqu

8、erequestid.Coordination:Primarytakesrequestsatomically,inorder,checksid(resendsresponseifnotnewid.)Execution:Primaryexecutes&storestheresponseAgreement:Ifupdate,primarysendsupdatedstate/result,req-idandresponsetoallbackupRMs.Response:primarysendstoth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。