双机容错系统原理

双机容错系统原理

ID:28008544

大小:31.00 KB

页数:4页

时间:2018-12-07

双机容错系统原理_第1页
双机容错系统原理_第2页
双机容错系统原理_第3页
双机容错系统原理_第4页
资源描述:

《双机容错系统原理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用标准文案双机容错服务器系统(1)硬件结构双机容错系统的硬件结构是由两台服务器和共享存储子系统组成的:其中每台服务器都有自己的系统盘,用以安装操作系统和应用程序;每台服务器安装两块百兆或千兆以太网卡,一块用于对外工作,另一块用于双机之间的心跳检测;每一台服务器都通过SCSI接口连接在共享磁盘子系统上,共享磁盘子系统通常采用有容错功能的磁盘阵列,各种应用所需的数据就存储在共享磁盘子系统上。(2)工作原理工作电源加电后,A、B两台机器首先进入独立的工作状态,操作员可在控制面板上手动选择A、B两台的任何一台已经正常启动的主机运行诊断程序

2、,通过后即为服务主机。服务主机立即把外设配置为已有。操作员便可在管理终端上对服务主机进行工作配置。如果所选主机不能通过诊断,则手动选择另一台主机运行诊断程序,待其通过后配置为服务主机。只要有一台被选为服务主机且操作员完成配置后,另一台作为备用机。若备用机运行诊断程序通不过,可更换故障部件直至通过为止,操作员便可启动并进行相关的配置。由操作员选择配置成“双机热备份”或“双机互备援”工作模式。此后,服务主机与备用主机将根据不同的工作模式以及相应的故障检测结果进行切换。(3)工作模式双机容错的目的在于保证数据永不丢失和系统永不停机,采用智

3、能型磁盘阵列可保证数据永不丢失,采用双机容错软件可保证系统永不停机。它的基本的工作模式有两种:双机互备援模式(DualActive)和双机热备份模式(HotStandby)。1双机互备援精彩文档实用标准文案所谓双机互备援,就是两台主机均为工作服务器,在正常情况下,双机系统对外提供两种服务(例如应用服务和数据库服务),并互相监视对方的运行情况。当一台服务器出现异常,不能对外提供服务时,另一台服务器在继续原有服务的同时主动接管异常服务器的工作,继续提供原来在异常服务器上运行的服务,从而保证双机系统对外提供服务的不间断性,达到不停机的功能

4、,但此时正常运行服务器的负载会有所增加。此时必须尽快将异常服务器修复以缩短正常服务器负载的持续时间,当异常服务器经过维修恢复正常后,系统管理员通过管理命令,将正常服务器所接管的工作切换回已修复的异常服务器。2双机热备份所谓双机热备份就是一台主机为工作服务器,另一台主机为备份服务器。在系统正常情况下,工作服务器对外提供服务,备份服务器负责监视工作机的运行情况(工作服务器也同时监视备份服务器是否正常,有时备份服务器因某种原因出现异常,工作服务器可尽早通知系统管理员解决,确保下一次切换的可靠性)。当工作服务器出现异常(如数据库服务器出现操

5、作系统挂起、死机、网卡坏、硬盘控制器坏等),不能支持对外服务时,备份服务器则主动接管工作服务器的工作,继续提供对外服务,从而保证服务能够不间断的运行。当工作服务器经过修复恢复正常后,系统管理人员通过管理命令或经由以人工或自动的方式将备份服务器的工作切换回工作服务器;工作服务器也可以激活监视程序,监视备份服务器的运行情况,此时,原来的备份服务器就成了工作服务器,而原来的工作服务器就成了备份服务器。(4)双机容错管理软件在双机容错系统的工作中,双机容错管理软件是必不可少的。一切故障的诊断,服务的切换,硬件的控制都由双机软件来控制实现。同

6、时为了使双机系统对外象一个单主机系统一样,双机容错管理软件还可以为双机系统生成系统虚拟IP对外工作,客户机通过虚拟IP访问双机系统。这样就避免了服务切换后主机IP地址改变导致客户机无法连通的问题。并且双机软件还可以控制两台服务器对共享磁盘子系统的访问,同一时刻只能有一台主机可以对其访问,避免了同时访问可能造成的数据破坏。双机容错管理软件通过侦测网卡或两台服务器之间互连的串口线进行两台主机的状态诊断,一旦其中一台工作的服务器出现问题,双机容错管理软件控制另一台服务器接管系统的虚拟IP和共享磁盘子系统的控制权并启动本服务器上的服务对外工

7、作,保证系统的实时性和可靠性。下一节详细介绍软件系统的设计方案。3、双机容错服务器的软件方案设计系统通过自检测模块、异常处理模块、仲裁机制和心跳检测模块检测系统故障,检测结果送系统诊断模块,从而诊断出系统中发生故障的部件;系统通过双机协同模块屏蔽系统的硬件结构,使系统的双模冗余的硬件体系结构对客户透明。下面详细介绍每个模块的具体设计方案。精彩文档实用标准文案(1)自检测自检测模块利用操作系统的检测机制和自身的故障检测算法,可以检测到系统的一部分自身故障,作为系统诊断和切换的部分依据。该模块的实现目标是尽可能地提高系统的故障检测覆盖率

8、。构成该机的硬件模块有一些带有自检测功能,如电源、CPU风扇、CPU板等,检测模块应该可以读出这些硬件模块的故障状态。对于系统的服务进程,检测模块有检测算法可以检测这些服务的工作状态。为了提高容错管理软件的效率,用户管理模块可以配置服

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。