热插拔RAID 阵列内存保护技术

热插拔RAID 阵列内存保护技术

ID:46585977

大小:767.07 KB

页数:4页

时间:2019-11-25

热插拔RAID 阵列内存保护技术_第1页
热插拔RAID 阵列内存保护技术_第2页
热插拔RAID 阵列内存保护技术_第3页
热插拔RAID 阵列内存保护技术_第4页
资源描述:

《热插拔RAID 阵列内存保护技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、九、热插拔RAID阵列内存保护技术描述热插拔RAID技术非常类似于磁盘阵列中的RAID5。可以提供在内存之间的RAID5,当在这个阵列中的一条内存出现故障时,整个RAID不受影响。700系列里面的DL760G2、DL740支持这种技术,但是需要在RBSU中将此功能选项打开。这些HPProLiant700系列上使用的HP热插拔RAID内存HP热插拔RAID内存可以为长时间不间断运行的应用程序提供极高的实用性、灵活性和容错能力。即使是内存设备彻底故障,内存仍然可以正常工作。RAID的含义是工业标准的DIMM容错阵列(RedundantArray

2、)(见图4.32).图4.32:HP热插拔RAID内存通过数据缓存线将数据存放在4个内存盒中,RAID引擎计算奇偶信息,并将其存放在第5个内存盒中。HP热插拔RAID内存(HPHotPlugRAIDmemory)在概念上和RAID4磁盘存储技术是相似的,但在一些关键的性能上会有所不同,实现方式上也不一样。和磁盘阵列不同,HP热插拔RAID内存(HPHotPlugRAIDMemory)不存在延时(mechanicaldelay)。HP热插拔RAID内存使用的是并行的点对点的连接方式写数据,而不是通过连接多块磁盘的串行总线,这种方式的优点是数据

3、可以同时被写入多个存储区(内存盒),HP热插拔RAID内存消除了因为存储系统使用RAID技术处理而带来的写数据的瓶颈问题。在一个存储阵列中,通常情况下RAID控制器在写数据之前会先读现有的奇偶信息,如果有专门奇偶校验驱动器做这项工作,那么就会带来瓶颈。但HP不是这样做的,HP热插拔RAID内存将运行在整个的数据缓存线上,所以在写数据前没有必要读现有的奇偶信息。采用HP热插拔RAID内存方式的服务器使用5个内存控制器来控制5个内存盒(memorycartridges)。每个盒可以安装最多8个工业标准DIMM(见图4.33)。当内存控制器要向内

4、存中写数据的时候,它们会把数据分成4块写入4个内存盒,并计算奇偶信息存放在第5个内存盒。利用4个内存盒中的数据和第5个内存盒中奇偶信息,数据可以完全恢复,即使是任何DIMM工作故障,或任何一个内存盒被拆掉了,也可以做到不丢失数据。图4.33:HP热插拔RAID内存的读操作在读操作中,每个从内存盒中读出的数据都会经过内存控制器和一个ECC设备进行错误检查,另外,其余4个内存控制器会重新生成一个值,RAID内存引擎会将读出的数据和这个生成值进行比较。为了方便理解,参看图4.34,数据1通过它自己的内存控制器后,送到ECC设备进行错误检查,这个E

5、CC设备使用的是新的8-bitECC算法(HP开发),它可以检测到X8内存(X8memorymodules)中发生的错误,可信度很高。ECC用一个信号将检查结果“好”或“坏”送给多路复用器(MUX1)。具备下列3条中的一条,ECC设备就判断数据1是好的:(1)数据正确(2)ECC检查出了错误但改正了(3)数据中有错误,但ECC设备检查不出来。HP热插拔RAID内存通过进一步的校验方法控制所有三个部分的错误。其余的4个ECC设备(包括保存奇偶信息的内存盒的)将它们保持的数据送给RAID内存引擎,后者利用这些信息通过RAID算法重构数据1,RA

6、ID内存引擎将重构的数据1送到MUX1的比较设备中(奇偶比较),在这个设备里面重构的值和ECC传过来的数据1进行比较,如果两个完全相同,MUX输出数据1。如果不同,说明数据1有错误,比较设备会给系统发出一个non-maskableinterrupt(NMI)信号,中止系统运行,禁止错误数据1的输出。这个过程是同时在重复进行的,因为同一时间内还会从其它的存储盒中读数据(参看图4.35)。HP热插拔RAID内存方式的这个特性保证了采用这种方式时数据的可靠性非常高。HP将对热插拔RAID内存进行改进,采用回写技术(scrubbing)定位软错误。

7、图4.34:HP热插拔RAID内存的读操作,每个从存储盒中读出的数据都经过一个内存控制器和一个ECC驱动器进行检错。同时RAID内存引擎将通过其它4个内存控制器重新生成数据将其与从内存盒中读出的数据进行比较。图4.35:RAID内存结构回写(Scrubbing)热插拔RAID内存提供了一个回写硬件方式,它可以确认ECC或RAID检查出来的软错误。HP技术尝试定位在读内存时检查出来的所有软错误,方法是把改正后的正确的数据写回内存中去。但此方法不适用于硬错误。回写技术可以阻止软错误的累积,避免发生更严重的错误。它降低了ECC的工作量,提高了系统

8、的性能。一些传统的系统采用的是软件回写,HP热插拔RAID内存使用硬件完成这个工作。HP热插拔RAID内存会对错误生成错误日志,错误极限由软件设定。当记录的错误值达到错误极限的时

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。