第二讲 数据组织存储与索引

第二讲 数据组织存储与索引

ID:37667811

大小:910.03 KB

页数:36页

时间:2019-05-28

第二讲 数据组织存储与索引_第1页
第二讲 数据组织存储与索引_第2页
第二讲 数据组织存储与索引_第3页
第二讲 数据组织存储与索引_第4页
第二讲 数据组织存储与索引_第5页
资源描述:

《第二讲 数据组织存储与索引》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第二部分:数据存贮及索引技术一、存储介质及访问策略二、数据文件的组织三、索引结构教材第2-3章的内容一:存储介质及访问策略1存储器层次三级存储器备份归档二级存储器(磁盘)存储速度主存储器计算高速缓冲存储器DBMS主要与磁盘进行交互。所以我们主要讨论磁盘的存储及访问策略。一般讲,DBMS自己管理的磁盘块。2磁盘的存储特性与磁盘相关的参数:*磁盘的容量:片数,磁道数,扇区数实际应用中,使用逻辑单元----磁盘块一个磁盘块包含一个或几个扇区3磁盘的访问特性磁盘的访问过程以及速度访问过程:定位:将磁头移到目标块所在的柱面旋转:磁盘旋转,将第一个扇区移至磁头下面读或写数据访问速度:存取时间(延迟),指

2、从发出数据请求到内容出现在主存中。A.处理器与控制器处理请求所花的时间B.寻道时间:将磁头定位到合适的柱面所花的时间,一般用平均寻道时间.C.旋转时间:磁头转到组成块的第一个扇区所需时间D.数据传输时间:在块内读或写数据所需时间。存取时间=寻道时间+旋转时间+数据传输时间注:这个时间与磁盘的物理特性密切相关,不同类型的磁盘,时间不同。4磁盘存取优化策略①按柱面组织数据将所需要的数据存储在同一个磁道或同一个柱面上。②使用磁盘臂调度算法—电梯算法处理大量块请求的非常有效的算法③使用多磁盘—并行处理方法将数据分配到多个磁盘上④磁盘镜像技术通过选择寻道时间最短的磁盘来提高读速度。⑤预取与大规模缓冲技

3、术通过预测将所需数据块先装入缓存,从而减少等待时间。或者使用较好的缓冲策略尽量减少磁盘的访问次数等。5数据存储稳定的策略—RAID技术用N个磁盘代替一个磁盘进行数据存储,提高数据可靠性的一类磁盘组织方法。RAID1:一些做数据盘,一些做冗余盘。135…Disk1并并行写入246…Disk2行读135…Disk3并行写入出246…Disk4(1)写入操作并行化,并有冗余。(2)没有错误校验。(3)适用大记录和需要大量I/O操作的应用。RAID2:内存风格的纠错码,按字节纠错1a2a3a…Disk1读跨越一次写所有数1b2b3b…Disk2横跨所据盘有磁盘EccEccEcc…Disk3EccEc

4、cEcc…Disk4(1)每个记录被拆分,分布在不同数据盘。(2)错误校验码(ECC)被拆分放在冗余盘。(3)每个读/写操作并行地使用数据盘。(4)可利用冗余盘进行数据重建RAID3:位交叉奇偶校验组织,以扇区为单位进行校验1a2a3a…Disk1读跨越一次写所有数1b2b3b…Disk2横跨所据盘有磁盘1c2c3c…Disk3EccEccEcc…Disk4(1)每个记录被拆分,分布在不同数据盘。(2)一个磁盘用于存放错误校验码(ECC)。(3)每个读/写操作并行地使用数据盘。(4)可利用冗余盘进行数据重建RAID4:块交叉奇偶校验组织,以块为单位进行校验147…Disk1并行写读一个入磁盘

5、258…Disk2块只涉369…Disk3及一个数据盘,EccEccEcc…Disk4可以并行读多种数据(1)数据所使用块级拆分,分布在不同数据盘。(2)一个磁盘用于存放错误校验码(ECC)。(3)每个读/写操作只涉及一个数据盘。(4)可利用冗余盘进行数据重建RAID5:块交叉分布奇偶校验组织,以块为单位进行校验159EccDisk1并行写并行读入磁盘2610EccDisk2数据3711EccDisk34812EccDisk4(1)数据所使用块级拆分,分布在所有磁盘。(2)每个磁盘有一部分空间用于存放错误校验码(ECC)。(3)每个读/写操作只涉及一个数据盘。(4)利用程序并行操作不同的数据

6、RAID级别的选择主要考虑以下因素:*磁盘带来的资金开销*I/O操作数量方面的需求*数据重建过程中的性能一般来说要在RAID1和RAID5之间进行选择,RAID1提供好的写操作性能,在DBS的日志文件存储中使用比较多;在读多写少的应用中,的RAID5是一个不错的选择。二:数据文件的组织方式1字段的表示SQL中各种数据类型均被表示成一定长度的字节序列:整型—2/4个字节浮点—4/8个字节char(n)—n个字节的数组VarChar(n)—n+1个字节的数组…2记录的表示*定长记录:它所包含的所有字段均为定长Createtablemovie(namechar(30),addressvarchar

7、(255),genderchar(1),birthdateDATE)nameaddressgenderbirthdate030286287297指向模式的指针记录长度时间戳nameaddressgenderbirthdate01244300304316*变长记录:允许它包含变长字段,有多种表示方法。其它首部信息记录长度指向addressgenderbirthdatenameaddress3多个记录的集合构成块

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。