下载此文档

基于闪存的混合式存储系统分析.docx


文档分类:通信/电子 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
第 1 章 绪 论
课题研究的背景和意义
近几十年来,传统的机械硬盘(HDD,Hard Disk Drive)凭借着较好的稳定性, 耐用性以及价格相对较低廉已经成为诸如数据库、操作系统、搜索引擎等应用的数据存储介质[1]。HDD 已经是一种成熟的产品,无论从价格上还是可靠性上都已经为大众所接受。然而,当今对于一些对性能要求非常高的应用,HDD 并不能完全胜任[2],其根本原因在于 HDD 是机械的,每次读写数据都需要通过移动磁头才能完成, 而磁盘的旋转速度只有每分钟几千次(RPM,Revolutions Per minute)到上万次不等。现在 CPU 的处理速度和 HDD 的操作速度远远不在一个数量级上,而且这个差距还在不断拉大,存储设备的读写性能已经越来越成为计算机系统的性能瓶颈所在。当前,随着闪存(Flash)存储技术的不断发展,无论是在桌面应用,还是在企业级的应用场景中,基于 Flash 存储芯片的固态硬盘(SSD,Solid State Disk)有逐渐取代 HDD 的趋势[3]。2009 年 MySpace 公司已经全部使用基于 PCI-E 的 SSD 来替换 HDD, 给他们节省了 99%的能耗[4]。上几个月,Facebook 公司发布了一个 Linux 内核模块[5], 该模块使用 SSD 来作为 MySQL 数据库的缓存,从而提高数据库的存取性能。国内的百度,腾讯等公司为了加速其搜索引擎的索引读写,也逐步使用 SSD 替换 HDD 来存储其搜索引擎的索引数据。
由于 SSD 和 HDD 在内部结构的上的本质区别[6],使得二者在读写性能方面有着很大的差异,如表 所示,为内存(DRAM)、Flash 以及 HDD 之间的读写性能参数以及价格方面的对比[7]。相对于 HDD 来说,SSD 具有更好的随机读写性能,而且可以大大地降低能耗,并且具有良好的抗震能力。这些特性使得 SSD 在某些方面已经大幅度超过了 HDD。但是大规模地使用 SSD 来替代 HDD 还需要相当长的时间[8]。首先,SSD 的价格比较昂贵,这样无疑会大大增加应用成本。其次,SSD 的容量相对于 HDD 要小很多,因此不能大规模使用 SSD 来存储一些备份或者冗余的海量数据。当前无论是从操作系统层还是从应用程序层都有大量的针对于存储系统的优化
方法,但这些大部分是基于 HDD 的[9][10][11],由于 HDD 和 SSD 在内部结构上的不同, 很多方法并不适用于 SSD[12] [13]。
表 不同设备属性
设备
读延迟(µs)
写延迟(µs)
价格
$/GB
随机
顺序
随机
顺序
DRAM




15
Flash
100
85
2000
200-500
3
Disk
5000
500
5000
500

数据可靠性的保证通常采用磁盘阵列技术( RAID , Redundant Array of
Independent Disks)[8],但是磁盘阵列技术的设计初衷是采用性能参数相近的磁盘, 由于 SSD 和 HDD 在读写性能上和价格上表现出很大差异,简单地将 SSD 和 HDD 组成磁盘阵列,将只会得到和 HDD 相当的性能[15][16],并不能充分发挥 SSD 的高性能特征。当前 SSD 在价格上远比 HDD 昂贵,大规模地使用 SSD 来替换 HDD,成本将大幅度提高,而且大量的针对于 HDD 的寻道等优化算法对于 SSD 并不适合, 因此研究如何将高性能的 SSD 和价格低廉的 HDD 进行有效地组合,构成混合式存储系统,充分利用 SSD 的性能优势以及 HDD 的成本优势,在 I/O 性能和可靠性方面都能得到一个较好的效果,是一个非常有意义的课题。
国内外研究现状
性能和可靠性是衡量一个存储系统的两个重要指标,国内外对于存储系统可靠性的研究以 RAID 技术为代表,RAID 采用多块磁盘来保证存储系统的数据可靠性, RAID 分为多级,典型的主要有 RAID0、RAID1 以及 RAID5 等。它们从不同程度上保证了系统的性能或者可靠性。在性能方面,当前大多数的 SSD 与 HDD 混合式的存储系统则主要关注系统的性能,可靠性方面并没有得到有效地研究和评估。下面分别介绍几种典型的 RAID 的级别的优缺点以及和 SSD 相关的技术现状,然后分析国内外将 SSD 和 HDD 相结合的混合式系统的研究现状。
RAID 相关技术现状
RAID 是磁盘阵列在技术上实现的理论标准[8],它能够在一定程度上提高系统的可靠性或者性能,同时保证数据的错误尽量少。其中 RAID0

基于闪存的混合式存储系统分析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小397 KB
  • 时间2018-06-01