APP下载

新型存储介质在RAID中的应用与研究

2018-12-28张天宇李娟刘靖宇

移动信息 2018年1期
关键词:存储介质存储系统磁盘

张天宇 李娟 刘靖宇

新型存储介质在RAID中的应用与研究

张天宇 李娟 刘靖宇

河北工业大学计算机科学与软件学院,天津 300401

随着半导体技术的迅速发展,新型非易失存储器件由于具有非易失、低延迟、低能耗以及抗震等优良特性,得到了广泛关注,也为存储系统的研究提供了新思路与挑战。针对应用日益广泛的视频监控、连续数据保护、备份、归档等这类连续存储系统的特点,将新型存储介质作为缓存引入系统,可以极大地提高系统的性能, 具有非常好的研究价值。

RAID;NVM;SSD;缓存技术

引言

独立磁盘冗余阵列(Redundant Array of Independent Disks, RAID)[1]技术是把相同的数据存储在多个硬盘的不同地方的方法,自从1987年提出以来就受到了广泛关注与研究。RAID技术是将多块相同的磁盘通过RAID控制器连接起来形成一个统一的存储设备来进行数据存储。不仅扩大了系统的存储容量,而且大大提高了数据的读写速度。更为重要的是RAID技术还提供数据容错技术,保证了系统数据的安全性。根据选择的版本不同,RAID比单盘有以下一个或多个方面的益处:增强数据整合度,增强容错功能,增加吞吐量或容量。另外,磁盘组对于计算机来说,看起来就像一个单独的磁盘或逻辑存储单元。目前其技术已经很成熟并广泛应用于大规模的存储系统中。

大规模存储系统通常采用普通机械磁盘作为存储介质,其磁盘数据的存取与普通单个磁盘的存储操作相同,仍然受到缓慢机械运动的限制。这就限制了由多个单盘组成的磁盘阵列性能的进一步提高,使其存取时间仍停留在毫秒级,其吞吐率及带宽已经成为大规模存储系统的性能瓶颈。

近年来以新型非易失性存储器(Non-Volatile Memory,NVM)[2]为代表的新型存储介质的飞速发展为突破存储系统IO瓶颈提供了新的思路与挑战。

1 新型非易失性存储器

很多存储系统的写操作程序中,内存作为控制器和硬盘之间的重要桥梁,提供更快速的性能,但是如果发生突然间断电的情况,如何保护内存中的数据不丢失,这是存储系统中老生常谈的议题。近年半导体技术迅猛发展,相继出现了闪存(Flash)、相变存储器(PCM)、铁电随机存储器(FRAM)、磁阻随机存储器(MRAM)、忆阻器(RRAM)等新型非易失存储介质和技术。这些存储介质没有机械装置,在断电后数据不丢失,具有非易失、低延迟、抗震动、低能耗等特点,在很大程度上可以改善了单个硬盘的I/O性能。

从性能指标上来看,NVM比较接近DDR内存的性能,且具有非易失按字节存取、存储密度高、低能耗等特征,在新的存储系统中可能逐渐成为主要的存储设备,而DDR内存则作为临时数据的缓存使用与传统的单数据速率相比,DDR技术实现了一个时钟周期内进行两次读/写操作,即在时钟的上升沿和下降沿分别执行一次读/写操作。当前闪存技术发展得最成熟,读写性能上也达到了较高水平,既可以作为磁盘与系统内存之间的数据缓存,又可以替代硬盘作为持久性存储设备。

固态盘(Solid State Disk,SSD)[3]就是一种基于闪存的新型可读写和擦除的非易失性半导体存储器,用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(FLASH芯片、DRAM芯片)组成。固态硬盘(SSD)是以Flash代替了传统的硬盘盘做为存储介质,使用SATA 系列接口的新型存储设备SSD的出现解决了计算机中存储系统的瓶颈问题,显著提高了计算机性能,降低了功耗。

SSD采用电子存储介质进行存储,通过改变存储芯片内介质的状态来存储数据,摆脱了磁盘机械特性的限制,免去了数据查找时间和寻道时间。随机访问性能比传统硬盘高一两个数量级,能够对小粒度、随机I/O访问提供较好的支持。

2 SSD在RAID中的应用研究

SSD采用闪存作为存储介质,读取速度相对机械硬盘更快。固态硬盘不用磁头,寻道时间几乎为0。持续写入的速度非常惊人。在存储系统中应用SSD存储技术可以极大地提高系统的读写能力,RAID系统中应用SSD一般有两种情况。一是直接用SSD替换磁盘用于存储数据,但SSD本身的容量和价格问题致使不能大范围使用。二是将SSD用作系统缓存,虽然发挥了其读速度的优势,但频繁的计算校验信息也严重制约了写速度的优势。

固态硬盘都使用相同的LPM(Link Power Management)节能特性。LPM节能特性包括三种基本状态:Active(活动)、Partial(轻度睡眠)和Slumber(深度睡眠)。LPM节能特性的实现有两种发起方式。由主机端(电脑南桥)发起的被称之为HIPM(Host-Initiated LPM);而直接由硬盘发起的则叫做DIPM(Device-Initiated LPM)。LPM节能需要主机端电脑和设备端硬盘的共同支持,此外还需要操作系统及磁盘控制器驱动的协同工作。LPM节能的运作在外部是无法观察到的。SSD不仅为存储系统带来了极大的性能提升,而且节能效果也特别显著,与其相关的研究也很广泛,例如基于SSD的缓存技术、磨损均衡、数据迁移以及垃圾回收机制等提出的优化策略。随着SSD应用技术日趋成熟,与HDD组成的混合存储方案因其充分考虑了存储容量和性能,所以逐渐成为研究热点。

将SSD作为缓存引入存储系统。首先,SSD作为缓存可以扩展主缓存容量。使容量可达到TB级,比现有存储系统的可用缓存要大得多,因而能够存储更多的数据。其次,SSD的写入速度比机械磁盘快一个数量级,对于映射到SSD中数据的操作,将以更短的响应时间和更高的IOPS进行操作。最后,缓存可以减少磁盘的读I/O并放缓写操作,因而磁盘可以有足够的空闲时间来降低盘片旋转速度甚至是完全停转减少能耗。

连续数据存储系统具有特定的数据访问模式和存储特性。如I/O负载以顺序访问为主,只有少量随机访问;对数据的可靠性、存储空间的要求较高;以写操作为主,读操作通常回放写操作等。

针对这类存储系统,将SSD作为二级缓存引入系统中,二级缓存是指利用SSD的快速读能力,将系统、游戏常用数据置于SSD内,从而满足客户机的快速读取需求。利用良好的写性能将数据写入SSD中,SSD中的数据也方便系统快速读取,待达到系统设定条件再将SSD中数据写回到逐一写入RAID的磁盘阵列中,在提高系统写性能同时也通过磁盘待机方式减少了系统能耗开销。同时也可以改善校验信息的计算方式来减轻频繁小写给系统带来的写惩罚,进一步提高系统性能。但在研究过程中也要充分考虑到NVM其寿命受到擦写次数以及失效率的限制。

3 总结

视频监控、连续数据保护、备份、归档等这类连续存储系统应用日益广泛。针对连续存储系统的特点,将NVM作为缓存引入系统可以极大地提高系统的性能,具有非常好的研究价值。

[1]Chen P M, Lee E K, Gibson G A, et al. RAID: high-performance, reliable secondary storage[J]. ACM Computing Surveys, 1994, 26(2):145-185.

[2]张鸿斌,范建,舒继武,等.基于相变存储器的存储系统与技术综述[J].计算机研究与发展,2014, 51(8):1647-1662.

[3]詹玲,门勇,汤陈蕾,等. SHCA:基于RAID的两级缓存算法设计与实现[J].小型微型计算机系统,2017, 38(5):1152-1157.

The Application and Research of New Storage Medium in RAID

Zhang Tianyu Li Juan Liu Jingyu

School of Computer Science and Engineering, Hebei University of Technology, Tianjin 300401

With the rapid development of semiconductor technology, the Non-Volatile Memory that have the metrics of non-volatility, low latency, low power consumption and shock resistance, are attracting wide attention, and also provides a new way to the research of storage system and challenges. Based on the chara cteristics of continuous storage system such as video monitoring, continuous data protection, backup and archiving, and so on, using the Non-Volatile Memory as cache can greatly improve the performance of the system and has great research value.

RAID; NVM; SSD; cache technique

TP333.4

A

猜你喜欢

存储介质存储系统磁盘
分层式大数据存储系统缓存调度策略与性能优化
它的好 它的坏 详解动态磁盘
HDFS数据动态分布设计与实现
创建虚拟机磁盘方式的选择
解决Windows磁盘签名冲突
天河超算存储系统在美创佳绩
Windows系统下动态磁盘卷的分析与研究
电子档案离线存储介质的选择分析
基于Hadoop 的海量医药电商数据存储系统设计与开发
基于电池管理系统的数据存储系统设计