如今,分层存储已成为了一种常见的存储方法,它将数据存储在具有不同特性(如性能、成本和容量)的不同存储介质上。不同的存储媒介被分配到不同的层次结构中,其中最高性能的存储媒介被认为是第0层或第1层,然后是第2层、第3层等等。
0层或1层通常是由闪存或基于3D Xpoint技术的固态硬盘(SSD)组成,以此往下的存储层可能涉及高性能光纤通道或SAS驱动器(或RAID阵列),较低性能的SATA驱动器、光盘、磁带存储系统和基于云的近线(nearline)或离线存储系统。
在SSD和云存储普及之前,使用磁盘和磁带来提供第1层、第2层和第3层存储的3层存储模型可能是最流行的分层存储模型。
但是现在使用包含5个或更多级别的分层存储模型也并不少见了。每一个层都有细微的差别,从而产生三个关键存储属性的不同组合:成本、性能和容量。如果费用不成问题,企业就可以使用SSD满足所有存储需求,因为它们提供了非常高的性能和可靠性。
但是在现实中,存储成本是非常重要的,因为IT部门需要保证在预算范围内运行,而组织作为一个整体必然要寻求最小化成本和最大化效率。不幸的是,与硬盘驱动器相比,SSD存储更贵,而且比磁带存储贵得多。
这代表我们需要明智地使用SSD,并且只用于存储需要高性能系统使用的数据。不太重要的数据可以存储在更低的成本、更低的性能系统(如HDD)上,很少访问或仅为合规性目的保留的数据可以转移到成本非常低的离线存储系统因此,分层存储并不是由IT部门的运营需求驱动的,而纯粹是出于财务原因。分层存储系统的目标是通过使用提供最低性能要求的最便宜的存储来最小化存储成本。
只有两个存储层的分层存储系统为存储管理员提供了一个非常有限的选择,即给定数据应该存储在什么地方。如果第2层可以提供这些数据所需要的存储性能,那么可以将其存储在第2层,如果没有,就将其存储在更昂贵的第1层。分级存储系统有三个层可能会更有效率,因为相同的数据可以存储在第3层如果性能水平足够的话,如果不是那么它可以存储在第2层,再然后是更昂贵的第1层,也就是说有了更多的选择。
实际上,可用的存储层越多,数据块就可以更有效地存储在满足其性能需求的适当存储层中,而不是以不必要的高成本提供不必要的高性能。可以使用诸如创建RAID阵列的技术,用一组不同类型的存储媒介创建新的层。
分层存储系统面临的最大挑战是将数据分类为多个类,这需要确定哪个存储层最适合给定的数据类型,并在数据老化时定期对数据进行重新分类。这里的关键是,任何给定的数据存储需求可能随时间变化,因此数据存储在分层存储系统中时,数据必须被长期监控,一旦它不再需要当前的高性能,就可以转移到较低成本的存储层。