在当今的企业环境中,数据的增长速度非常之快,而企业管理数据能力的提高速度总是远远落在后面。通过虚拟化,许多既消耗时间又多次重复的工作,例如备份/恢复、数据归档和存储资源分配等,可以通过自动化的方式来进行,大大减少了人工作业。因此,企业对于存储虚拟化技术呼声越来越高,存储系统的虚拟化管理已经成为IT应用中的重要环节。那么如何认识存储虚拟化和应用存储虚拟化技术呢?本文将为你一一展开。
一、存储虚拟化的定义
存储虚拟化就是通过对存储(子)系统或存储服务的内部功能进行抽象、隐藏或隔离,使存储或数据的管理与应用、服务器、网络资源的管理分离,从而实现应用和网络的独立管理。存储虚拟化其实是一种贯穿于整个IT环境、用于简化相对复杂的底层基础架构的技术。其技术思想就是将资源的逻辑映像与物理存储分开,从而为系统和管理员提供一幅简化、无缝的虚拟资源管理视图。
二、存储虚拟化的实现技术
存储虚拟化可以在三个不同的层面上实现:基于主机的虚拟化在主机服务器上实现;基于存储网络的虚拟化,需要在SAN网络中添加虚拟化引擎的支持来实现;基于存储设备、存储子系统的虚拟化,依赖于提供相关功能的存储模块或第三方的虚拟软件。
基于主机的存储虚拟化:
主要用途:使服务器的存储空间可以跨越多个异构的磁盘阵列,常用于在不同磁盘阵列之间做数据镜像保护。
实现方式:一般由操作系统下的逻辑卷管理软件完成(安装客户端软件),不同操作系统的逻辑卷管理软件也不相同。
优点:
支持异构的存储系统。
缺点:
占用主机资源,降低应用性能。
存在操作系统和应用的兼容性问题。
导致主机升级、维护和扩展非常复杂,而且容易造成系统不稳定性。
需要复杂的数据迁移过程,影响业务连续性。
常见产品:
Symantec Veritas VolumeManager
基于存储网络的虚拟化:
主要用途:异构存储系统整合和统一数据管理。
实现方式:通过在存储域网(SAN)中添加虚拟化引擎实现。
优点:
与主机无关,不占用主机资源。
能够支持异构主机、异构存储设备。
使不同存储设备的数据管理功能统一。
构建统一管理平台,可扩展性好。
缺点:
占用交换机资源,需要面临带内、带外的选择。
部分厂商数据管理功能弱,难以达到虚拟化统一数据管理的目的。
部分厂商产品成熟度较低,仍然存在和不同存储和主机的兼容性问题。
常见产品
H3C IV系列
IBM SVC
EMC VPLEX
NetApp GFiler系列
基于存储设备、存储子系统的虚拟化:
主要用途:在同一存储设备内部,进行数据保护和数据迁移。
实现方式:在存储控制器上添加虚拟化功能,常见于中高端存储设备。
优点:
与主机无关,不占用主机资源。
数据管理功能丰富。
缺点:
一般只能实现对本设备内磁盘的虚拟化。
不同厂商间的数据管理功能不能互操作。
多套存储设备需配置多套数据管理软件,成本较高。
常见产品
H3C IX/EX系列
HP EVA
HDS TagmaStor
三种实现技术的比较:
三、存储虚拟化的架构
根据控制和数据路径(拓扑结构)的不同,存储虚拟化分为对称(或叫带内in-band)与不对称(或叫带外out-of-band)两种架构部署方式。带内虚拟技术是在数据读写的过程中,在主机到存储设备的路径上实现存储虚拟化;而带外虚拟技术,是在数据读写之前,就已经做好了虚拟工作,而且实现虚拟的部分并不在主机到存储设备的访问路径上。所以带内虚拟技术可以基于主机、设备和网络实现,而带外虚拟技术则只能是基于存储网络实现。相对来说,带外虚拟化产品,在数据处理过程中不会产生瓶颈;在异构存储系统之间进行大规模整合,可以充分提高对存储资源的利用率,带外虚拟化将会来未来的主流方向。
IBM的SVC(SAN Volume Controller)技术能够将多个磁盘系统的容量整合为一个单一的“容量池”。SVC 可帮助节省空间和能源,并能通过合并来简化存储资产的管理,是一种带内虚拟化。EMC的INVISTA技术则是基于存储交换的解决方案,充分利用智能SAN交换机来提升效率,是一种带外虚拟化。
由于网络技术的快速发展,带内与带外已不是主要问题。后来EMC推出了VPLEX技术,VPLEX引擎位于在存储阵列和服务器之间的带内(in-band),由两个VPLEX控制器构成以维持高可用性,且每个控制器配备了两个四核Intel Xeon处理器,32GB内存和8GB/s光纤通道,而且主要有两种部署方案:
-
-
VPLEX Local,在一个数据中心内可以安装一个VPLEX群,包括4个VPLEX引擎,也就是8个控制器,共支持多达8000个虚拟存储卷,可在一个数据中心内实现EMC和非EMC存储设备之间不间断和透明地数据移动。
-
VPLEX Metro,可以将在100公里之内的两个VPLEX群连接起来,也就是会有8个VPLEX引擎,通过这些引擎能将两个数据中心内最多1.6万个虚拟存储卷整合在一起,并且将最大响应时间控制在5ms以内,同时保证两个数据中心中的应用都能访问这些存储卷。
-
四、存储虚拟化面临的问题
存储虚拟化是一个热门话题,市场上也出现了各种架构、各种类型的虚拟化产品。据统计,存储数据量的年增长率达50%~60%。面对新的应用,以及不断增加的存储容量,企业用户需要借用虚拟技术来降低管理的复杂性,提高效率。但是随着存储技术的发展,用户对于数据的需求增加,为什么存储虚拟化技术没有完全普及呢?
存储虚拟化技术最受关注的问题是数据安全问题。因为虚拟存储把所有数据都放在了一个系统环境下,这就相当于把鸡蛋都放在一个篮子里,一旦打翻,所有鸡蛋都会损失。这无疑加大了数据的风险,在安全投资上也要相应加大。
存储虚拟化技术的第二问题是技术成熟度。它需要专门的元数据管理和资源管理设备,这些设备需要通过冗余保证其可用性,这会增加系统的复杂性和增加系统的总拥有成本;并且,不同性能、不同结构的存储设备位于同一个存储池,不能充分发挥各自的优势,性能较差的部件反而会制约整个系统的性能。而独立于厂家和设备的存储虚拟化技术可能仍需要许多的努力才能实现。目前的现状是,存储虚拟化产品确实已经得到了具体的应用,但目前尚无一种方案可以满足不同客户的需求,在较短的时期内,存储虚拟化可能只是局限于个别功能的应用,用户仍很难选择合适的方法来满足特定的需求,用户采用存储虚拟化技术时仍需认真仔细的考虑,并进行实际应用测试。
存储虚拟化的第三个问题在于忽视了我国庞大的中小企业需求。目前的虚拟存储技术大部分都是专注于高端用户的,这些用户存储系统庞大,不仅设备多,所采用的软件也很复杂,在这种情况下,虚拟存储技术可以带来管理,成本上的诸多优势。但是目前我国中小企业已经成为企业市场的主力军,不针对中小企业用户的需求推广虚拟存储技术,使该技术的发展变得缓慢了。
存储虚拟化的第四个问题就是价格,这也正是由于专注于高端市场带来的弊端。对于多数的中小企业用户面临存储空间不足,直接买大容量硬盘来解决存储上的问题,即使在存储空间上有所浪费,但相比使用虚拟化存储架构,大容量的硬盘还是比较合算,此外中小企业存储系统不复杂,管理起来也没有太大难度,这些都导致虚拟存储技术在普及上存在着一定的困难。
五、存储虚拟化技术的展望
虚拟化技术正在日益变得有活力且更加趋于完善,它的发展方向更像是一个全面的生态系统。通过服务器主机、交换机、磁盘阵列还是高端存储设备来实现虚拟化都是不完整不连贯的,未来的虚拟化应该是通过这几种技术整合来实现。
未来的虚拟化应该是一个高度分布式的,企业级的操作系统。如果我们看得更远一些,虚拟化还有可能会演变成包含服务器、网络以及存储设备的分布式操作系统中的一种元素,而这三种虚拟化都正在受到关注。
另外在异质虚拟存储环境下如何进行同质数据保护服务,改善SAN(存储局域网)性能的SSD应用,以及如何根据QoS(服务质量)要求在存储架构上自动化进行的数据迁移都是未来虚拟化持续关注的技术和趋势。存储虚拟化可以在IT界中广泛应用为一种最佳实践。虚拟化SAN将成为存储环境部署和管理事实上的标准。中小企业在未来也可以看到更多的异质存储虚拟化解决方案,以及对新协议的支持,比如光纤通道以太网—在IP上提供高性能服务。
存储虚拟化技术当前来说还是一项比较新的技术,存储虚拟化也不是万能的,不要赶潮流而抛弃已有的资源和已有的存储技术,企业存储管理人员需要的把自己现有的存储资源、存储技术和存储虚拟化相关联,找到最适合自己企业的存储策略才是最为重要的。
存储虚拟化是一种新的革命性概念,它是网络存储技术发展的必然,更是一种技术趋势。