大数据存储解决方案提供商

媒体报道 当前位置 >> 新闻中心 >> 媒体报道

计算机报:服务部署—IP SAN潜在的关键应用

发布日期:2006-04-12

作者:中科院计算所工程中心 冯硕

 

    IP SAN可以说是近几年来存储领域的关键技术之一,它的低成本、高可扩展性和易于管理、互联互通性好的种种优势,使其在诞生的初始阶段就担负起了人们取代FC SAN,使之成为存储核心架构的期待。然而,数年的时间过去了,当初IP SAN热烈的支持者们,所憧憬的、全面替代FC SAN的情况依然没有出现;相反的,近年来IP SAN在VOD、视频捕捉、监控和SMB市场等传统FC SAN很少涉及的领域却硕果累累——这个现象告诉我们,关键技术也需要关键应用的支持,任何新系统或新技术,都需要拥有能够直接驱动用户采购的“关键应用”,才能真正得以大规模进入市场,逐渐成为未来架构的基石。对此,一些人称之为“杀手应用”(Killer Applications或Killer-Apps),非常贴切的描绘出它对于一个新技术的重要性。

    IP SAN需要“杀手应用”,在IP存储领域,它需要找到能够真正体现出其基于磁盘块传输优越性的应用,才能够击败来自日益廉价的NAS的进攻;在传统SAN领域,它也需要找到FC SAN在成本、尺度、扩展性上所无法实现的应用,才能切入这个领域,逐步扩大影响。除了上面提到的一些领域,IP SAN在集群文件系统、存储虚拟化、数据迁移等多个方面,都存在着找到关键应用的潜质。下面将要介绍的,是另一个容易被人们所忽视的、潜在的关键应用点——服务部署。

一、 服务部署技术与IP SAN
    单纯的服务器硬件,作为一种计算资源,必须经过安装、配置,并与合适的存储数据结合起来,才能提供人们所需的服务。而当这种服务改变的时候,上述安装与配置的工作又必须重新进行——在服务器机群(或集群)规模非常庞大时,手工完成这些工作的工作量也是巨大以致无法承受的,为此,服务部署系统应运而生。顾名思义,服务部署系统的核心工作,就是通过某种自动或半自动的手段,将服务“部署”到服务器硬件上,从而达到快速初始化服务器或调度服务器的目的。

    目前,很多厂商都为自己的服务器平台开发了功能各异的服务部署系统,它们大多是基于通过网络复制整个磁盘镜像的下载原理,部署前所有系统的个性化数据,在重新部署后其个性化数据即全部丢失。无论是部署工作的可管理性,还是部署内容的可控制性都不够灵活,而且部署的时间都比较长,无法根据应用实时负载的情况实行动态地调度。在学术领域,有IBM实验室研发的Oceano、Purdue大学研究的SODA和Duke大学提出的COD系统,它们允许某种程度的调度与个性化数据保存,但大多数都是基于面向科学计算集群的Linux系统,对事务处理和异构化的服务器机群支持非常有限。

    实际上,如果能够从SAN的角度上看,这个问题会显得非常明晰。安装与配置后的服务器软件系统,可以认为是一种特殊的数据,而如果能够在这个层面上实现存储与服务器硬件的分离,则所有的问题就都可以迎刃而解。

    首先,通过SAN中已经安装好系统数据的卷直接启动服务器,可以免去任何安装软件到本地磁盘的工作,以最快的速度使服务器硬件投入工作。

通过在SAN的存储设备端完成系统数据卷的复制(镜像或快照),可以快速部署大量的服务器系统,而且这种操作对客户端数据和操作系统而言完全透明。

通过改变SAN中系统数据与客户端之间的映射关系,可以方便地完成不同服务在大量异构服务器的机群中自由的调度,而且调度速度非常快(重启服务器即可)。

通过在SAN上配置Raid系统,并借助SAN领域相当成熟的数据迁移与容灾的功能,可以为被部署服务器提供可靠性远高于本地磁盘的系统存储,从而保证整个业务的连续性。

最后,借助快照等技术,可以在SAN上直接实现对客户机透明的Server-free或Lan-free备份。

综上所述,通过SAN启动服务器的方案,的确可以解决部署系统相当多的问题。值得注意的是,虽然FC SAN完全可以实现这些功能,但在实际应用中,这个领域只能是IP SAN的天下:

首先,FC SAN基础架构高昂的成本(包括HBA卡、交换机等)无法支撑服务部署作为其上单一的应用而存在,这大大限制了其应用范围,而IP SAN则不存在这个问题,因为能够远程启动的千兆网卡早已成为服务器上的标准配置。

其次,无论在是数据中心的机房,还是在一个数百台计算机的电子教室,基于IP SAN的服务部署系统都可以方便的实现,我们甚至可以实现在园区网络(如大学校园)范围内的远程部署与调度。而FC SAN在这个规模与范围上,无论是成本还是安全性都将面临严重的考验。

最后,如果和NAS进行比较,由于NAS基于文件的传输方式与操作系统关系密切,除了操作系统提供了特别的支持(如修改过的Linux和早期的Windows),否则通过NAS启动无盘服务器几乎是不可能的。由于所有的数据必须以文件的方式共享,在实际环境中使用的安全问题也比较严重。

优秀的功能和竞争对手无法逾越的技术基础,可以看到,基于IP SAN启动的服务部署系统,的确拥有一些成为关键应用的潜质,但要支持这样的应用,IP SAN自身也必须苦练内功,才能取得最后的成功。下面将从服务部署的角度上,分析其对IP SAN架构本身的影响。

二、 服务部署对IP SAN的要求
    和一些厂商推出专为VOD、视频捕捉应用优化的IP SAN系统相同,服务部署同样对IP SAN提出了内在的要求,主要包括:

启动代理(Boot Agent)——IP SAN推出的时间相对较短。无论是Windows还是其它的操作系统,都没有提供直接从IP SAN引导的能力。虽然一些厂家已经推出了支持远程启动的iSCSI HBA卡,但它们几乎和FC HBA卡一样昂贵,这使得IP SAN的优势荡然无存。为此,需要有专门针对这个应用的低成本硬件接口卡或软件作为启动代理,保证系统能够正常运行。

持久使用快照的能力——大规模的批量服务部署工作需要快速、低物理空间消耗的大量复制卷。虽然快照技术就可以达到这样的效果,但目前成熟的快照技术都是为备份而设计的,多数难以承担直接使用快照启动客户机并在其上运行应用的能力。下面还会进一步阐明,服务部署系统需要专为其数据特点而优化的快照技术作为后端支持。

针对数据特点的优化——部署系统的数据有其自身鲜明的特点,比如对于一次部署的100台计算机而言,由于系统数据很少修改,它们之间有70-80%的数据可能都是相同的,如果能够在这100台计算机之间共享SAN存储设备上相同内容的空间,则会大大降低部署的成本。

针对这些情况,作为国内的权威研发机构的中国科学院计算技术研究所国家高性能计算机工程技术研究中心,相继研发出具有自主知识产权的低成本IP存储接口卡和专为服务部署技术而优化的IP存储设备,并将它们结合起来形成了PC SAN与Bladmin两套成熟的产品,作为蓝鲸服务部署系统分别面向客户机与服务器领域的产品线,他们将基于IP SAN的服务部署技术从实验室推向了市场。

三、基于IP SAN的服务部署应用与前景
    基于IP SAN的服务部署通过相当低的成本,实现了快速部署与切换服务的功能,使其在从数据中心到中小学电子教室的范围内,都存在着诱人的应用前景:

科学计算集群——服务部署的概念就是源自科学计算集群领域,相对于现有的基于NFS的无盘启动或网络安装方式,IP SAN在可用性、性能、数据安全性、私有数据的处理上都有着巨大的优势,其调度能力如果能与并行计算的调度工具相接合,则将大大提升系统的整体效率和可维护性。

数据中心——与数据中心的IP SAN架构相结合。服务部署与网络存储,可以作为和电力与网络一样的公共资源提供给用户,从而可以大大降低用户的运营与维护成本,增加数据中心服务的附加值。

电子教室、图书馆——现在一个大学所有电子教室与图书馆,需要管理的客户机数目可能并不比一个数据中心少,而具体管理的难度则要大很多。通过架设园区内的IP SAN以及其之上的服务部署系统,可以实现远程部署,大大降低管理的负担。同时,最大可能的避免了本地磁盘损坏带来的诸多问题,维护的负担也大大地降低。

试想,我们把这些应用进行结合,也许在不久的未来将会出现一种全新的、利用IP存储进行部署的新型校园网架构。首先,在学校的中心机房,运行着大量的通过服务部署系统对服务器进行部署、启动和管理,并为学校里的学生和老师提供高性能的各种Web、Email、视频点播、网上教学等服务。此外,服务部署系统还可以根据学生上课与休息的独特需求,提供灵活的分配和支持各种服务所需使用的服务器硬件数目。

第二,在学校的各个院、系或者实验室中,拥有通过服务部署系统远程启动的高密度无盘的“小型超算中心”。一方面,它可以为该部门的科研和教学工作提供并行计算所需的运行环境;另一方面,学校也可以根据各个学术项目的需要,在空闲时间里,统一调度这些计算资源提供给某一个项目进行使用。

第三,为老师分配独立的网络硬盘空间,供其独享。老师可以在自己的办公室里完成多媒体课件的设计和撰写,在多媒体教室中上课时,通过输入自己的用户名和密码,即可直接访问到自己的数据,进行教学工作,而无需考虑具体是在哪间教室、教室中的计算机系统配置如何等诸多问题。同时,该技术也可以为学生和老师直接指定所需的操作系统,并与自己的课程配合,其操作则不需要做任何的预先准备工作。

最后,学生对自己网络硬盘空间的灵活、方便的使用。学生无论是在自己的宿舍还是公共计算机房,甚至于校园里的一棵大树下(只要是在校园网络里),均可通过无线网络,随意访问到自己的数据,完成自己的学习;或者也可以按照学校的课程要求,在指定的时间内,使用学校指定的系统进行学习。所有这些,在现有的网络情况下也许还无法同时实现,但随着万兆技术、千兆到桌面、百兆WiFi等技术的普及,相信这一天终将会来到我们身边。

除此之外,基于IP SAN的服务部署在容灾、测试环境、远程维护等方面都存在着大量潜在的应用契机。这需要整个IP SAN产业去逐渐挖掘与开发。而工程中心也将凭借自身在存储领域的研究实力,脚踏实地的,使其发展成为能够真正推动IP SAN技术发展的关键应用,尽一份自己的力量。