1 存储与网络

  由于计算机技术不断向更便宜,更有效的方向发展,早期的主机式计算机也从大型的中心式系统演化为便捷的,企业级的服务器。同时,网络技术也对计算机平台的演化产生了相应的影响。随着这两项技术的逐渐成熟,以及对计算机处理能力和相关数据需求的不断增长,更快,可达性更好的存储技术将得到更多的市场驱动,存储网络也因此而到来。

  在过去的10至15年中,商业的模式发生了重大的改变。这其中,基于因特网的商业模式的爆炸性增长给信息的获取和存储技术带来了新的挑战。不断增长的对存储能力的需求使许多IT组织不堪重负,因此,发展一种具有成本效益的和可管理的先进存储方式就成为必然。

  2 存储网络基础

  2.1 SCSI

  SCSI是连接存储设备与服务器的最通用的方法。SCSI产生于1979年,是支持一到两个磁盘的8-bit的并行总线接口。这一协议不断发展,直至成为其他存储相关技术的基础。今天,串行SCSI成为了存储设备领域里,具有层结构和良好体系结构的协议族。

  美国国家信息技术委员会所制定的T10标准,也就是SAM-2,为SCSI的实现提供了一个层次化的模型。这一框架包括SCSI驱动器软件,物理互联,命令实现以及存储管理。这些内容在一起为SCSI的互操作性和可扩展性提供了可能。它支持多驱动器类型,排队,多任务,缓存,自动驱动器ID识别,双向接口操作等内容。SCSI-3命令集将逻辑层转化为基于包的格式,从而为网络传输提供了可能。目前对串行SCSI有多种实现,包括Fibre Channel, Apple's Firewire, IBM SSA等。最近又有iSCSI。

  SCSI 标准共提供了三种可能的电气配置:

  低成本的单端可选配置,适用于临近设备的连接,距离最大为6米;

  较昂贵的HVD,可支持25米距离,具有较好的抗噪声性能;

  最近提出的LVD,支持SCSI-3,作用距离可达12米。

  随着基于因特网的应用的不断增长,不断加速的信息需求使得存储容量的增长速度超过了服务器处理能力的增长速度。一方面是服务器有限的内部存储极限,另一方面是不断增长的存储内容,这就要求服务器的存储"外部化",以适应新的应用的要求。然而随着存储容量的不断增长和服务器的不断发展,在单一的服务器上实现同时对应用环境和存储环境管理就成为了一项新的挑战。将服务器和存储器分开虽然有助于提高这方面的管理能力,但是SCSI的25米极限,以及它的速度和共享能力,还是一个重要问题。

  2.2 TCP/IP

  TCP协议和IP协议共同构成了通信协议族。这组协议是因特网获得成功的主要因素。一方面它们的扩展性很强,可以实现巨大的网络,另一方面TCP/IP也在因特网不同的使用者之间实现了安全和可靠的信息共享。由于这些特性的存在,使得因特网成为了一个真正的开放性网络,它可以支持数以百万计的家庭,学校,政府,公司直至世界的遥远角落。由于TCP/IP能够支持大量的网络技术,所以它完全有能力成为全球存储网络的基础。

  2.3 Ethernet

  Ethernet是今天局域网领域得到最广泛使用的技术。它是IEEE802.3标准。最早是Xerox公司所开发。因为它是桌面电脑互联的最佳技术,所以得到Intel公司和Digital公司的进一步开发。它的发展经历了10Mbps到100Mbps再到1000Mbps的过程。现在,10Gbps的Ethernet也即将问世。

  10Gbps的Ethernet和TCP/IP的组合为存储网络应用的实现提供了引人注目的解决方案。

  2.4 Fibre Channel

  大多数的存储域网络(Storage-Area Networks)都是基于一个叫Fibre Channel(FC)的体系结构。FC的发展是为了解决服务器和存储设备之间通信的诸多要求的。这些要求包括速度,容量,可靠性等等。目前它能够实现1Gbps及2Gbps的速率。它可以实现100MB/sec半工和200MB/sec全工的持续吞吐量。

  3 体系结构基础

  3.1 直连式存储(Direct Attached Storage)

  由于早期的网路十分简单,所以直连式存储得到发展。到了二十世纪八十年代,计算由大型的集中式系统发展到灵活的客户端服务器分布式模型。正是尚处在初级阶段的局域网推动了这一转变。连接服务器的存储(Server-Attached Storage)和直连存储类似,但使用的却是分布式的方法,并仰赖与局域网的连接得以实现。随着计算能力,内存,存储密度和网络带宽的进一步增长,越来越多的数据被存储在个人计算机和工作站中。分布式的计算和存储的增长对存储技术提出了更高的要求。

  今天,所有的存储操作都要通过CPU的I/O操作来完成。由于使用DAS,存储设备与主机的操作系统紧密相连,其典型的管理结构是基于SCSI的并行总线式结构。存储共享是受限的,原因是存储是直接依附在服务器上的。从另一方面看,系统也因此背上了沉重的负担。因为CPU必须同时完成磁盘存取和应用运行的双重任务,所以不利于CPU的指令周期的优化。

  3.2 网络存储设备(Network Attached Storage)

  局域网在技术上得以广泛实施,在多个文件服务器之间实现了互联,为实现文件共享而建立一个统一的框架。随着计算机的激增,大量的不兼容性导致数据的获取日趋复杂。因此采用广泛使用的局域网加工作站族的方法就对文件共享,互操作性和节约成本有很大的意义。NAS包括一个特殊的文件服务器和存储。

  NAS服务器上采用优化的文件系统,并且安装有预配置的存储设备。由于NAS是连接在局域网上的,所以客户端可以通过NAS系统,与存储设备交互数据。

  另外,NAS直接运行文件系统协议,诸如NFS,CIFS等。客户端系统可以通过磁盘映射和数据源建立虚拟连接。

  3.3 存储网络(Storage Area Networks)

  一个存储网络是一个用在服务器和存储资源之间的,专用的,高性能的网络体系。它为了实现大量原始数据的传输而进行了专门的优化。因此,可以把SAN看成是对SCSI协议在长距离应用上的扩展。

  SAN使用的典型协议组是SCSI和Fibre Channel(SCSI-FCP)。Fibre Channel特别适合这项应用,原因在于一方面它可以传输大块数据(这点类似于SCSI),另一方面它能够实现远距离传输(这点又与SCSI不同)。

  SAN的市场主要集中在高端的,企业级的存储应用上。这些应用对于性能,冗余度和可获得性都有很高的要求。

  3.4 SAN与NAS区别和联系

  当我们对SAN和NAS进行比较时,我们发现这两种相互竞争的技术实际上是互补的。SAN和NAS是在不同用户需求的驱动下的独立事件。SAN是以数据为中心的,而NAS是以网络为中心的。概括来说,SANs具有高带宽块状数据传输的优势,而 NAS则更加适合文件系统级别上的数据访问。用户可以部署 SAN 运行关键应用,比如数据库、备份等,以进行数据的集中存取与管理;而NAS 支持若干客户端之间或者服务器与客户端之间的文件共享,所以用户可使用NAS作为日常办公中需要经常交换小文件的地方,比如文件服务器、存储网页等。越来越多的设计是使用SAN 的存储系统作为所有数据的集中管理和备份,而需要文件级的共享即File system I/O则使用NAS的前端(所谓前端,即只有CPU及OS,OS可以是windows 或Unix的内核或简化版,不包含盘体装载数据),后端还是会集中到SAN 的磁盘阵列中采取数据,提供高性能、大容量的存储设备。

共2页。 1 2 :