随着PB级大小的数据库即将来临,企业的CIO也许会问自己:“要如何应用1024TB或者1PB 的数据?PB级的数据仓库真的具有投资的价值吗?”数据仓库的成功设计与部署关键在于其可扩展性,可扩展性是企业运用详细且实时的商业智能制定有效决策并创造价值的关键指标。

  今天,企业竞争优势并不在于价格或产品的差异,而在于企业必须比竞争对手掌握更详细的客户与潜在客户的信息。要让潜在客户变成忠实顾客,关键在于必须在适当的时间,向客户提供适当的产品、服务与信息。要做到这点,企业必须先收集足够且详细的客户信息,找出重要的模式,并且有适当的系统将信息统一存储,以供日后实时运用。 

  数据仓库让企业有能力收集大量且详细的资料(目前已经是数百个TB,PB也指日可待),并让企业能在几秒内就完成部署。要能快速搜寻并部署如此大量的数据,系统的可扩展性是重要的条件。

  可扩展性是在硬件配置上增加额外的处理能力,并在性能上呈线性的提升。换个角度来看,就是在不影响性能的前提下,提升硬件存储与处理大量数据的能力(或是处理日渐复杂的查询及日渐增加的多笔并发查询)。不良的设计或产品部署只会导致相反的结果,造成性能降低的速度快于数据量增加速度。 

  像SBC电信等公司的数据仓库系统运用了数百个顶级的英特尔处理器,数百个GB容量的可寻址内存以及数百个TB磁盘空间,来支持一个单一的数据库。像这样系统的设计与部署应该包含哪些成功因素呢?真正的可扩展性应该包含以下四个层面:

  第一层面:处理大量的数据

  企业每日运营会产生大量的数据,而这些数据可用来支持重要的商业应用与决策制定。除此之外,数据库每MB的成本也不断降低。然而,问题依然存在:这么多的数据真的能增加企业价值,证明数据存储真的值得投资吗? 

共2页。 1 2 :