企业级数据服务总线规划

目前,很多企业都面临着如下问题:企业需要的数据在哪里?如何才能在预定的时间内获取所需要的数据?这些数据意味着什么?这些数据可信吗?如何才能将需要的数据转换为所需的格式?如何才能将它加载到企业需要的地方?如何有效控制这些数据?同时,还要面对如下现实:数据架构规划缺位带来的数据异构分布问题;数据孤岛、冗余和流程割裂带来的数据不一致问题;元数据管理不统一带来的数据血缘关系混乱问题;数据私有化、应用部门条块化带来的数据质量不高问题等。数据服务总线概念的提出正是解决这些问题的一种新思路。
  一、企业级信息总线的提出
  随着以客户为中心的理念逐步落实,为客户提供综合性的产品和服务、围绕客户便利建立业务流程、提供一致的客户体验等需要越来越突出,同时市场激烈的竞争环境也要求企业快速推出新产品和新服务。
  为此,对企业的IT架构提出这样的要求:要求各业务系统能同时为多个渠道提供服务,以提供一致的客户体验;要求单个渠道能同时访问多个业务系统的服务,以组合不同业务系统提供的服务;要求各应用系统提供的功能纳入流程管理,以给客户提供更多的使用便利;要求各应用系统之间实现数据交换和数据整合,以给管理层提供有价值的综合性信息。
  建立企业级信息总线来实现业务系统与各渠道系统以及各业务系统之间的集成是实现柔性架构的较好选择。各系统之间不再相互连接,而是通过信息总线实现间接连接,从而构成一个星形的、松耦合的应用体系架构。信息总线是个逻辑概念,其具体形式可以很灵活,可以是一个元总线概念,而不一定是一个中心Hub,甚至还可以部分采取点对点直连的方式,以此尊重应用系统客观上的差异。
  企业级信息总线的建设要超越“部门级和产品级”的视野,根据整个企业的发展方向来构建信息化体系,以此保证IT总体架构的柔性。企业级信息总线系统的建设可分为以下两个阶段:第一阶段是建立面向服务的企业级信息总线,实现渠道系统、业务系统和管理系统的应用与数据共享;第二阶段是实现基于信息总线的业务流程整合,利用BPM技术实现不同系统间流程的衔接,解决流程割裂的问题。
  二、数据服务概念的引入
  企业级信息总线的建设有助于优化IT总体架构,其首要任务应是建设EASB(Enterprise Application Service Bus,企业应用服务总线)和EDSB(Enterprise Data Service Bus,企业数据服务总线)。EASB通过注册和发布不同系统的应用服务、屏蔽不同系统在通信和数据提供方式上的差异,实现应用服务的共享;EDSB提供不同系统间数据传输的高速通道,同时实现数据基于一定标准的转换和存储,并对外提供直接数据服务。通过EDSB可实现不同系统之间数据关系的松耦合,以更加直接的方式实现企业的信息资源共享。
  从信息获取的角度看,EDSB有别于EASB之处在于它获取的信息是“生”(RAW)的,对数据的操作是批量的、直接的。EDSB的实现是数据从单个部门、单个系统通过公共服务提供平台从专有迈向共享的过程。数据服务,即面向服务的数据共享本质上是一种设计风格,它通过松耦合的可重复服务将相关的数据直接呈现给各种用户和流程,并利用开放标准获得数据的可互操作性。
  数据服务总线由有组织的数据及其集成平台构成,数据集成平台能够提供强大的数据级功能和共享服务方法,支持数据使用者以一致和可重复的方式访问任何位置、任意形式的数据。借助数据集成平台提供开放的、基于标准的数据服务功能(包括数据访问、语义调解、数据管理等),可以提高企业范围内数据的可用性。
  三、数据服务总线规划的通病
  尽管企业级数据服务总线在不同的企业有不同的称呼和不同的定位,如企业数据整合平台(EIIP,Enterprise Information Integration Platform)、企业信息服务总线(EISB,Enterprise Information Service Bus)等,但数据服务总线必将成为越来越多的企业总体架构的事实上的核心节点。然而,许多企业中如此重要的核心节点的发展并不顺畅。究其原因,主要在规划方面存在以下问题。
  (1)对数据服务总线重要性认识不足。在架构管理层面未能充分认识数据服务总线是IT成本控制的重要环节,及其对于建立柔性IT总体架构的重要性,缺乏具有前瞻性的规划,缺乏相关领域系统的明确定位和必要的投入。
  (2)异化了数据服务总线的全局性概念。不少企业以数据交换平台 (UDI,Unified Data Interchange)或企业级数据仓库(EDW,Enterprise Data Warehouse)来代替企业级数据服务总线,以偏概全,犯了规划片面化、简单化的错误。
  (3)有规划、无变化,数据服务总线的规划缺乏必要的弹性。企业级数据服务总线的规划重在具备随需而变的能力,需要根据数据提供系统的特点和数据消费系统的需要具备提供多层次数据服务的能力。
  (4)只选贵的,不选对的。特定数据的获取往往有多种渠道和方式,但成本是不同的。不少企业在规划企业级数据服务总线时未能借鉴SLA(服务水平协议)的理念为用户提供最适合的数据服务。
  由于在规划层面存在先天缺陷,诸如数据依赖关系混乱、数据处理环节繁多、数据重复存储、交换标准不统一、数据定义不一致、数据复用成本高、元数据管理缺失等问题也就不足为奇了。而上述问题的存在必将影响IT总体架构的可持续性,企业数据服务总线的全面规划已刻不容缓。
  四、数据服务总线规划的目标
  数据服务总线规划的根本目标是建立数据服务领域的架构体系,而不能简单、狭隘地将其理解为单个的应用系统。数据服务总线的规划出发于且根植于数据消费系统对于数据整合范围、数据加工深度、数据新鲜程度的需求,不能脱离具体需求空谈规划问题,其架构见图1。




数据服务总线规划的具体方向和目标可归纳如下:
  (1)在SLA理念指导下,根据数据消费系统的需求,分类处理,提供不同加工深度、精度、速度的数据服务通道,为数据消费系统提供最合适的数据服务模式。
  (2)创建可扩展的系统架构,满足快速提供大量数据的要求,并且能够支持未来潜在的数据需求。
  (3)建立高效灵活的ETL体系,改变具体数据消费系统独立处理数据的现状,减少数据传输环节,减少数据落地,降低数据存储成本。
  (4)建立数据模型,提高数据质量,屏蔽源系统对目标系统的影响,统一存储、保证数据的一致性,实现数据共享。
  (5)抽取和提炼数据消费系统共性的数据处理活动,统一规划,提高信息利用率,以减少重复加工成本。
  (6)建立和健全数据管理、控制机制,严格审查和规范数据依赖关系,在网络、系统、应用层面建立数据安全保障体系。
  (7)依据元数据管理成熟度模型理论,引入元数据管理工具,提升共享、重新获取和理解企业信息资产的水平。
  数据服务总线的规划和落地实施既是技术问题也是管理问题,管理方面的问题往往直接阻碍技术进步。因此,在架构管理层面应明确数据提供者、数据使用者、数据中间环节加工者这三者之间的分工与责任,指定未来数据服务总线的规划、研发与运行管理责任单位,维持一个较为稳定的团队,实现专业化、团队化管理。同时,在此过程中应正确处理好历史遗留系统与新建系统的关系,以存量和增量的眼光对其区别对待,正确发挥组成数据服务总线的各要素系统的作用。
  总之,在SLA理念的指导下,全面规划数据服务架构,制定数据服务的标准,整理归纳数据服务分类与层次划分,将有助于实现IT总体架构数据服务水平的提升。


猜你喜欢

转载自maosheng.iteye.com/blog/1929111