引导---采用一定的方法论,将现有企业架构延伸至云计算。该方法论包含以下基本步骤:1.定义数据2.定义服务3.定义流程4.定义哪些候选数据、服务和流程应该放在云平台,哪些放在本地。当我们对现有信息、服务和流程模型有更好的理解时,向云计算的转移就会更加成功。
第五章 云计算与数据你可以使用获得的任何量化数据,可是仍然不得不怀疑它,并依赖于自己的智慧与判断。---阿尔文·托勒夫
-----------------------------------------------------------------------------------------------
将现有系统从本地转移到云平台中,还是要定义新的系统,定义托管在云平台中的新系统?这个问题,其实系统有时候是新建的,但是整个过程不会有太多区别,从头开始定义数据、服务和流程。但是加上了如何创建本体语言,如何定义数据,如何
创建核心构件以及如何创建核心信息模型。
本章要求为打放入云计算环境中的候选应用系统定义出相关元数据。需要定义的内容包括数据当前位于何处、数据结构、逻辑模型
、物理模型、安全问题和数据定义等。等到过程完成,应该有一个丰富的元数据层以及一个通用信息模型。
建议从数据到服务,再到流程的方向。不过,这是个灵活的规则。如果合适,也能逆向进行。一般说来,信息是服务的基础,而业
务实际上是服务的逻辑组合。
数据的概念: 数据:事实的集合。数据通常被看做用于创建信息和知识的最低级别的抽象。 信息:具有意义的数据结构,即按照有意义的方式组织的数据。 应用语义:数据在不同的应用中表现出来的不同语义。 元数据:描述数据的数据。把它用作理解数据如何在多个系统中进行描述、所有权控制、保护和治理的基础。 本体:在计算机科学和信息科学中,本体是对一个领域中的一组概念以及它们之间的关系的形式表达。它通常用于推力该领域
中的属性,也用于定义域。 模式:数据库系统的模式是有数据管理系统所支持的结构。 数据字典:集中存储的数据信息,包括含义、与其他数据的关系、来源、用法以及格式等。通常指的是单个应用或系统。 数据目录:为数据编目,将收集到的数据形式化,包括数据字典。两者的区别就是数据字典针对的是单个系统,而数据目录则
是跨越问题域的所有系统。 信息模型:数据目录可以看成架构问题的潜在解决方案,而信息模型看成架构的解决方案或"目标状态"。信息模型描述了问
题域中所有的主要主体以及这些主体是如何关联,本质上,它是我们在建设架构时使用的企业通用数据模型的中心模型,或者是融
合云计算的SOA中实施的目标数据层的定义。信息模型是本章的交付件。
1.选择合适的问题域 不能太庞大,太复杂,时间周期过长,容易失败;不能太小,需要足够大,以至于能产生影响力。
2.定义信息模型 分析信息的推荐流程: 建立信息模型 | | |----理解本体------->本体
遗留系统元数据------ | | | |----------- | 外部元数据----------- | | 理解数据------>数据字典与元数据 | | | 数据入册------>数据目录 | | | 构建信息模型--->信息模型
2.1理解本体:散步在多个信息系统中的数据以及多个分离域中的信息,本体使得我们无需知道信息位于何处,都能够很好理解该信
息,并将它映射到融合云计算的SOA中;同时还能区分资源,特别是对冗余数据。 此外,识别个别实体的需要使用不同的资源去标识。例如在关系数据库中,实体是通过主键的。
2.2理解数据。检查信息和数据的细节,创建出传统的可交付构件,如定义元数据的数据字典。
2.3标识数据。为标识和定位数据信息,分为两步走:首先是建立问题域中应用系统的列表。根据这个列表,确定哪些数据库能够支
撑这些系统。第二步是明确数据库的所有权、物理位置、相关设计信息及商标、模型及补丁等数据库的基本信息。①创建数据字典 需要追踪的信息有:特定数据元素存在的原因、所有者、格式、安全属性、逻辑数据结构和物理数据结构的作用。②理解一致性问题 理解数据库建设中应用的规则和逻辑是至关重要的,需要正确地理解和定义数据库之间的关系,确保它们之间的一致性。虽然
有的数据库自带一致性控件,但这中可靠性的信赖并不总能正确。 ③理解数据延迟 数据延迟是描述数据实时性的数据特征,它是使用云计算的过程中必须明确的数据的另一属性。关注的信息包含:实时、接近
实时和不定时。 实时数据:信息再发生时就放入数据库,没有延时或少延时。0延时的实时数据是一个巨大挑战目标。 接近实时的数据:按照固定时间段更新而非及时更新的数据。 不定时数据:在给定时间段内仅有一次更新。 接下来分析了BMH系统,从该系统的核心数据出发,为每个系统创建了数据字典(包括:特定数据元素存在的原因、所有者、格式
、安全属性和逻辑数据结构、物理数据结构的作用)。然后是数据目录(描述、所有者、安全属性、一致性关心和依赖关系=)。接
下来标识出问题域中的实体。
2.4数据目录。一个好的数据目录应该把系统中所有的数据元素都列举出来,一定要记录:描述、所有者、系统、格式、安全属性、
一致性属性和依赖关系。这个复杂的数据字典,不仅包括了传统数据字典中的信息,还包括云计算项目感兴趣的信息,如系统信息
、安全信息、所有者、连接的流程、交互机制、一致性问题以及诸如格式、属性名和描述等传统的元数据。 3创建信息模型 信息模型:融合云计算的SOA项目的最终的目标数据结构,又是确定哪些信息应放在云计算平台中,哪些信息应放在本地企业应
用中的起始位置。 3.1信息级别的架构使用的企业元数据模型可以分为两个组件:逻辑模型和物理模型。逻辑数据模型为跨越整个应用程序域的数据或
与在建的架构方案相关的数据提供了一个整合视图,通常使用实体--联系图描述。
3.2建议的物理模型,需要映射到面向对象的、多维度的、层次化的文件系统和关系数据库。物理模型的输入是逻辑模型和数据目录
,在访问这些信息时,需要考虑数据字典、业务规则以及其他用户处理的需求。
4数据在融合云计算的SOA结构中的重要性 本章帮助我们确定哪些数据应移植到云计算平台,哪些数据应该保存在本地。为了新架构--融合云计算的SOA,这个新就是,对
于目标架构,有些数据处于云平台中不在掌控之中。在我们定义数据结构、数据关系、一致性、安全性以及其他要素时候,还需要
考虑如何在本地和云计算系统之间管理数据,确保数据就像存放在本地数据中心一样