ZStack--级联框架

   云中的资源相互都有关系。操作一个资源通常会引发连锁反应;例如,当删除一个集群的时候,删除属于该集群的所有主机,并停止在这些主机上运行的所有VM是有道理的。传统的IaaS软件要么硬编码连锁反应,要么简单地禁止这些操作,例如,禁止用户删除有虚拟机运行的集群。ZStack提供一个级联框架,用以散布本来只对一个资源的操作到所有相关的资源。资源可以通过实现一个简单的扩展点以加入级联框架,使得资源的业务逻辑与框架解耦。

动机

    云中的资源或多或少相互依赖;例如,主机是集群的子资源,主存储器是集群的同级资源,而L3网络是区域的后代资源。资源之间的关系可以被描述为一个有向图:

    上图我们展示了ZStack的主要资源;不同的IaaS软件可能使用不同的术语,它主要是想让你有一个粗略的概念。如图所示,当对资源进行操作时,不仅仅是目标资源,相关资源也将受到影响;例如,当删除一个区域时,比较理想的是属于该区域的集群、主机、主存储、L2网络等资源也同时被删除。为了处理这个问题,IaaS软件必须满足级联(cascading)操作的需求。

问题

    大多数IaaS软件很少考虑级联操作。它们要么硬编码业务逻辑,例如,你需要显式删除一个将要被删除帐户的所有资源;要么直接不允许这种操作,例如,当你试图删除一个IP地址范围时,抛出一个错误信息“仍有VM使用在这个IP范围中的IP”。这两种方法都会带来很多麻烦。对硬编码而言,它使软件不能灵活的添加新的资源,因为你必须修改现有的代码来添加级联操作,例如,修改删除帐户的代码使得账户删除时,新资源也被删除。对于完全没有责任感的错误信息,用户要么去做无聊的工作,例如,在删除一个IP范围之前,手动删除100个虚拟机;要么摧毁现有的一切,然后从零开始,例如,重新部署整个云。

    避免误操作不是借口:有些人可能会声称不允许级联删除是慎重考虑的结果,因为用户可能会误操作,误操作可能带来灾难性的后果;例如,错误地删除区域会导致损失掉所有虚拟机。然而,这种说法只是一个错误的借口,并且是一种为用户做决定的自作聪明。你能想象吗,当你为了删除一个区域必须手动删除10,000个虚拟机,因为软件认为你可能会做错事,所以迫使你枯燥的重复10,000次任务确认?一个好的软件应该为用户提供选择,并让他们做出决定。在我们的例子中,IaaS软件应该在进行到最后删除之前警告用户,还有10,000台虚拟机在运行;但一旦用户承认他们需要这么做,软件就应该这么做。

    级联框架

    ZStack通过一个级联框架解决这一问题;顾名思义,级联框架允许一个操作能从一个资源级联到其他资源。为了解耦整个架构,这个级联框架被作为一个单独的组件创造出来,资源可以按意愿加入框架。要加入框架,资源所需要做的全部事情就是实现一个扩展点CascadeExtensionPoint(在我们的例子中AbstractAsyncCascadeExtension是一个实现CascadeExtensionPoint的类):

    getCascadeResourceName()方法返回该资源的名称(VmInstance);getEdgeNames()方法返回一个和资源直接关联的资源名列表,在我们的例子中返回主存储、L3网络、IpRange和主机;所以如果删除操作在这些edge resources或其上游资源(如区域)上发生时,该操作将被级联至在getEdgeNames()方法中声明了这些资源的扩展。级联扩展可以在asyncCascade() 中采取行动,并获取必须的信息比如操作码(如删除),根发起者(如区域,下文将很快给出解释),作为操作来源的父发起者(如主机,将很快给出解释)和操作上下文(例如,哪台主机正在被删除)。由于资源的关系是一个可能有环路的有向图,级联框架将把图压扁成一棵树,并把环路变为分支。例如,删除区域的操作将最终创建以下树(一部分):

    注:如你所见,删除区域操作将多次级联到虚拟机的级联扩展;这是刻意的,因为级联扩展通常依赖于父发起者去决定该采取什么行动;在这个例子中,虚拟机的父发起者为主存储、主机、L3网络和IP范围;然而,对于不同的父发起者,扩展可能会采取不同的行动;例如,如果父发起者为主存储并且操作码为delete,该扩展将摧毁所有根云盘在该主存储的虚拟机;但如果父发起者是主机,扩展将会只停止在那台主机上的虚拟机,因为这些虚拟机稍后就可以在其他主机上启动。考虑到ZStack没有产生冲突的级联操作,例如,不会有一个操作导致虚拟机在路径A启动而在路径B停止,所以级联操作从不同路径进行多次延伸是没有问题的。

    当级联一个操作时,该框架从该操作被应用的root issuer开始;在上述删除区域的示例中,zone是根发起者;那么框架将从根发起者遍历树,并调用扩展的createActionForChildResource()方法为每一条路径上的每一个扩展创建上下文;一旦所有上下文创建成功,该框架将再次遍历树,不过是从叶子节点到根,并调用每个扩展的asyncCascade()方法;一个扩展可以依靠父发起者去决定应该做哪些操作,父发起者在getEdgeNames()方法中以资源名的方式声明;例如,如果父发行者是主机,则停止虚拟机;如果父发行者是主存储,则删除虚拟机。

    这两个阶段的遍历保证,一个操作(例如删除)将只会被应用到根发起者,在所有下游资源都做完一些合适的操作后。例如,一个区域只在所有子孙资源都被删除后才能被删除。

    由于并不是所有的操作都需要级联,一个资源可以在它需要的时候直接调用CascadeFacade.asyncCascade()。

总结

    在这篇文章中,我们演示了ZStack的级联框架,这是一个强大的工具,用于扩散操作而不需要硬编码。ZStack中有很多操作使用了它,除了我们在文中提到的以外,一些操作,如卸载主存储(这将停止将被卸载的集群中的所有虚拟机),卸载L2网络(这将停止将被卸载的集群中的所有虚拟机)都是以这种方式实现的。有了它的帮助,管理员可以快速尝试不同的云部署而无需担心不方便;你可以只删除你的部署的一部分并重新创建一个新的,而不需要仅因为你在一个设计错误的L2网络上创建了许多虚拟机,就重新部署整个云(举个例子)。

猜你喜欢

转载自blog.csdn.net/bjczhl/article/details/79102932