大型站点技术架构(五)--站点高可用架构

大型站点技术架构(一)--大型站点架构演化

大型站点技术架构(二)--架构模式

大型站点技术架构(三)--架构核心要素

大型站点技术架构(四)--站点的高性能架构



      站点的可用性(Avaliability)描写叙述站点可有效訪问的特性。

1、站点可用性的度量与考核

      站点不可用时间(故障时间)=故障修复时间点-故障发现(报告)时间点


      站点年度不可用时间=(1-站点不可用时间/年度时间)× 100%


      可用性指标时站点架构设计的重要指标,对外是服务承诺,对内是考核指标,详细到每一个project师。很多其它的是使用故障分。


      所谓故障分是指对站点故障进行分类加权计算故障责任的方法。例如以下是个案例:

分类

描写叙述

权重

事故级故障

严重故障,站点总体不可用

100

A类故障

站点訪问不顺畅或核心功能不可用

20

B类故障

非核心功能不可用。或核心功能少数用户不能訪问

5

C类故障

其它故障

1

     故障分的计算公式为:


     故障分=故障时间(分钟)* 故障权重

2、站点的高可用架构

一个典型的站点设计通常遵循例如以下图所看到的的基本分层模型。

 

在负载的大型站点架构中,划分的粒度会更小,更详细,但通常还是能够把这些server划分到这三层中。

           对于应用层的server通常为了应对高并发的訪问请求,会通过负载均衡设备将一组server组成一个集群共同 对外提供服务,当负载均衡设备通过心跳检測到某台server不可用时,就将其从集群列表中提出,并将请求分发到集群中其它 可用的server上,是整个集群保存可用,从而实现应用高可用。

        位于服务层的server情况和应用层相似,也是通过集群方式实现高可用,仅仅是这些server被应用层通过分布式服务调用框架訪问。 分布式服务调度框架会在应用层client中实现负载均衡功能。

        位于数据层的server情况比較特殊。数据server上存储着数据,为了保证数据不丢失,数据訪问服务不中断,须要在数据写入时进行数据同步复制,将数据写入多台server上,实现数据冗余备份。
        站点升级的频率一般都非常高,每次站点公布都须要关闭服务,又一次启动系统,相当于server宕机。因此站点的可用性架构还须要考虑到站点升级 公布引起的宕机。

3、高可用的应用

         应用层主要处理站点应用的业务逻辑。也称为业务逻辑层。应用的一个显著特点就是应用的无状态行,因此实现负载均衡相对简单一点。
         Web应用中将这些多次请求的上下文称为回话(Session)。在单机情况下,session可部署在server上的Web容器上管理。在使用负载均衡 的集群环境中,因为负载均衡server可能会将请求分发到集群不论什么一台应用server上,所以保证每次请求依旧能够获得正确的session比单机 时要复杂的多。在集群环境下,session管理主要有  下面手段。

          1、Session复制

Session复制是早期企业应用系统使用较多的一种server集群Session管理机制。应用server开启Web容器的Session复制功能,在集群中几台server之间同步Session对象。是每台server上都保存全部用户的Session信息。

        这样的方案尽管简单,从本机读取Session信息也非常快,但当集群规模比較大的时候会占用server和站点的大量资源,在大量用户訪问的情况下,甚至会出现内存不够Session使用的情况。

         2、Session绑定

        Session绑定能够利用负载均衡的源地址Hash算法实现,负载均衡server总是将来源于同一IP的请求分发到同一台server上。这样在整个回话期间。用户全部的请求都在同一天server上处理,即Session绑定到某台特定的server上。保证Session总能在这台server上获取。这样的方法有成为回话粘滞。

        3、利用Cookie记录Session

        一种管理Session的方式是将Session记录在client,每次请求server的时候。将Session放在请求中发送给server,server处理完请求后再将改动后的Session响应给client。

       4、Sessionserver

        Sessionserver。即把session的管理独立部署在某一台机器上,Webserver不保存用户Session信息,每次都去Sessionserver取数据。

        这样的解决方式其实是将应用server的状态分离,分为无状态的应用server和有状态的Sessionserver。

对于有状态的Sessionserver,一种比較简单的方式是利用分布式缓存、数据库等。

4、高可用的服务

      可复用的服务模块为业务产品提供基础公共服务,大型站点中这些服务通常都独立分布式部署。被详细应用远程调用。可复用的服务和应用一样,是无状态的,因此能够使用相似负载均衡的失效转移策略实效高可用的服务。
      除此之外,在实践中,另一些几点高可用的服务策略。

      1、分级管理
      2、超时设置
      3、异步调用
      4、服务降级,站点高峰期间。能够关闭一些不重要的服务,如评论。

5、高可用的数据

      保证数据存储高可用的手段主要是数据备份和失效 转移机制。

      CAP原理:即数据持久性、数据可訪问性、数据一致性。

6、高可用的站点质量保证

     这里主要说下站点公布流程吧。看图就可以:


 7、站点执行监控

     “不同意没有监控的系统上线”。站点执行监控对于站点运维和架构设计优化至关重要,运维没有监控的站点,宛如驾驶没有仪表的飞机。
     详细到监控哪些数据,主要有:
      1、用户行为日志收集(server端和浏览器端)
      2、server性能监控(CPU、内存等)
      3、执行数据监控(缓存命中率、平均响应延迟时间、每分钟发送邮件数目、待处理的任务总数等

    监控数据採集后,除了用作系统性能评估、集群规模伸缩性预測等。还能够依据实时监控数据进行风险预警。并对server进行失效转移。自己主动负载调整,最大化利用集群全部机器的资源。

猜你喜欢

转载自www.cnblogs.com/ldxsuanfa/p/10670037.html