浅谈大型web系统架构

动态应用,是相对于站点静态内容而言,是指以c/c++、php、Java、perl、.net等server端语言开发的网络应用软件,比方论坛、网络相冊、交友、BLOG等常见应用。动态应用系统通常与数据库系统、缓存系统、分布式存储系统等密不可分。

  大型动态应用系统平台主要是针对于大流量、高并发站点建立的底层系统架构。大型站点的执行须要一个可靠、安全、可扩展、易维护的应用系统平台做为支撑,以保证站点应用的平稳执行。

  大型动态应用系统又可分为几个子系统:

  1)Web前端系统

  2)负载均衡系统

  3)数据库集群系统

  4)缓存系统

  5)分布式存储系统

  6)分布式server管理系统

  7)代码分发系统

  Web前端系统

  结构图:

 

  为了达到不同应用的server共享、避免单点故障、集中管理、统一配置等目的,不以应用划分server,而是将全部server做统一使用,每台server都能够对多个应用提供服务,当某些应用訪问量升高时,通过添加server节点达到整个server集群的性能提高,同一时候使他应用也会受益。该Web前端系统基于Apache/Lighttpd/Eginx等的虚拟主机平台,提供PHP程序执行环境。server对开发者是透明的,不须要开发者介入server管理

  负载均衡系统


  负载均衡系统分为硬件和软件两种。硬件负载均衡效率高,可是价格贵,比方F5等。软件负载均衡系统价格较低或者免费,效率较硬件负载均衡系统低,只是对于流量一般或稍大些站点来讲也足够使用,比方lvs, nginx。大多数站点都是硬件、软件负载均衡系统并用。

  数据库集群系统

  结构图:


  因为Web前端採用了负载均衡集群结构提高了服务的有效性和扩展性,因此数据库必须也是高可靠的,才干保证整个服务体系的高可靠性,怎样构建一个高可靠的、能够提供大规模并发处理的数据库体系?

  我们能够採用如上图所看到的的方案:

  1) 使用 MySQL 数据库,考虑到Web应用的数据库读多写少的特点,我们主要对读数据库做了优化,提供专用的读数据库和写数据库,在应用程序中实现读操作和写操作分别訪问不同的数据库。

  2) 使用 MySQL Replication 机制实现高速将主库(写库)的数据库拷贝到从库(读库)。一个主库相应多个从库,主库数据实时同步到从库。

  3) 写数据库有多台,每台都能够提供多个应用共同使用,这样能够解决写库的性能瓶颈问题和单点故障问题。

  4) 读数据库有多台,通过负载均衡设备实现负载均衡,从而达到读数据库的高性能、高可靠和高可扩展性。

  5) 数据库server和应用server分离。

  6) 从数据库使用BigIP做负载均衡。

  缓存系统


  缓存分为文件缓存、内存缓存、数据库缓存。在大型Web应用中使用最多且效率最高的是内存缓存。最经常使用的内存缓存工具是Memcached。使用正确的缓存系统能够达到实现下面目标:

  1、使用缓存系统能够提高訪问效率,提高server吞吐能力,改善用户体验。

  2、减轻对数据库及存储集server的訪问压力。

  3、Memcachedserver有多台,避免单点故障,提供高可靠性和可扩展性,提高性能。

  分布式存储系统

  结构图:


  Web系统平台中的存储需求有以下两个特点:

  1) 存储量非常大,常常会达到单台server无法提供的规模,比方相冊、视频等应用。因此须要专业的大规模存储系统。

  2) 负载均衡cluster中的每一个节点都有可能訪问不论什么一个数据对象,每一个节点对数据的处理也能被其它节点共享,因此这些节点要操作的数据从逻辑上看仅仅能是一个总体,不是各自独立的数据资源。

  因此高性能的分布式存储系统对于大型站点应用来说是很重要的一环。(这个地方须要增加对某个分布式存储系统的简介。)

  分布式server管理系统

  结构图:


  随着站点訪问流量的不断添加,大多的网络服务都是以负载均衡集群的方式对外提供服务,随之集群规模的扩大,原来基于单机的server管理模式已经不可以满足我们的需求,新的需求必须可以集中式的、分组的、批量的、自己主动化的对server进行管理,可以批量化的运行计划任务。

  在分布式server管理系统软件中有一些比較优秀的软件,当中比較理想的一个是Cfengine。它能够对server进行分组,不同的分组能够分别定制系统配置文件、计划任务等配置。它是基于C/S 结构的,全部的server配置和管理脚本程序都保存在Cfengine Server上,而被管理的server执行着 Cfengine Client 程序,Cfengine Client通过SSL加密的连接定期的向server端发送请求以获取最新的配置文件和管理命令、脚本程序、补丁安装等任务。

  有了Cfengine这样的集中式的server管理工具,我们就能够高效的实现大规模的server集群管理,被管理server和 Cfengine Server 能够分布在不论什么位置,仅仅要网络能够连通就能实现高速自己主动化的管理。

  代码公布系统

  结构图:


  随着站点訪问流量的不断添加,大多的网络服务都是以负载均衡集群的方式对外提供服务,随之集群规模的扩大,为了满足集群环境下程序代码的批量分发和更新,我们还须要一个程序代码公布系统。

  这个公布系统能够帮我们实现以下的目标:

  1) 生产环境的server以虚拟主机方式提供服务,不须要开发者介入维护和直接操作,提供公布系统能够实现不须要登陆server就能把程序分发到目标server。

  2) 我们要实现内部开发、内部測试、生产环境測试、生产环境公布的4个开发阶段的管理,公布系统能够介入各个阶段的代码公布。

  3) 我们须要实现源码管理和版本号控制,SVN能够实现该需求。

  这里面能够使用经常使用的工具Rsync,通过开发对应的脚本工具实现server集群间代码同步分发。


原文地址:https://www.cnblogs.com/mengfanrong/p/4274606.html