周末学习笔记——B/S和C/S的介绍

B/S架构基本概念

B/S是Browser/Server，即浏览器/服务器架构。Browser指的是Web浏览器，极少数事务逻辑在前端实现，但主要事务逻辑在服务器端实现。

B/S三层体系结构可以定义为：

l 客户机上的表示层

l 中间的web服务器层

l 后端的数据库服务器层

在B/S三层体系结构模式下，客户端不再需要安装特定的客户端应用程序，取而代之的是通用浏览器软件，所有的用户业务逻辑都被部署在新的中间层上。

由于三层体系结构通常是基于web的，所以中间层应用程序通常工作在web服务器上，被视为web服务器的一种功能扩展，因此中间层又称为web服务层。在web服务器上，通过大量的包含CGI/Servlet是服务端脚本程序页面，接受来自客户端浏览器的请求，以及完成对数据库的操作。

B/S架构中，显示逻辑交给了Web浏览器，事务处理逻辑在放在了WebApp上，这样就避免了庞大的胖客户端，减少了客户端的压力。因为客户端包含的逻辑很少，因此也被成为瘦客户端。

服务端编程是指在web服务器上编写程序并使之正常运行。在B/S模式下，当用户下载一个网页时，如果网页中包含服务端脚本程序，web服务器将首次执行网页中的脚本程序，然后把执行的结果网页发送到客户端浏览器显示。

B/S架构优缺点

优点：

(1) 客户端无需安装，有Web浏览器即可；

(2) BS架构可以直接放在广域网上，通过一定的权限控制实现多客户访问的目的，交互性较强；

(3) BS架构无需升级多个客户端，升级服务器即可。

缺点：

(1) 在跨浏览器上，BS架构不尽如人意；

(2) 表现要达到CS程序的程度需要花费不少精力；

(3) 在速度和安全性上需要花费巨大的设计成本，这是BS架构的最大问题；

(4) Browser和Server交互是请求-响应模式，通常需要刷新页面，这并不是客户乐意看到的，在AJAX流行后此问题得到了一定程度的缓解。

C/S架构基本概念

C/S是Client/Server，即客户端/服务器端架构，一种典型的两层架构。客户端包含一个或多个在用户的电脑上运行的程序。服务器端有两种，一种是数据库服务器端，客户端通过数据库连接访问服务器端的数据；另一种是Socket服务器端，服务器端的程序通过Socket与客户端的程序通信。

因为客户端需要实现绝大多数的业务逻辑和界面展示。作为客户端的部分需要承受很大的压力，因为显示逻辑和事务处理都包含在其中，通过与数据库的交互（通常是SQL或存储过程的实现）来达到持久化数据，以此满足实际项目的需要。

C/S架构优缺点

优点：

(1) 界面和操作可以很丰富；

(2) 安全性能可以很容易保证，实现多层认证也不难；

(3) 由于只有一层交互，因此响应速度较快。

缺点：

(1) 适用面窄，通常用于局域网中；

(2) 用户群固定，由于程序需要安装才可使用，因此不适合面向一些不可知的用户；

(3) 维护成本高，发生一次升级，则所有客户端的程序都需要改变。

个大型服务系统都是从小一步一步走过来的，在每个阶段，找到对应该阶段网站架构所面临的问题，然后在不断解决这些问题，在这个过程中整个架构会一直演进。
那我们来一起看一下。

单服务器-俗称all in one

从一个小网站说起。一台服务器也就足够了。文件服务器，数据库，还有应用都部署在一台机器，俗称ALL IN ONE

随着我们用户越来越多，访问越来越大，硬盘，CPU，内存等都开始吃紧。一台服务器已经满足不了。这个时候看一下下一步演进

数据服务与应用服务分离

我们将数据服务和应用服务分离，给应用服务器配置更好的 CPU，内存。而给数据服务器配置更好更大的硬盘。

分离之后提高一定的可用性，例如Files Server挂了，我们还是可以操作应用和数据库等。
随着访问qps越来越高，降低接口访问时间，提高服务性能和并发，成为了我们下一个目标，发现有很多业务数据不需要每次都从数据库获取。

使用缓存，包括本地缓存，远程缓存，远程分布式缓存

因为 80% 的业务访问都集中在 20% 的数据上，也就是我们经常说的28法则。如果我们能将这部分数据缓存下来，性能一下子就上来了。而缓存又分为两种：本地缓存和远程缓存缓存，以及远程分布式缓存，我们这里面的远程缓存图上画的是分布式的缓存集群(Cluster)。

思考的点

00001. 具有哪种业务特点数据使用缓存？

00002. 具有哪种业务特点的数据使用本地缓存？

00003. 具有哪种务特点的数据使用远程缓存？

00004. 分布式缓存在扩容时候会碰到什么问题？如何解决？分布式缓存的算法都有哪几种？各有什么优缺点？

这个时候随着访问qps的提高，服务器的处理能力会成为瓶颈。虽然是可以通过购买更强大的硬件，但总会有上限，而且这个到后期成本就是指数级增长了，这时，我们就需要服务器的集群。需要使我们的服务器可以横向扩展，这时，就必须加个新东西：负载均衡调度服务器。

使用负载均衡，进行服务器集群

增加了负载均衡，服务器集群之后，我们可以横向扩展服务器，解决了服务器处理能力的瓶颈。

思考的点

00001. 负载均衡的调度策略都有哪些？

00002. 各有什么优缺点？

00003. 各适合什么场景？

打个比方，我们有轮询，权重，地址散列，地址散列又分为原ip地址散列hash，目标ip地址散列hash，最少连接，加权最少连接，还有继续升级的很多种策略......我们一起来分析一下

典型负载均衡策略分析

00001. 轮询：优点：实现简单，缺点：不考虑每台服务器处理能力

00002. 权重：优点：考虑了服务器处理能力的不同

00003. 地址散列：优点：能实现同一个用户访问同一个服务器

00004. 最少连接：优点：使集群中各个服务器负载更加均匀

00005. 加权最少连接：在最少连接的基础上，为每台服务器加上权值。算法为(活动连接数*256+非活动连接数)/权重，计算出来的值小的服务器优先被选择。

继续引出问题的场景：

我们的登录的时候登录了A服务器，session信息存储到A服务器上了，假设我们使用的负载均衡策略是ip hash，那么登录信息还可以从A服务器上访问，但是这个有可能造成某些服务器压力过大，某些服务器又没有什么压力，这个时候压力过大的机器(包括网卡带宽)有可能成为瓶颈，并且请求不够分散。

这时候我们使用轮询或者最小连接负载均衡策略，就导致了，第一次访问A服务器，第二次可能访问到B服务器，这个时候存储在A服务器上的session信息在B服务器上读取不到。

Session管理-Session Sticky粘滞会话：

打个比方就是如果我们每次吃饭都要保证我们用的是自己的碗筷，而只要我们在一家饭店里存着我们的碗筷，只要我们每次去这家饭店吃饭就好了。

对于同一个连接中的数据包，负载均衡会将其转发至后端固定的服务器进行处理。

解决了我们session共享的问题，但是它有什么缺点呢？

00001. 一台服务器运行的服务挂掉，或者重启，上面的 session 都没了

00002. 负载均衡器成了有状态的机器，为以后实现容灾造成了羁绊

Session管理-Session 复制

就像我们在所有的饭店里都存一份自己的碗筷。我们随意去哪一家饭店吃饭都OK，不适合做大规模集群，适合机器不多的情况。

解决了我们session共享的问题，但是它有什么缺点呢？

00001. 应用服务器间带宽问题，因为需要不断同步session数据

00002. 大量用户在线时，服务器占用内存过多

Session管理-基于Cookie

打个比方，就是我们每次去饭店吃饭，都自己带着自己的碗筷。

解决了我们session共享的问题，但是它有什么缺点呢？

00001. cookie 的长度限制

00002. cookie存于浏览器，安全性是一个问题

Session管理-Session 服务器

打个比方，就是我们的碗筷都存在了一个庞大的橱柜里，我们去任何一家饭店吃饭，都可以从橱柜中拿到属于我们自己的碗筷。

解决了我们session共享的问题，这种方案需要思考哪些问题呢？

00001. 保证 session 服务器的可用性，session服务器单点如何解决？

00002. 我们在写应用时需要做调整存储session的业务逻辑

打个比方，我们为了提高session server的可用性，可以继续给session server做集群

中间总结

所以说，网站架构在遇到某些指标瓶颈时，演进的过程中，都有哪些解决方案，他们都有什么优缺点？业务功能上如何取舍？如何做出选择？这个过程才是最重要的。

在解决了横向扩展应用服务器之后，那我们继续~~

继续回到目前架构图

数据库的读及写操作都还需要经过数据库。当用户量达到一定量，数据库将会成为瓶颈。那我们如何来解决呢？

数据库读写分离

使用数据库提供的热备功能，将所有的读操作引入slave 服务器，因为数据库的读写分离了，所以，我们的应用程序也得做相应的变化。我们实现一个数据访问模块(图中的data access module)使上层写代码的人不知道读写分离的存在。这样多数据源读写分离就对业务代码没有了侵入。这里就引出了代码层次的演变

思考的点

00001. 如何支持多数据源？

00002. 如何封装对业务没有侵入？

00003. 如何使用目前业务的ORM框架完成主从读写分离？是否需要更换ORM模型？ORM模型之间各有什么优缺点？

00004. 如何取舍？

数据库读写分离会遇到如下问题：

00001. 在master和slave复制的时候，考虑延时问题、数据库的支持、复制条件的支持。

00002. 当为了提高可用性，将数据库分机房后，跨机房传输同步数据，这个更是问题。

00003. 应用对于数据源的路由问题

使用反向代理和 CDN 加速网站响应

使用 CDN 可以很好的解决不同的地区的访问速度问题，反向代理则在服务器机房中缓存用户资源。

访问量越来越大，我们文件服务器也出现了瓶颈。

分布式文件系统

思考的点

00001. 分布式文件系统如何不影响已部署在线上的业务访问？不能让某个图片突然访问不到呀

00002. 是否需要业务部门清洗数据？

00003. 是否需要重新做域名解析？

这个时候数据库又出现了瓶颈

数据垂直拆分

数据库专库专用，如图Products、Users、Deal库。

解决写数据时，并发，量大的问题。

思考的点

00001. 跨业务的事务？如何解决？使用分布式事务、去掉事务或不追求强事务

00002. 应用的配置项多了

00003. 如何跨库进行数据的join操作

这个时候，某个业务的数据表的数据量或者更新量达到了单个数据库的瓶颈

数据水平拆分

如图，我们把User拆成了User1和User2，将同一个表的数据拆分到两个数据库中，解决了单数据库的瓶颈。

思考的点

00001. 水平拆分的策略都有哪些？各有什么优缺点？

00002. 水平拆分的时候如何清洗数据？

00003. SQL 的路由问题，需要知道某个 User 在哪个数据库上。

00004. 主键的策略会有不同。

00005. 假设我们系统中需要查询2017年4月份已经下单过的用户名的明细，而这些用户分布在user1和user2上，我们后台运营系统在展示时如何分页？

这个时候，公司对外部做了流量导入，我们应用中的搜索量飙升，继续演进

拆分搜索引擎

使用搜索引擎，解决数据查询问题。部分场景可使用 NoSQL 提高性能，开发数据统一访问模块，解决上层应用开发的数据源问题。如图data access module 可以访问数据库，搜索引擎，NoSQL

最后总结

这个只是一个举例演示，各个服务的技术架构是需要根据自己业务特点进行优化和演进的，所以大家的过程也不完全相同。

最后的这个也不是完美的，例如负载均衡还是一个单点，也需要集群，我们的这个架构呢也只是冰山一角，沧海一粟。在架构演进的过程中，还要考虑系统的安全性、数据分析、监控、反作弊等等......，同时继续发展呢，SOA架构、服务化、消息队列、任务调度、多机房等等… ...

从刚才对架构演进的讲解，也可以看出来，所有大型项目的架构和代码，都是这么一步一步的根据实际的业务场景，和发展情况发展演变而来的，在不同的阶段，会使用的不同的技术，不同的架构来解决实际的问题，所以说，高大上的项目技术架构和开发设计实现不是一蹴而就的。

正是所谓的万丈高楼平地起。在架构演进的过程中，小到核心模块代码，大到核心架构，都会不断演进的，这个过程值得我们去深入学习和思考。