周末学习笔记——B/S和C/S的介绍

B/S架构基本概念

B/SBrowser/Server,即浏览器/服务器架构。Browser指的是Web浏览器,极少数事务逻辑在前端实现,但主要事务逻辑在服务器端实现

B/S三层体系结构可以定义为:

客户机上的表示层

中间的web服务器层

后端的数据库服务器层

B/S三层体系结构模式下,客户端不再需要安装特定的客户端应用程序,取而代之的是通用浏览器软件,所有的用户业务逻辑都被部署在新的中间层上。

由于三层体系结构通常是基于web的,所以中间层应用程序通常工作在web服务器上,被视为web服务器的一种功能扩展,因此中间层又称为web服务层。在web服务器上,通过大量的包含CGI/Servlet是服务端脚本程序页面,接受来自客户端浏览器的请求,以及完成对数据库的操作。

B/S架构中,显示逻辑交给了Web浏览器,事务处理逻辑在放在了WebApp上,这样就避免了庞大的胖客户端,减少了客户端的压力。因为客户端包含的逻辑很少,因此也被成为瘦客户端。

服务端编程是指在web服务器上编写程序并使之正常运行。在B/S模式下,当用户下载一个网页时,如果网页中包含服务端脚本程序,web服务器将首次执行网页中的脚本程序,然后把执行的结果网页发送到客户端浏览器显示。

B/S架构优缺点

优点:

(1) 客户端无需安装,有Web浏览器即可;

(2) BS架构可以直接放在广域网上,通过一定的权限控制实现多客户访问的目的,交互性较强;

(3) BS架构无需升级多个客户端,升级服务器即可。

缺点:

(1) 在跨浏览器上,BS架构不尽如人意;

(2) 表现要达到CS程序的程度需要花费不少精力;

(3) 在速度和安全性上需要花费巨大的设计成本,这是BS架构的最大问题;

(4) BrowserServer交互是请求-响应模式,通常需要刷新页面,这并不是客户乐意看到的,在AJAX流行后此问题得到了一定程度的缓解。

C/S架构基本概念

C/SClient/Server,即客户端/服务器端架构,一种典型的两层架构。客户端包含一个或多个在用户的电脑上运行的程序。服务器端有两种,一种是数据库服务器端,客户端通过数据库连接访问服务器端的数据;另一种是Socket服务器端,服务器端的程序通过Socket与客户端的程序通信。

因为客户端需要实现绝大多数的业务逻辑和界面展示。作为客户端的部分需要承受很大的压力,因为显示逻辑和事务处理都包含在其中,通过与数据库的交互(通常是SQL或存储过程的实现)来达到持久化数据,以此满足实际项目的需要。

C/S架构优缺点

优点:

(1) 界面和操作可以很丰富;

(2) 安全性能可以很容易保证,实现多层认证也不难;

(3) 由于只有一层交互,因此响应速度较快。

缺点:

(1) 适用面窄,通常用于局域网中;

(2) 用户群固定,由于程序需要安装才可使用,因此不适合面向一些不可知的用户;

(3) 维护成本高,发生一次升级,则所有客户端的程序都需要改变。

个大型服务系统都是从小一步一步走过来的,在每个阶段,找到对应该阶段网站架构所面临的问题,然后在不断解决这些问题,在这个过程中整个架构会一直演进。
那我们来一起看一下。

 单服务器-俗称all in one

从一个小网站说起。一台服务器也就足够了。文件服务器,数据库,还有应用都部署在一台机器,俗称ALL IN ONE

随着我们用户越来越多,访问越来越大,硬盘,CPU,内存等都开始吃紧。一台服务器已经满足不了。这个时候看一下下一步演进

数据服务与应用服务分离

 

我们将数据服务和应用服务分离,给应用服务器配置更好的 CPU,内存。而给数据服务器配置更好更大的硬盘。

分离之后提高一定的可用性,例如Files Server挂了,我们还是可以操作应用和数据库等。
随着访问qps越来越高,降低接口访问时间,提高服务性能和并发,成为了我们下一个目标,发现有很多业务数据不需要每次都从数据库获取。

使用缓存,包括本地缓存,远程缓存,远程分布式缓存

 

因为 80% 的业务访问都集中在 20% 的数据上,也就是我们经常说的28法则。如果我们能将这部分数据缓存下来,性能一下子就上来了。而缓存又分为两种:本地缓存和远程缓存缓存,以及远程分布式缓存,我们这里面的远程缓存图上画的是分布式的缓存集群(Cluster)。

思考的点

00001. 具有哪种业务特点数据使用缓存?

00002. 具有哪种业务特点的数据使用本地缓存?

00003. 具有哪种务特点的数据使用远程缓存?

00004. 分布式缓存在扩容时候会碰到什么问题?如何解决?分布式缓存的算法都有哪几种?各有什么优缺点?

这个时候随着访问qps的提高,服务器的处理能力会成为瓶颈。虽然是可以通过购买更强大的硬件,但总会有上限,而且这个到后期成本就是指数级增长了,这时,我们就需要服务器的集群。需要使我们的服务器可以横向扩展,这时,就必须加个新东西:负载均衡调度服务器。

使用负载均衡,进行服务器集群

增加了负载均衡,服务器集群之后,我们可以横向扩展服务器,解决了服务器处理能力的瓶颈。

思考的点

00001. 负载均衡的调度策略都有哪些?

00002. 各有什么优缺点?

00003. 各适合什么场景?

打个比方,我们有轮询,权重,地址散列,地址散列又分为原ip地址散列hash,目标ip地址散列hash,最少连接,加权最少连接,还有继续升级的很多种策略......我们一起来分析一下

典型负载均衡策略分析

00001. 轮询:优点:实现简单,缺点:不考虑每台服务器处理能力

00002. 权重:优点:考虑了服务器处理能力的不同

00003. 地址散列:优点:能实现同一个用户访问同一个服务器

00004. 最少连接:优点:使集群中各个服务器负载更加均匀

00005. 加权最少连接:在最少连接的基础上,为每台服务器加上权值。算法为(活动连接数*256+非活动连接数)/权重,计算出来的值小的服务器优先被选择。

继续引出问题的场景:

我们的登录的时候登录了A服务器,session信息存储到A服务器上了,假设我们使用的负载均衡策略是ip hash,那么登录信息还可以从A服务器上访问,但是这个有可能造成某些服务器压力过大,某些服务器又没有什么压力,这个时候压力过大的机器(包括网卡带宽)有可能成为瓶颈,并且请求不够分散。

这时候我们使用轮询或者最小连接负载均衡策略,就导致了,第一次访问A服务器,第二次可能访问到B服务器,这个时候存储在A服务器上的session信息在B服务器上读取不到。

Session管理-Session Sticky粘滞会话:

  

打个比方就是如果我们每次吃饭都要保证我们用的是自己的碗筷,而只要我们在一家饭店里存着我们的碗筷,只要我们每次去这家饭店吃饭就好了。

对于同一个连接中的数据包,负载均衡会将其转发至后端固定的服务器进行处理。

解决了我们session共享的问题,但是它有什么缺点呢?

00001. 一台服务器运行的服务挂掉,或者重启,上面的 session 都没了

00002. 负载均衡器成了有状态的机器,为以后实现容灾造成了羁绊

Session管理-Session 复制

 

就像我们在所有的饭店里都存一份自己的碗筷。我们随意去哪一家饭店吃饭都OK,不适合做大规模集群,适合机器不多的情况。

解决了我们session共享的问题,但是它有什么缺点呢?

00001. 应用服务器间带宽问题,因为需要不断同步session数据

00002. 大量用户在线时,服务器占用内存过多

Session管理-基于Cookie

 

打个比方,就是我们每次去饭店吃饭,都自己带着自己的碗筷。

解决了我们session共享的问题,但是它有什么缺点呢?

00001. cookie 的长度限制

00002. cookie存于浏览器,安全性是一个问题

Session管理-Session 服务器

 

打个比方,就是我们的碗筷都存在了一个庞大的橱柜里,我们去任何一家饭店吃饭,都可以从橱柜中拿到属于我们自己的碗筷。

解决了我们session共享的问题,这种方案需要思考哪些问题呢?

00001. 保证 session 服务器的可用性,session服务器单点如何解决?

00002. 我们在写应用时需要做调整存储session的业务逻辑

打个比方,我们为了提高session server的可用性,可以继续给session server做集群

中间总结

所以说,网站架构在遇到某些指标瓶颈时,演进的过程中,都有哪些解决方案,他们都有什么优缺点?业务功能上如何取舍?如何做出选择?这个过程才是最重要的。

在解决了横向扩展应用服务器之后,那我们继续~~

继续回到目前架构图

 

数据库的读及写操作都还需要经过数据库。当用户量达到一定量,数据库将会成为瓶颈。那我们如何来解决呢?

数据库读写分离

  

使用数据库提供的热备功能,将所有的读操作引入slave 服务器,因为数据库的读写分离了,所以,我们的应用程序也得做相应的变化。我们实现一个数据访问模块(图中的data access module)使上层写代码的人不知道读写分离的存在。这样多数据源读写分离就对业务代码没有了侵入。这里就引出了代码层次的演变

思考的点

00001. 如何支持多数据源?

00002. 如何封装对业务没有侵入?

00003. 如何使用目前业务的ORM框架完成主从读写分离?是否需要更换ORM模型?ORM模型之间各有什么优缺点?

00004. 如何取舍?

数据库读写分离会遇到如下问题:

00001. master和slave复制的时候,考虑延时问题、数据库的支持、复制条件的支持。

00002. 当为了提高可用性,将数据库分机房后,跨机房传输同步数据,这个更是问题。

00003. 应用对于数据源的路由问题

使用反向代理和 CDN 加速网站响应

 

使用 CDN 可以很好的解决不同的地区的访问速度问题,反向代理则在服务器机房中缓存用户资源。

访问量越来越大,我们文件服务器也出现了瓶颈。

分布式文件系统

 

思考的点

00001. 分布式文件系统如何不影响已部署在线上的业务访问?不能让某个图片突然访问不到呀

00002. 是否需要业务部门清洗数据?

00003. 是否需要重新做域名解析?

这个时候数据库又出现了瓶颈

数据垂直拆分

 

数据库专库专用,如图Products、Users、Deal库。

解决写数据时,并发,量大的问题。

思考的点

00001. 跨业务的事务?如何解决?使用分布式事务、去掉事务或不追求强事务

00002. 应用的配置项多了

00003. 如何跨库进行数据的join操作

这个时候,某个业务的数据表的数据量或者更新量达到了单个数据库的瓶颈

数据水平拆分

 

如图,我们把User拆成了User1和User2,将同一个表的数据拆分到两个数据库中,解决了单数据库的瓶颈。

思考的点

00001. 水平拆分的策略都有哪些?各有什么优缺点?

00002. 水平拆分的时候如何清洗数据?

00003. SQL 的路由问题,需要知道某个 User 在哪个数据库上。

00004. 主键的策略会有不同。

00005. 假设我们系统中需要查询2017年4月份已经下单过的用户名的明细,而这些用户分布在user1和user2上,我们后台运营系统在展示时如何分页?

这个时候,公司对外部做了流量导入,我们应用中的搜索量飙升,继续演进

拆分搜索引擎

使用搜索引擎,解决数据查询问题。部分场景可使用 NoSQL 提高性能,开发数据统一访问模块,解决上层应用开发的数据源问题。如图data access module 可以访问数据库,搜索引擎,NoSQL

最后总结

这个只是一个举例演示,各个服务的技术架构是需要根据自己业务特点进行优化和演进的,所以大家的过程也不完全相同。

最后的这个也不是完美的,例如负载均衡还是一个单点,也需要集群,我们的这个架构呢也只是冰山一角,沧海一粟。在架构演进的过程中,还要考虑系统的安全性、数据分析、监控、反作弊等等......,同时继续发展呢,SOA架构、服务化、消息队列、任务调度、多机房等等… ...

从刚才对架构演进的讲解,也可以看出来,所有大型项目的架构和代码,都是这么一步一步的根据实际的业务场景,和发展情况发展演变而来的,在不同的阶段,会使用的不同的技术,不同的架构来解决实际的问题,所以说,高大上的项目技术架构和开发设计实现不是一蹴而就的。

正是所谓的万丈高楼平地起。在架构演进的过程中,小到核心模块代码,大到核心架构,都会不断演进的,这个过程值得我们去深入学习和思考。

原文地址:https://www.cnblogs.com/1322957664qqcom/p/10610233.html