4.2 互联网项目架构演进

1. 开发环境&生产环境

1.1 开发环境

平时在写代码时,大多都是在Win10/Win7/Mac上,这些系统都可以称呼为开发系统,咱们会为了更高效的开发应用程序,安装很多很多的软件,会导致操作系统不安全(安多了软件),稳定性降低。

1.2 生产环境

  • 在生产环境中,操作系统不会采用Win10/Mac等,这种操作系统相对不安全,生产环境是要面向全体用户的,一般会采用专业的操作系统。
  • 大多失眠上使用的都是基于Linux的操作系统,当然还有Windows版本的服务器操作系统,Windows 2003 service等等。
  • 由于Linux内核版本完全对外开源,市场占有率大,所以第一步我们要学会如何操作Linux操作系统。

2. Web1.0&Web2.0阶段

2.1 Web1.0阶段

在web1.0阶段,由于带宽不足,这时的项目大多是内容少,用户量也不多,甚至有一些项目不需要对外开放,对安全性和稳定性的要求是不高的。

此时的单体框架就足以应对。

 2.2 Web2.0阶段

随之而来的web2.0阶段,实现了ADSL拨号上网,宽带提速,最高可以达到8M,用户量也就不断增加,一些用户网站也开始活跃,项目就需要考虑安全性和稳定性。

在基于上面的单体架构图中,无法满足Web2.0对项目的需求。

在单体架构的基础上去搭建集群。

在搭建集群之后,可以提升项目的稳定性(一个服务器挂了,还有其它的),并且并发能力增强(服务器多,自然强),还可以避免单点故障(什么是单点故障??)。

 2.3 搭建集群后发生的问题

  • 用户的请求到底要发送到哪台服务器上。如何保证请求平均的分发给不同的服务器,从而缓解用户量增加的压力。
  • 编写项目时,如果用户登录成功了,将用户的标识放到Session中,在搭建集群之后,数据共享问题(Session是基于Tomcat服务器的,如何保证在服务器1上登录成功,2和3都是知道的)。
  • 当数据量特别庞大时,如果还直接去数据库查询,速度很慢,如何提升查询效率(当然可以通过SQL优化,但是SQL优化是有限的)。
  • 针对大家在搜索一些数据时,如果用where content like '%#{xxx}%',用这种通配符去数据库查,用户量多,直接GG。
  • 等等..........

为了解决上述的问题,需要使用到三门技术。

  • Nginx-解决用户请求平均分发。
  • Redis-解决数据共享并实现缓存功能。
  • ElasticSearch-解决搜索数据的功能。

 3. 垂直结构

比如项目包含了三个模块,用户模块、商品模块、订单模块。如果商品模块压力过大(浏览的肯定比下单的多),一般最直接有效的方式就是搭建集群。在单体架构的集群上去搭建,效果相对比较差。

随着项目的不断更新,项目中的功能越来越多,最严重可能会导致项目无法启动(项目无法启动,项目启动肯定要占用jvm内存,如果项目过大,则jvm内存不够用)。

关于单体架构中,完美的体现了低内聚,高耦合,避开了开发的准则(我们需要高内聚,低耦合)。

为了解决上述的各种问题,演进出了垂直架构。

4. 分布式结构

随着项目的不断迭代,新老功能之间需要交互,服务器和服务器之间是需要通讯的(上面并没有提供相应的功能,我们可能需要HttpClient或者是RestTmplate等,这样的话,通信成本是比较高的)。

对于上面垂直架构,由于商品模块访问量大,因此针对商品模块进行了集群的搭建。但项目一般分为三层的,Controller,Service,Dao。导致程序变慢的重灾区,一般是Service和Dao(需要通过IO读取数据库),在搭建进群时,确实针对三层都搭建进群,效果不是很好。

架构从垂直架构演变到了分布式架构(所有模块之间都可以相互通信,只是为了图不复杂,没有完全画出)。

分布式架构落地的技术,国内通讯的方式有两种

  • Dubbo RPC(通讯方式)阿里系
  • SpringCloud HTTP(通讯方式)

5. 分布式架构常见问题

5.1 服务之间的异步通讯

这里的服务之间就是模块之间

使用分布式架构之后,服务之间的通信都是同步的(比如商品模块Controller需要访问用户模块Service+Dao和订单模块Service+Dao之后才能完成功能,假设每个模块需要1秒,那则是三秒。这是非常要命的,但是对于核心业务那是必须等待的。但假如是非核心业务呢?即如果访问商品模块Controller后需要打印日志,这个只要发送打印需求就好,你什么时候打印我不太操心,这样如果是同步通信就不是很完美了(使用分布式架构之后,服务之间的通信都是同步的))。

在一些不是核心业务的功能上,咱们希望可以实现异步通讯。

为了实现服务之间的异步通讯,需要学习MQ,而MQ有很多,我们要学的是RabbitMQ(即订单模块Controller操作后需要与日志模块的Service和Dao通讯,但是这里用同步不合适,因此用异步通讯MQ,这里采用RabbitMQ技术,订单模块Controller先发送信息给MQ,然后就不管了,而MQ是一个消息队列,它在合适的时候访问日志模块的Service和Dao)。

5.2 服务之间通讯地址的维护

由于服务越来越多(以前一个独立的服务拆分成好多单独的服务,并且喝多服务还要搭建集群),每个服务的访问地址都是不一样的:协议://ip地址:端口号/路径

由于模块繁多,并且模块搭建的集群数量增加,会导致其它模块需要维护各种ip地址等信息,导致项目维护性极低,耦合性变高,并且实现负责均衡也变得麻烦。

需要使用以下技术来解决当前问题:

  • Eureka注册中心帮助我们管理服务信息(所有的通讯地址都在Eureka中维护,比如用户模块Controller像访问商品模块Service+Dao,不需要知道其地址,只需要向Eureka去拿地址即可。注意:这里不是通过Eureka访问,而是去拿地址,依然是用户模块Controller访问商品模块Service+Dao)。
  • Robbin可以帮我们实现服务之间的负载均衡(此时去Eureka去拿地址访问但还是商品模块中第一个模块,那商品模块的集群就没有效果,这时候就要实现负责均衡)。

Nginx是服务器端负载均衡:

negix是客户端所有请求统一交给negix,由negix进行实现负载均衡请求转发,属于服务端负载均衡。

即请求由negix服务器端进行转发,是客户端到服务器端之间的负载均衡。

Rabbion是客户端负载均衡(我怎么感觉这样写是不对的)

Ribbon 是从 eureka 注册中心服务器端上获取服务注册信息列表,缓存到本地,然后在本地实现轮询负载均衡策略。

这是模块之间,即服务之间的负载均衡。

Rabbion是在客户端实现复杂均衡,Rabbion是在本地,即在访问的那块,即如果是商品模块Controller访问订单模块Service+Dao,则Rabbion是放在客户端(商品模块Controller)中的。

5.3 服务降级

在上述的架构中,如果说订单模块出现了问题,只要是设计到订单的功能,全部都无法使用(所有访问订单模块Service+Dao的模块在等待一段时间后,超时时间已过,就抛出异常),甚至可能会导致服务器提供的线程池耗尽。给用户友好的提示都是无法做到的(不懂)

为了解决上述的问题,使用Hystrix处理:

Hystrix提供了线程池隔离的方式,避免服务器线程池耗尽,在一个服务无法使用时,还提供断路器的方式来处理问题服务,从而执行降级方法,返回托底数据(其实就是通过服务降级的方式给你一个友好的提示,当然服务器还是挂了不能给你提供订单服务)。

Hystiix和Rabbion都是在服务内部提供的,Rabbion是为了省事,没有画那么多。

Ps:Eureka,Robbin,Hystrix都是SpringCloud技术栈中的组件。

5.4 海量数据

海量数据会导致数据库无法存储全部的内容,即便数据库可以存储海量的数据,在查询数据时,数据库的响应是极其缓慢的,在用户高并发的情况下,数据库也是无法承受的。

为了解决上述的问题,可以基于MyCat实现数据库的分库分表(一个数据库不够,就多个)。

通过MyCat,在去访问数据库。

6. 微服务架构

6.1 微服务架构

虽然已经将每个模块独立的做开发,比如商品模块,压力最大的是商品的查询(而商品的增加、修改和删除可能访问量不大)。所有可以针对商品的查询做一个单独的项目。

在单独模块中再次拆分项目的方式就可以称之为微服务架构,微服务架构也是分布式架构,只是它可以将一个模块再拆,拆的更细,比如上面的,一个模块只做商品的查询。

注:下图中的商品模块Service+Dao和查询商品Service+Dao都属于商品模块,后者里面只是查询商品,前者里面放的是商品模块中除查询商品外的其它内容。

其实下图和上面的分布式架构变化不大,但是我们还要说一些其它内容。

6.2 模块过多,运维成本增加

我们发现上面的分布式架构、微服务架构模块非常多,这么多的内容部署到生产环境中,运维成本非常高。为了解决模块过多,运维程本增加的问题,需要采用一个技术去管理或者说是部署这些模块或者中间件,采用Docker容器化技术来帮助我们管理各个模块的部署,还可以通过CI、CD持续集成,持续交付,持续部署。

而且后期在学习的时候,也需要大量的软件(需要去linux中安装许多软件,时间长,安装可能失败等),可以使用Docker来帮助我们快速的安装软件。

6.3 分布式架构下的其它问题

分布式架构帮助我们解决了很多的问题,但是随之带来了很多问题。

  1. 分布式事务:最传统的操作事务的方式,是通过Connection链接对象的方式操作,Spring也提供了声明式事务的操作(本质也是Connection链接对象)。但是这样会有问题,比如商品Service+Dao模块访问数据库,但是要完成这个操作,需要调用下订单模块的Service+Dao,而这个模块也需要调用数据库,这时候我们希望这两个访问数据库的操作要么都成功,要么都失败。但是呢?这两个是不同的模块的,Connection对象肯定是不一样的;再比如商品Service+Dao模块访问数据库,总共访问了两次数据库,依次是访问上面的数据库一次是访问下面的,那也会出现这样的Connection链接对象不同,造成事务出现问题。为了解决事务的问题,后期会使用到RavvitMQ(前面说过)或者LCN等方式来解决。
  2. 分布式锁:锁在这种分布式架构中也是失效的,传统的锁方式,synchronized(基于对象)或者Lock锁(基于对象或者unsafe类下的puk方法)。无论是哪种锁,在分布式架构中,传统的锁是没有效果的。因此造成锁失效,为了解决锁失效问题,后续会使用到Redis或者Zookeeper来解决锁失效问题。
  3. 分布式任务:什么是分布式任务,这里就要说到传统定任务,在之前,咱们学另一个框架,叫corse,在一定的时间周期内,去执行某件事情,比如备份数据库这种操作。在传统的定时任务下,由于分布式环境的问题,可能会造成任务重复执行,一个比较大定任务,需要可以拆分。传统的用corse方式就比较麻烦,为了解决这个问题,后续会使用到Redis+Quartz或者是Elastic-Job。
原文地址:https://www.cnblogs.com/G-JT/p/13944011.html