Session共享问题---理论

  随着网站访问量增加,初期的一台服务器已经完全不能支持业务,这个时候我们就需要增加服务器设备,来抗住请求的增量,如下所示:


  负载均衡的目的本来就是要为了平均分配请求,所以没有固定第一次访问和第二次访问的是同一台服务器,实际上无法确定的。第一标访问可能是a服务器,第二秒访问的可能是c服务器。这样的话,生成的session文件不可能恰巧都在同一台服务器上,所以,当同一个登录会员,访问第一台服务器生成了一个session数据。第二秒负载请求到第三台服务器,结果获取不到刚才生成的session数据。
  ==只有涉及到多台后端服务器(php,java等处理服务器)的时候,才涉及到session读取不到的问题==

一、session共享方案
1、session复制
使用一些文件同步工具(linux下的rsync),当a服务器中的session数据有更改的时候,就会把这些更改也同步到b,c服务器上去。通过复制的方式,最终a,b,c各个服务器上都拷贝了一份session数据。

坏处:

  • ·速度慢。复制数据会出现延迟。比如第一秒访问是a服务器,修改了session数据,负载均衡,可能下一秒访问的是b服务器,session数据如果没有被复制到b服务器,则是读取不到session数据的,出现时间上的延迟。这种复制数据要消耗很多的网络带宽。在实际中业界用的比较少。机器的数量越多,复制数据的性能消耗越大。不具备高扩展性。
  • ·复制session的方式,无论是网络带宽成本还是硬件开销上都很大。

2、session存储客户端
把原来存储在服务器磁盘上的session数据存储到客户端的cookie中,一般是把session数据按照自己定义的加密规则,加密后保存在cookie中。
好处:
服务器的压力减小了,因为session数据不存在服务器磁盘上。根本就不会出现session读取不到的问题。
坏处:
1)网络请求占用很多。每次请求时,客户端都要通过cookie发送session数据给服务器
2)浏览器对cookie的大小存在限制。每个浏览器限制是不同的。

  • ·Firefox和Safari允许cookie多达4097个字节
  • ·Opera允许cookie多达4096个字节
  • ·IE允许cookie多达4095个字节

3)一般session中存的都是重要性数据(账号、昵称、用户id等),会存在安全问题

3、访问规则
  设计用一种算法(简单理解为规则),什么几只虾session是保存在哪台服务器下,那么读取的时候就按照这种规则去读取,就能定位到原来的服务器。其原理是存session和读session数据保证都在一台服务器操作,就不会需要涉及到共享,具体实现方式是通过约定一种分发机制来实现。也叫作sticky模式(粘性回话模式),同一个用户的访问请求都被派送到同一个服务器上。
坏处:
  如果这台机子挂掉,那么后续的请求按照session的规则还是会分发到这台服务器上去,但是现在不可用了,比如用户编号是1-200涉及到的session数据保存到a服务器上去。所以只要一台出问题,1-200的用户就无法实现登录了。后面就不可用了

4、session中间层
做一个中间层服务器,专门来存储所有访问涉及到的session。也就是所有的session都存储在这里。服务器端统一从这里读取session数据。

1)NFS做中间层
通过nfs的方式,各个php服务器操作session数据的时候,是读取本地磁盘目录,但实际上是一个共享网络文件。各个php服务器实际上操作的都是同一个目录的文件。

2)关系型数据库做中间层
把以前存储在文件中的session数据存储到数据库中去,那么这样做,其实就不用到php内置的session机制了(像session_start()之类的函数都不需要去用了)。
从数据库拿session数据,约定什么情况下数据过期了然后自动清理,这里是指删除数据库中的行。保存在文件中的时候,php有垃圾回收机制回去自动清理过期的session文件。
有些做法跟这种思想是类似的:比如ecshop、phpcms是把session数据都存储在数据库中去。服务端就是从数据库中拿session的数据。
坏处:

  • ·放在数据库里面,访问量小没问题。大流量网站这么做,只会拖慢速度。因为查询数据库,造成数据库压力大。高并发访问的情况下,会出现很大的性能问题。
  • ·在线人数决定了其瓶颈,主要问题是影响性能。在线人数,因为登录的session数据存储在数据库中,只要是登录的用户就会涉及到频繁的操作数据库。

3)非关系型数据库做中间层
将session数据保存在memcached,redis之类内存数据库中,因为内存的数据读取速度是很快的,与磁盘读取的速度不是一个数量级的,所以性能很高,用户并发量很大的时候尤其合适。而且方便统计在线人数,内存数据库系统能够控制内存中的过期数据自动失效(刚好符合session过期需要)

原文地址:https://www.cnblogs.com/lxhyty/p/11321709.html