memcache的缓存原理和应用

缓存原理

Memcache采用键值对存储方式。它本质是一个大的 hash表,key的最大长度为255个字符,最长过期时间为30天。它的内存模型如下:Memcache预先将可支配的内存空间进行分区(Slab),每个分区里再分为多个块(Chunk)最大1M,但同一个分区中块的大 小是固定的。然后,插入数据时,会根据数据大小寻找最合适的块,然后插入,当然这样也就会有部分内存浪费,但可一定程度上减少内存碎片,总体上,利大于 弊。当Memcache的内存满后,它清除旧数据的原则为:LRU闲置>过期>最少访问。而且它采用的是惰性删除,它并没有提供监控数据过期 的机制,而是惰性的,当查询到某个key的数据时,如果过期,那么直接抛弃。

应用场景

1、分布式应用。

        由于memcached本身基于分布式的系统,所以尤其适合大型的分布式系统。

2、数据库前段缓存。

        数据库常常是网站系统的瓶颈。数据库的大并发量访问,常常造成网站内存溢出。当然我们也可以使用Hibernate的缓存机制。但memcached是基于分布式的,并可独立于网站应用本身,所以更适合大型网站进行应用的拆分。

3、服务器间数据共享。

4、 举例来讲,我们将网站的登录系统、查询系统拆分为两个应用,放在不同的服务器上,并进行集群,那这个时候用户登录后,登录信息如何从登录系统服务器同步到查询系统服务器呢?这时候,我们便可以使用memcached,登录系统将登录信息缓存起来,查询系统便可以获得登录信息,就像获取本地信息一样。

不适合应用的场景:

1、缓存的数据量比较小。

2、缓存的数据需要持久化。

分布式集群

首先,集群的概念在我理解来就是多个类似于软件之间有了关联的关系,就可以称之为集群,例如,我们常用的LAMP环境,单个的linux、apach、mysql或者php都不能称之为一个集群,但是,它们关联起来以后,就可以称之为一个集群了。那么,memcache分布式集群是个什么情况那?我们都知道,memcache是一个基于分布式的系统,那么,就意味着memcache可以同时部署到多台服务器上,这时候,如果我们可以把这多台memcache服务器关联起来的话,那么这些服务器就是一个memcache集群了。关联方法如下:
$mem=new Memcache;
$mem->addsever($ip,$host);
$mem->addsever($ip,$host);
$mem->addsever($ip,$host);
这三台memcache服务器的ip和端口号都是不同的,这时候,因为它们之间已经有了关联,同时它们部署在不同的服务器上,所以可以称之为memcache分布式集合。如果数据量巨大,我们可以用取余和一致性哈希算法来将数据部署到memcache服务器上去。

 

一致性哈希算法的原理:
首先求出memcache服务器(节点)的哈希值,并将其配置到0~232的圆(continuum)上。 然后用同样的方法求出存储数据的键的哈希值,并映射到圆上。 然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过232仍然找不到服务器,就会保存到第一台memcache服务器上。

取余算法的原理:
假如有1000万条数据要分布到3台memcache服务器上,那么就需要用1000万条数据的id去磨3,根据所得的余数决定将数据分布在那个服务器上去。

原文地址:https://www.cnblogs.com/jiaoaozuoziji/p/7339669.html