Memcache

Memcache

 1、介绍

  MemCache是一个自由、源码开放、高性能、分布式的分布式内存对象缓存系统,用于动态Web应用以减轻数据库的负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高了网站访问的速度。 MemCaChe是一个存储键值对的HashMap,在内存中对任意的数据(比如字符串、对象等)所使用的key-value存储,数据可以来自数据库调用、API调用,或者页面渲染的结果。

  本质上,它是一个简洁的key-value存储系统。

  一般的使用目的是,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度、提高可扩展性。

  MemCache的工作流程如下:先检查客户端的请求数据是否在memcached中,如有,直接把请求数据返回,不再对数据库进行任何操作;如果请求的数据不在memcached中,就去查数据库,把从数据库中获取的数据返回给客户端,同时把数据缓存一份到memcached中(memcached客户端不负责,需要程序明确实现);每次更新数据库的同时更新memcached中的数据,保证一致性;当分配给memcached内存空间用完之后,会使用LRU(Least Recently Used,最近最少使用)策略加上到期失效策略,失效数据首先被替换,然后再替换掉最近未使用的数据。[2] 

2、Memcached安装和基本使用

1、Memcached安装

wget http://memcached.org/latest
tar -zxvf memcached-1.x.x.tar.gz
cd memcached-1.x.x
./configure && make && sudo make install
 
PS:依赖libevent
       yum install libevent-devel
       apt-get install libevent-dev

2、启动Memcached

memcached -d -m 10    -u root -l 192.168.49.130 -p 12000 -c 256 -P /tmp/memcached.pid
 
参数说明:
    -d 是启动一个守护进程
    -m 是分配给Memcache使用的内存数量,单位是MB
    -u 是运行Memcache的用户
    -l 是监听的服务器IP地址
    -p 是设置Memcache监听的端口,最好是1024以上的端口
    -c 选项是最大运行的并发连接数,默认是1024,按照你服务器的负载量来设定
    -P 是设置保存Memcache的pid文件

3、Memcached命令

存储命令: set/add/replace/append/prepend/cas
获取命令: get/gets
其他命令: delete/stats..

4、检查服务:

1、查看启动的memcache服务:

netstat -lp | grep memcached

2、查看memcache的进程号(根据进程号,可以结束memcache服务:“kill -9 进程号”)

ps -ef | grep memcached 

3、Python操作Memcached

安装API

python操作Memcached使用Python-memcached模块
下载安装:https://pypi.python.org/pypi/python-memcached

操作

import memcache

mc=memcache.Client(['192.168.49.130:12000'],debug=True) #连接
#debug = True 表示运行出现错误时,显示错误信息,上线后移除该参数
mc.set('foo','bar')  #通过键值对将数据放入缓存
# 设置失效时间
# mc.set('foo','bar',10) #10秒后失效
ret=mc.get('foo')      #通过键取值
print(ret)

可能出现的错误

MemCached: MemCache: inet:192.168.49.130:12000: connect: timed out.  Marking dead.

如果memcached服务启动正常,那就是Linux防火墙的原因,需要在iptables里开放12000端口的访问权限,

#查看状态:
iptables -L -n
#下面添加对特定端口开放的方法:
#使用iptables开放如下端口
/sbin/iptables -I INPUT -p tcp --dport 8000 -j ACCEPT
#保存
/etc/rc.d/init.d/iptables save
#重启服务
service iptables restart
#查看需要打开的端口是否生效?
service iptables status
解决方法

2、天生支持集群

分布式缓存集群设计思想:

  1、每一台Memcached服务器的内容都是不一样的,这些Memcached服务器缓存的内容加起来接近整个数据库的数据容量。

  2、通过在客户端程序或者Memcached的负载均衡器上用hash算法,让同一数据内容都分配到Memcached服务器。

  3、普通的hash算法对于节点宕机会带来大量的缓存数据流动(失效),可能会引起学崩效应。

  4、一致性哈希算法(还可以带虚拟节点)可以让缓存节点宕机对节点的数据流动(失效)降到最低。

python-memcached模块原生支持集群操作,其原理是在内存维护一个主机列表,且集群中主机的权重值和主机在列表中重复出现的次数成正比

  # 主机    权重
    1.1.1.1   1
    1.1.1.2   2
    1.1.1.3   1
 
#那么在内存中主机列表为:
    host_list = ["1.1.1.1", "1.1.1.2", "1.1.1.2", "1.1.1.3", ]

如果用户根据如果要在内存中创建一个键值对(如:k1 = "v1"),那么要执行一下步骤:

  • 根据算法将 k1 转换成一个数字
  • 将数字和主机列表长度求余数,得到一个值 N( 0 <= N < 列表长度 )
  • 在主机列表中根据 第2步得到的值为索引获取主机,例如:host_list[N]
  • 连接 将第3步中获取的主机,将 k1 = "v1" 放置在该服务器的内存中

代码实现如下:

mc = memcache.Client([('1.1.1.1:12000', 1), ('1.1.1.2:12000', 2), ('1.1.1.3:12000', 1)], debug=True)
 
mc.set('k1', 'v1')

3、add

添加一条键值对,如果已经存在的 key,重复执行add操作异常

import memcache
 
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
mc.add('k1', 'v1')
# mc.add('k1', 'v2') # 报错,对已经存在的key重复添加,失败!!!

4、replace
replace 修改某个key的值,如果key不存在,则异常

import memcache
 
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
# 如果memcache中存在kkkk,则替换成功,否则异常
mc.replace('kkkk','999')

5、set 和 set_multi

#set            设置一个键值对,如果key不存在,则创建,如果key存在,则修改
#set_multi   设置多个键值对,如果key不存在,则创建,如果key存在,则修改

import memcache
 
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
mc.set('key0', 'sb')
mc.set_multi({'key1': 'val1', 'key2': 'val2'})

6、delete 和 delete_multi

#delete             在Memcached中删除指定的一个键值对
#delete_multi    在Memcached中删除指定的多个键值对

import memcache
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
 
mc.delete('key0')
mc.delete_multi(['key1', 'key2'])

7、get 和 get_multi

#get            获取一个键值对
#get_multi   获取多一个键值对
import memcache
 
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
 
val = mc.get('key0')
item_dict = mc.get_multi(["key1", "key2", "key3"])

8、append 和 prepend

#append    修改指定key的值,在该值 后面 追加内容
#prepend   修改指定key的值,在该值 前面 插入内容
import memcache
 
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
# k1 = "v1"
 
mc.append('k1', 'after')
# k1 = "v1after"
 
mc.prepend('k1', 'before')
# k1 = "beforev1after"

9、decr 和 incr  

#incr  自增,将Memcached中的某一个值增加 N ( N默认为1 )
#decr 自减,将Memcached中的某一个值减少 N ( N默认为1 )
import memcache
 
mc = memcache.Client(['192.168.49.130:12000'], debug=True)
mc.set('k1', '777')
 
mc.incr('k1')
# k1 = 778
 
mc.incr('k1', 10)
# k1 = 788
 
mc.decr('k1')
# k1 = 787
 
mc.decr('k1', 10)
# k1 = 777

10、gets 和 cas

如商城商品剩余个数,假设改值保存在memcache中,product_count = 900
A用户刷新页面从memcache中读取到product_count = 900
B用户刷新页面从memcache中读取到product_count = 900

如果A、B用户均购买商品

A用户修改商品剩余个数 product_count=899
B用户修改商品剩余个数 product_count=899

如此一来缓存内的数据便不在正确,两个用户购买商品后,商品剩余还是 899
如果使用python的set和get来操作以上过程,那么程序就会如上述所示情况!

如果想要避免此情况的发生,只要使用 gets 和 cas 即可,如:

import memcache
mc = memcache.Client(['192.168.49.130:12000'], debug=True, cache_cas=True)
 
v = mc.gets('product_count')
# ...
# 如果有人在gets之后和cas之前修改了product_count,那么,下面的设置将会执行失败,剖出异常,从而避免非正常数据的产生
mc.cas('product_count', "899")

Ps:本质上每次执行gets时,会从memcache中获取一个自增的数字,通过cas去修改gets的值时,会携带之前获取的自增值和memcache中的自增值进行比较,如果相等,则可以提交,如果不想等,那表示在gets和cas执行之间,又有其他人执行了gets(获取了缓冲的指定值), 如此一来有可能出现非正常数据,则不允许修改。

原文地址:https://www.cnblogs.com/freely/p/6838675.html