NoSQL之Memcached

一、Memcached概念

Memcached是NoSQL产品之中的一个，是一个暂时性键值存储NoSQL数据库，过去被大量使用在互联网站点中，作为应用和数据库之间的缓存层，大大提高查询和訪问速度。

Memcached有下面特点:

1、全内存运转：数据从来不保存在硬盘中。机器一重新启动，数据就所有没有了，所有又称暂时性数据库；

2、哈希方式存储：

3、简单文本协议进行数据通信：不须要特定二进制代码，仅仅须要用telnet连通memcached的监听port，打入简单浅显的代码就能操作；

4、仅仅操作字符型数据：不管往memcached放入什么。都是以字节的方式来处理。

还原成数组、哈希表、字符串和数值等都交给应用层来解释。应用读写memcached的数据时，进行序列化和反序列化。把其解释成应用所能理解的数据类型。

5、集群也由应用进行控制，採用一致性散列（哈希）算法。

二、安装Memcached

1、在linux上搭建yum环境

2、使用yum命令进行安装Memcached的rpm包

[root@nn init.d]# yum install memcached

3、启动Memcached，

首先要cd到对应文件夹

[root@nn ~]# cd /etc/rc.d/init.d/

执行memcached安装脚本

[root@nn init.d]# ./memcached start

4、查看Memcached是否启动

[root@nn init.d]# pstree

表示Memcached进程被启动了，以下开了5个线程

或者使用[root@nn init.d]# ps aux命令

memcached -d -p 11211 -u memcached -m 64 -c 1024 -P /var/run/memcached/memcached.pid

-d表示程序要后台化执行，-p指定port。-u表示用memcached这个身份来执行，后面的都是memcached的控制參数

5、连接Memcached

[root@nn init.d]# telnet localhost 11211

三、Memcached经常使用命令

命令格式：

參数说明例如以下：

<command name>	set/add/replace
<key>	查找keyword
<flags>	客户机使用它存储关于键值对的额外信息。用于指定是否压缩，0不压缩，1压缩
<exptime>	该数据的存活时间，0表示永远
<bytes>	存储字节数
<data block>	存储的数据块（可直接理解为key-value结构中的value）

1、添加：set、add、cas

2、获取：get、gets、

3、追加：append、prepend

4、删除：delete

5、清除全部：flush_all

6、加减：incr、decr

7、退出：quit

三、用java连接Memcached

眼下java提供了三种API供我们实现与Memcached的连接和存取

1、memcached client for java

较早推出的memcached JAVAclientAPI，应用广泛，执行比較稳定。

2、pymemcached

A simple, asynchronous, single-threaded memcached client written in java. 支持异步。单线程的memcached客户端，用到了java1.5版本号的concurrent和nio，存取速度会高于前者，可是稳定性不好，測试中常报timeOut等相关异常。

3、xmemcached

XMemcached相同是基于java nio的client。java nio相比于传统堵塞io模型来说，有效率高（特别在高并发下）和资源耗费相对较少的长处。传统堵塞IO为了提高效率，须要创建一定数量的连接形成连接池。而nio仅须要一个连接就可以（当然,nio也是能够做池化处理），相对来说降低了线程创建和切换的开销，这一点在高并发下特别明显。因此XMemcached与Spymemcached在性能都很优秀，在某些方面（存储的数据比較小的情况下）Xmemcached比Spymemcached的表现更为优秀，详细能够看这个Java Memcached Clients Benchmark。

本文章使用memcached client for java为例

在使用java连接远程的PC机的Memcached时。记得保证两台机都开启telnet服务。而且本机能telnet通远程机，远程机必须关闭防火墙。

实例代码1：（java连接Memcached并实现数据的存取）

import com.danga.MemCached.MemCachedClient;

import com.danga.MemCached.SockIOPool;

public class memcachedTest {

public static void main(String[] args) {

//初始化SockIOPool，管理Memcached的连接池

String[] servers = {"192.183.3.230:11211"};

SockIOPool pool = SockIOPool.getInstance();

pool.setServers(servers);

pool.setFailover(true);

pool.setInitConn(10);

pool.setMinConn(5);

pool.setMaxConn(250);

pool.setMaintSleep(30);

pool.setNagle(false);

pool.setSocketTO(3000);

pool.setAliveCheck(true);

pool.initialize();

//建立MemcachedClient实例

MemCachedClient memCachedClient = new MemCachedClient();

for(int i = 0;i < 100000;i++){

//将对象增加到memcached缓存

boolean success = memCachedClient.set(""+i, "hello!");

}

for(int i = 0;i < 100000;i++){

//从memcached缓存中按key值取对象

String result = (String)memCachedClient.get(""+i);

System.out.println(String.format("get(%d):%s", i,result+i));

}

四、測试Memcached性能

为性能对照測试准备数据

1、插入数据到oracle

/**

* 插入測试数据到oracle数据库

* @param count插入记录数

* @return

public static boolean insertIntoOracle(int count){

try {

con = dbConn("feng","feng");

if(con == null){

System.out.println("连接失败");

System.exit(0);

}

System.out.println("truncate table memcached_test......");

sql = "truncate table memcached_test";

pstmt = con.prepareStatement(sql);

rs = pstmt.executeQuery();

System.out.println("truncate table memcached_test finish.");

System.out.println("insert "+count+" values");

sql = "insert into memcached_test (memcachedId,memcachedvalues) values (?,?

)";

pstmt = con.prepareStatement(sql);

for(int i = 1;i <= count;i++){

pstmt.setInt(1, i);

pstmt.setString(2, "Memcached is a good thing.I like it very much !-----------"+i);

pstmt.executeUpdate();

}

System.out.println("insert "+count+" values finish.");

rs.close();

pstmt.close();

con.close();

} catch (ClassNotFoundException e) {

e.printStackTrace();

} catch (SQLException e) {

e.printStackTrace();

}

return true;

}

public static Connection dbConn(String name,String pass) throws ClassNotFoundException, SQLException{

Connection conn = null;

Class.forName("oracle.jdbc.driver.OracleDriver");

conn = DriverManager.getConnection("jdbc:oracle:thin:@192.183.3.230:1522:myorcl",name,pass);

return conn;

}

2、插入数据到Memcached

/**

* 插入測试数据到Memcached

* @param count插入记录数

* @return

public static boolean insertIntoMemcached(int count){

//初始化SockIOPool。管理Memcached的连接池

String[] servers = {"192.183.3.230:11211"};

SockIOPool pool = SockIOPool.getInstance();

pool.setServers(servers);

pool.setFailover(true);

pool.setInitConn(10);

pool.setMinConn(5);

pool.setMaxConn(250);

pool.setMaintSleep(30);

pool.setNagle(false);

pool.setSocketTO(3000);

pool.setAliveCheck(true);

pool.initialize();

//建立MemcachedClient实例

MemCachedClient memCachedClient = new MemCachedClient();

System.out.println("insert "+count+" values into memcached......");

for(int i = 1;i < count;i++){

//将对象增加到memcached缓存

boolean success = memCachedClient.set("testData"+i, insertStr+i);

}

System.out.println("insert "+count+" values into memcached finish.");

return true;

}

Main函数调用这两个方法后，会将count条记录，值为insertData，插入到Oracle数据和set进Memcached中。

1、比較同一时候插入100000条数据的时间

从执行结果能够看出，插入10万条数据到Memcached比插10万条数据入Oracle所用时间有一个质的降低。

2、比較查询时间

下面是连接oracle数据并查找10000条数据的方法

/**

* oracle数据库查找

* @param count记录数

* @return

* @throws ParseException

public static long searchOracle(int count) throws ParseException{

long useTime = 0;

try {

con = dbConn("feng","feng");

if(con == null){

System.out.println("连接失败");

System.exit(0);

}

StringBuffer sql =new StringBuffer("select memcachedid,memcachedvalues from memcached_test where memcachedid = ?");

pstmt = con.prepareStatement(sql.toString());

String memcachedvalues = "";

System.out.println("search table memcached_test......");

String beginTime = d.format(new Date());

for(int i = 1;i <= count;i++){

if(i%10 == 0){

pstmt.setInt(1, i);

rs = pstmt.executeQuery();

while(rs.next()){

memcachedvalues = rs.getString(2);

}

System.out.println("search table memcached_test finish.");

String endTime = d.format(new Date());

useTime = d.parse(endTime).getTime() - d.parse(beginTime).getTime();

long ss = (useTime/1000)%60;//秒

long MM = useTime/60000;//分

System.out.println("Oracle中查找10000条记录的開始时间："+beginTime);

System.out.println("Oracle中查找10000条记录的结束时间："+endTime);

System.out.println("Oracle中查找10000条记录的所用时间： "+MM+"分"+ss+"秒");

rs.close();

pstmt.close();

con.close();

} catch (ClassNotFoundException e) {

e.printStackTrace();

} catch (SQLException e) {

e.printStackTrace();

}

return useTime;

}

下面是连接Memcached并查找10000条数据的方法

/**

* Memcached查找

* @param count

* @return

* @throws ParseException

public static long searchMemcached(int count) throws ParseException{

//初始化SockIOPool。管理Memcached的连接池

String[] servers = {"192.183.3.230:11211"};

SockIOPool pool = SockIOPool.getInstance();

pool.setServers(servers);

pool.setFailover(true);

pool.setInitConn(10);

pool.setMinConn(5);

pool.setMaxConn(250);

pool.setMaintSleep(30);

pool.setNagle(false);

pool.setSocketTO(3000);

pool.setAliveCheck(true);

pool.initialize();

//建立MemcachedClient实例

MemCachedClient memCachedClient = new MemCachedClient();

System.out.println("search 10000 data in Memcached......");

String memcachedvalues = "";

String beginTime = d.format(new Date());

for(int i = 1;i <= count;i++){

//从memcached缓存中按key值取对象

if(i%10 == 0){

memcachedvalues = (String)memCachedClient.get("testData"+i);

}

System.out.println("search 10000 data in Memcached finish.");

String endTime = d.format(new Date());

long useTime = d.parse(endTime).getTime() - d.parse(beginTime).getTime();

long ss = (useTime/1000)%60;//秒

long MM = useTime/60000;//分

System.out.println("从Memcached查找10000条记录的開始时间："+beginTime);

System.out.println("从Memcached查找10000条记录的结束时间："+endTime);

System.out.println("从Memcached查找10000条记录的所用时间： "+MM+"分"+ss+"秒");

return useTime;

}

执行结果例如以下：

从执行结果能够看出，同一时候查找10000条数据，Memcached所用时间比1Oracle所用时间降低了29秒。

四、启动多个节点的Memcached

因为实验器材有限，如今在同一台pc机中启动多个Memcached，仅仅要设定port不一样，这些Memcached之间互相不会干扰。

启动命令例如以下：

[root@nn init.d]# memcached -d -p 11212 -u memcached -m 64 -c 1024

[root@nn init.d]# memcached -d -p 11213 -u memcached -m 64 -c 1024

当中-d表示在后台执行，-p表示port号，-u表示用户

启动之后用pstree查看

[root@nn init.d]# pstree

3*[memcached───5*[{memcached}]]表示有3组Memcached的进程。

或者用ps aux命令

[root@nn init.d]# ps aux

往多节点的Memcached中插入数据的java代码

/**

* 往节点Memcached插入数据

* @param count

public static void testManyNode(int count){

//初始化SockIOPool，管理Memcached的连接池

String[] servers = {"192.183.3.230:11211","192.183.3.230:11212","192.183.3.230:11213"};

SockIOPool pool = SockIOPool.getInstance();

pool.setServers(servers);

pool.setFailover(true);

pool.setInitConn(10);

pool.setMinConn(5);

pool.setMaxConn(250);

pool.setMaintSleep(30);

pool.setNagle(false);

pool.setSocketTO(3000);

pool.setAliveCheck(true);

pool.initialize();

//建立MemcachedClient实例

MemCachedClient memCachedClient = new MemCachedClient();

String beginTime = d.format(new Date());

for(int i = 1;i <= count;i++){

//将对象增加到memcached缓存

boolean success = memCachedClient.set("node"+i, insertStr+i);

}

Memcached的查询结果：

从结果中能够看出，数据分布到Memcached的不同节点上。

五、高可用方案repcached

假如Memcached中有一个节点失效了，这个节点所管辖的数据都没有，我们必须又一次去数据库中获取数据放入新的节点中。这样会引发数据库性能的波动。这里就须要我们做一个高可用的Memcached，使得Memcached中的每个节点都有另外一个节点与之中的一个一相应。这两个一一相应的节点中的数据是一模一样的。这样当当中一个节点失效了，另外一个节点就能立即接管缓存的工作，这样就不须要又一次从数据库中获取数据库。

以下我们使用repcached来实现Memcached的高可用

1、下载repcached

[root@nn ~]# wget http://downloads.sourceforge.net/repcached/memcached-1.2.8-repcached-2.2.tar.gz