mongodb进阶

一、游标

先插入一张表的数据

for(i=0; i<100; i++) { db.c.insert({x : i}); }

定义一个游标

var cursor = db.c.find();

以循环的方式输出游标的数据

while (cursor.hasNext()) { obj = cursor.next(); print(obj.x); }

二、limit、 skip、sort

db.c.find().limit(3) 取出前三行

db.c.find().skip(3) 滤到前三行，

db.c.find().skip(10).limit(5)从11行开始，读出5行。

定义一个游标并按x列排序，1 表示升序，-1表示降序

var cursor= db.c.find().skip(10).limit(6).sort({"x":1)});

（一）、用skip实现分页

n 当skip大量行的时候，会比较慢

//do not use , slow for large skips

var page1 = db.foo.find(criteria).limit(100)

var page1 = db.foo.find(criteria).skip(100).limit(100)

var page1 = db.foo.find(criteria).skip(200).limit(100)

（二）、技巧

var page1 = db.foo.find().sort({"date":-1}.limit(100)

var latest = null

//display first page

whill (page1.hasNext(*)){

last=page1.next();

display(latest);

}

//get the next page

var page2 = db.foo.find ({"data":("$gt":latest.data}});

page2.sort({"date":-1}.limit(100)

这样做就不会存在大量的分页。

（三）、随机抽取文档

db.people.insert({"name" : "joe", "random" : Math.random()})

db.people.insert({"name" : "john", "random" : Math.random()})

db.people.insert({"name" : "jim", "random" : Math.random()})

db.people.find()

var random = Math.random()

result = db.people.findOne({"random" : {"$gt" : random}})

三、索引

（一）特点

可以在任意列上建立索引
索引的构造和使用与传统关系型数据库几乎一样，适用于Oracle的优化技巧也适用于Mongodb
使用索引可以加快查询，但同时会降低修改，插入等的性能
内嵌文档照样可以建立使用索引

（二）建立索引

1、先做一个集合

db.people.insert([

{ "username" : "smith", "age" : 48, "user_id" : 0 },

{ "username" : "smith", "age" : 30, "user_id" : 1 },

{ "username" : "john", "age" : 36, "user_id" : 2 },

{ "username" : "john", "age" : 18, "user_id" : 3 },

{ "username" : "joe", "age" : 36, "user_id" : 4 },

{ "username" : "john", "age" : 7, "user_id" : 5 },

{ "username" : "simon", "age" : 3, "user_id" : 6 },

{ "username" : "joe", "age" : 27, "user_id" : 7 },

{ "username" : "jacob", "age" : 17, "user_id" : 8 },

{ "username" : "sally", "age" : 52, "user_id" : 9 },

{ "username" : "simon", "age" : 59, "user_id" : 10 }

])

2、建立索引

db.people.ensureIndex({"username" : 1}) //1表示是（正向）升序的索引

db.people.ensureIndex({"username" : 1,"age":-1}) //建立复合（组合）索引

explain()函数显示执行计划（执行过程）

db.people.find().explain()

indexFilterSet: false 显示没有使用索引

3、查看索引

查看当前数据库的各集合的索引

db.system.indexes.find()

4、删除索引

db.runCommand({"dropIndexes":"peole","index":"age_1"})

删除people表中名为age_1的索引

db.runCommand({"dropIndexes":"peole","index":*})

删除people表中所有的索引

四、其他操作

（一）、聚合

1、count

查看数据集合中有多少行

db.people.count()

2、distinct

db.runCommand({"distinct" : "people", "key" : "age"})

3、group

分组求和

db.people.group({

"key":{"username":true},

"initial": {"csum": 0 },

"reduce":function(obj, prev)

{

prev.csum += obj.age;

}

})

另外一个例子

doc 是行扫描，prev是记算保存的结果

（二）、把函数当做key

To define a grouping function, you must use a $keyf key (instead of "key"). Using "$keyf" makes the group command look something like this:

db.posts.group({"ns" : "posts",

"$keyf" : function(x) { return x.category.toLowerCase(); },

"initializer" :

})

"$keyf" allows you can group by arbitrarily complex criteria.

（三）、MapReduce

n        与Hadoop的Map-Reduce神似

n        能完成count、distinct、group所能做的一切事情

例子：寻找集合中所有的键

先定义一个map函数

map = function() { for (var key in this) { emit(key, {count : 1});

}};

再定义一个reduce函数

reduce = function(key, emits) {

total = 0;

for (var i in emits) {

total += emits[i].count;

}

return {"count" : total};

}

db.runCommand({"mapreduce" : "people", "map" : map, "reduce" : reduce,"out":"result"})

这个函数的说明：

{"mapreduce" : "people"意思是在people这个集合中做mapreduce操作

"map" : map, "reduce" : reduce,"指明map函数和reduce函数，

"out":"result" 说明输出到那个集合

最后可以用 db.result.find()来查看来次操作的结果。

(四)、冷备份

关闭mongodb的情况下复制数据目录

（五）热备份

mongodump 出来的json和bson这种形式的文件

mongodump -d db

-o 重新指定dump文件存放位置

备份出来的数据还源

mongorestore -d foo --drop backup/test/

-d foo 表示还原到foo这个数据库中，

--drop backup/test/ 表示把原始的的backup/test/删除了。

（六）、强制一致

use admin //管理数据库

db.runCommand({"fsyns":1,"lock":1}) //把缓冲区的数据全部写到硬盘,然后加一把锁，不让数据再写入进来，

db.$cmd.sys.unlock.findOne();备份完成后解锁。

（七）、修复数据库

        修复所有数据库：用带—repair参数启动

        db.repairDatabase()

（八）、GridFS

从mogodb存放超过16M的文件

n 用于在数据库里存储二进制大文件

n 可以统一用数据库处理数据，而无需借助外部的文件系统

n 可以利用MongoDB的复制或分片机制，故障恢复和可扩展性较好

n 避免使用文件系统的某些限制（例如linux在同一目录下的文件数限制）

n 避免文件碎片（MongoDB分配空间以2GB作为单位）

GridFS存放的原理
文件被分成若干块，每个块作为一个文档存储
有一个单独的文档存储分块的信息，以及文件的元数据
fs.chunks集合存入具体的数据
fs.files集合存入元数据

五、完成器

（一）、先完成聚合

db.posts.group({

"key" : {"tags" : true},

"initial" : {"tags" : {}}, //输出的也是tags

"$reduce" : function(doc, prev) {

for (i in doc.tags) {

if (doc.tags[i] in prev.tags) {

prev.tags[doc.tags[i]]++;

}else {

prev.tags[doc.tags[i]] = 1;

}

}

}})

（二）、再用完成器，确定当天最受欢迎的标签

"finalize" : function(prev) {

var mostPopular = 0;

for (i in prev.tags) {

if (prev.tags[i] > mostPopular) {

prev.tag = i;

mostPopular = prev.tags[i];

}

}

delete prev.tags

}}})