关于Mongodb的其他知识

Mongodb支持的数据类型

数据类型	描述
String	字符串。存储数据常用的数据类型。在 MongoDB 中，UTF-8 编码的字符串才是合法的。
Integer	整型数值。用于存储数值。根据你所采用的服务器，可分为 32 位或 64 位。
Boolean	布尔值。用于存储布尔值（真/假）。
Double	双精度浮点值。用于存储浮点值。
Min/Max keys	将一个值与 BSON（二进制的 JSON）元素的最低值和最高值相对比。
Arrays	用于将数组或列表或多个值存储为一个键。
Timestamp	时间戳。记录文档修改或添加的具体时间。
Object	用于内嵌文档。
Null	用于创建空值。
Symbol	符号。该数据类型基本上等同于字符串类型，但不同的是，它一般用于采用特殊符号类型的语言。
Date	日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间：创建 Date 对象，传入年月日信息。
Object ID	对象 ID。用于创建文档的 ID。
Binary Data	二进制数据。用于存储二进制数据。
Code	代码类型。用于在文档中存储 JavaScript 代码。
Regular expression	正则表达式类型。用于存储正则表达式。

Mongodb可以储存的数据可以大于内存大小，Mongodb自身保证热点数据在内存中，当发现要操作的数据不在内存中的时候，Mongodb会去硬盘中加载。

Mongodb支持全文搜索和地理空间查询。

Mongodb全文检索

//插入测试数据有列name和description
> db.stores.insert(
... [
... { _id: 1, name: "Java Hut", description: "Coffee and cakes" },
... { _id: 2, name: "Burger Buns", description: "Gourmet hamburgers" },
... { _id: 3, name: "Coffee Shop", description: "Just coffee" },
... { _id: 4, name: "Clothes Clothes Clothes", description: "Discount clothing" },
... { _id: 5, name: "Java Shopping", description: "Indonesian goods" }
... ]
... )
BulkWriteResult({
"writeErrors" : [ ],
"writeConcernErrors" : [ ],
"nInserted" : 5,
"nUpserted" : 0,
"nMatched" : 0,
"nModified" : 0,
"nRemoved" : 0,
"upserted" : [ ]
})
//在stores上建立所以包含name列和description都是文本
> db.stores.createIndex( { name: "text", description: "text" } )
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
//执行全文检索会将关键字分词然后匹配结果还可以由于数据量小速度就测不出来了
> db.stores.find( { $text: { $search: "java coffee shop" } } )
{ "_id" : 3, "name" : "Coffee Shop", "description" : "Just coffee" }
{ "_id" : 1, "name" : "Java Hut", "description" : "Coffee and cakes" }
{ "_id" : 5, "name" : "Java Shopping", "description" : "Indonesian goods" }

优势：实时的全文检索。

不知道性能如何，不支持高亮这种展示，只有在3.2+的版本才支持中文分词。

大致了解下，暂时不会用到，以后用到可以详细看手册：

https://docs.mongodb.com/manual/text-search/

当前最新的版的Mongdb3.4开始支持创建视图(view)。

Capped collections是大小固定的collection，它们支持基于插入顺序插入和检索文档的高吞吐量操作。覆盖的集合以类似于循环缓冲区的方式工作：一旦集合填充其分配的空间，它将通过覆盖集合中最旧的文档来为新文档腾出空间。

db.createCollection(name, options)方法：

因为MongoDB在集合首次在命令中引用时隐式创建集合，所以此方法主要用于创建使用特定选项的新集合。例如，您使用db.createCollection（）创建一个Capped collections，或者创建一个使用文档验证的新集合。 db.createCollection（）也用于为普通集合预分配空间。

db.createCollection(<name>, { capped: <boolean>,
autoIndexId: <boolean>,
size: <number>,
max: <number>,
storageEngine: <document>,
validator: <document>,
validationLevel: <string>,
validationAction: <string>,
indexOptionDefaults: <document>,
viewOn: <string>,
pipeline: <pipeline>,
collation: <document> } )

capped：是否Capped collections。

size：可选的。为Capped collections指定最大大小（以字节为单位）。一旦限制集合达到其最大大小，MongoDB将删除较旧的文档，为新文档腾出空间。 size字段是封顶集合所必需的，而对于其他集合则被忽略。

max:可选的。Capped collections中允许的最大文档数。Size限制优先于此限制。如果上限集合达到最大数量的文档之前达到Size限制，MongoDB将删除旧文档。如果您希望使用最大限制，请确保限制集合所需的大小限制足以包含最大数量的文档。

validator: 可选的。允许用户为集合指定验证规则或表达式。版本3.2中的新功能。

TTL集合

通过创建TTL索引，就构建了一个TTL集合，索引建立的原则：
- 索引字段必须为时间类型
建立语句：

db.ttl_test.ensureIndex({“time”:1},{expireAfterSeconds:20}})

设置其为20s后删除数据，真实情况下可能并不能精确到20s.

单个文档大小的限制：

在Mongodb2.0和之后的版本中，单个文档大小的限制为16MB。Mongodb这么设计主要是出于性能的考虑，因为查询单个文档返回给客户端之前要把整个文档拷贝到缓存中，这个拷贝工作非常昂贵。

Mongodb文档的嵌套深度最大值限制是100。

MongoDB将会把不存在的字段当做一个空的BSON对象。这样的话，对文档 { } 和 { a: null } 在 a字段上进行排序，在排序顺序上将会看做相等。

字段名_id保留用作主键; 其值在集合中必须是唯一的，是不可变的，并且可以是除数组之外的任何类型。

存储引擎是负责管理数据的MongoDB的主要组件。 MongoDB提供各种存储引擎，允许您选择最适合您的应用程序。

journal日志可帮助数据库在严重关闭的情况下恢复。有几个可配置的选项可以使日志在性能和可靠性之间取得平衡，这对您的特定用例有效。

GridFS 是一个通用的存储系统用来处理大文件，例如那些超过16MB文档大小限制的文件。

Mongodb的持久化：

Mongodb在内存中的文件有两种：

数据文件和journal日志。

数据文件没60同步到硬盘一次。

journal日志用于记录Write ahead log，用于出错恢复。所以journal日志一般只需要存储60秒的内容就够了。

journal日志每100ms同步到硬盘一次。可以设置为更低，不过性能就下降了。

设置命令：db.adminCommand({"setParameter" : 1, "journalCommitInterval" : 10})

存储引擎：

存储引擎是数据库的组件，负责管理数据在内存和磁盘上的存储方式。

存储引擎（Storage Engine）是MongoDB的核心组件，负责管理数据如何存储在硬盘（Disk）和内存（Memory）上。从MongoDB 3.2 版本开始，MongoDB 支持多数据存储引擎（Storage Engine），MongoDB支持的存储引擎有：WiredTiger，MMAPv1和In-Memory。

MongoDB支持多个存储引擎，因为不同的引擎对于特定的工作负载更好。为您的用例选择适当的存储引擎可能会显着影响应用程序的性能。

WiredTiger是从MongoDB 3.2开始的默认存储引擎。它非常适合大多数工作负载，建议用于新的部署。 WiredTiger提供文档级并发模型，检查点和压缩等功能。在MongoDB Enterprise中，WiredTiger还支持在Rest中进行加密。

MMAPv1是原始的MongoDB存储引擎，是3.2之前的MongoDB版本的默认存储引擎。它在具有大量读取和写入的工作负载以及就地更新方面表现良好。MMAPv1有一个缺陷，随着数据的增长，它会消耗大量的磁盘空间。原因是它使用内存映射文件的方式来管理内存：内存映射文件，是由一个文件到一块内存的映射。Win32提供了允许应用程序把文件映射到一个进程的函数 (CreateFileMapping)。内存映射文件与虚拟内存有些类似，通过内存映射文件可以保留一个地址空间的区域，同时将物理存储器提交给此区域，内存文件映射的物理存储器来自一个已经存在于磁盘上的文件，而且在对该文件进行操作之前必须首先对文件进行映射。使用内存映射文件处理存储于磁盘上的文件时，将不必再对文件执行I/O操作，使得内存映射文件在处理大数据量的文件时能起到相当重要的作用。

在3.0版本之后，MMAPv1可以支持集合级别的锁。但是不支持文档级别的锁。

内存存储引擎在MongoDB Enterprise中可用。它不是将文档存储在磁盘上，而是将它们保留在内存中，以实现更可预测的数据延迟。

WiredTiger存储引擎：

从MongoDB 3.0开始，WiredTiger存储引擎在64位版本中可用。

在3.2版本更改：WiredTiger存储引擎是从MongoDB 3.2开始的默认存储引擎。这是我们为什么使用3.2版本的原因。WiredTiger已经很成熟了。

Spring的接口：

//一个根据名字查询结果的方法
@Override
public List<Student> getByName(String name) {
List<Student> students = new ArrayList<Student>();
Query query = new Query();
query.addCriteria(new Criteria("name").is(name));
students = this.mongoTemplate.find(query, Student.class);
return students;
}
////一个根据名字更新数据方法
@Override
public int updateByName(String name) {
int n = 0;
List<Student> students = new ArrayList<Student>();
Query query = new Query();
query.addCriteria(new Criteria("name").is(name));
Update update = new Update();
update.set("name", "xhj");
WriteResult result = this.mongoTemplate.updateMulti(query, update, Student.class);
n = result.getN();
return n;
}