关于Mongodb的其他知识

Mongodb支持的数据类型

 

数据类型描述
String 字符串。存储数据常用的数据类型。在 MongoDB 中,UTF-8 编码的字符串才是合法的。
Integer 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。
Boolean 布尔值。用于存储布尔值(真/假)。
Double 双精度浮点值。用于存储浮点值。
Min/Max keys 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。
Arrays 用于将数组或列表或多个值存储为一个键。
Timestamp 时间戳。记录文档修改或添加的具体时间。
Object 用于内嵌文档。
Null 用于创建空值。
Symbol 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。
Date 日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间:创建 Date 对象,传入年月日信息。
Object ID 对象 ID。用于创建文档的 ID。
Binary Data 二进制数据。用于存储二进制数据。
Code 代码类型。用于在文档中存储 JavaScript 代码。
Regular expression 正则表达式类型。用于存储正则表达式。

Mongodb可以储存的数据可以大于内存大小,Mongodb自身保证热点数据在内存中,当发现要操作的数据不在内存中的时候,Mongodb会去硬盘中加载。

Mongodb支持全文搜索和地理空间查询。

Mongodb全文检索

  1. //插入测试数据 有列name和description
  2. > db.stores.insert(
  3. ... [
  4. ... { _id: 1, name: "Java Hut", description: "Coffee and cakes" },
  5. ... { _id: 2, name: "Burger Buns", description: "Gourmet hamburgers" },
  6. ... { _id: 3, name: "Coffee Shop", description: "Just coffee" },
  7. ... { _id: 4, name: "Clothes Clothes Clothes", description: "Discount clothing" },
  8. ... { _id: 5, name: "Java Shopping", description: "Indonesian goods" }
  9. ... ]
  10. ... )
  11. BulkWriteResult({
  12.    "writeErrors" : [ ],
  13.    "writeConcernErrors" : [ ],
  14.    "nInserted" : 5,
  15.    "nUpserted" : 0,
  16.    "nMatched" : 0,
  17.    "nModified" : 0,
  18.    "nRemoved" : 0,
  19.    "upserted" : [ ]
  20. })
  21. //在stores上建立所以 包含name列和description都是文本
  22. > db.stores.createIndex( { name: "text", description: "text" } )
  23. {
  24.    "createdCollectionAutomatically" : false,
  25.    "numIndexesBefore" : 1,
  26.    "numIndexesAfter" : 2,
  27.    "ok" : 1
  28. }
  29. //执行全文检索 会将关键字分词 然后匹配结果还可以 由于数据量小 速度就测不出来了
  30. > db.stores.find( { $text: { $search: "java coffee shop" } } )
  31. { "_id" : 3, "name" : "Coffee Shop", "description" : "Just coffee" }
  32. { "_id" : 1, "name" : "Java Hut", "description" : "Coffee and cakes" }
  33. { "_id" : 5, "name" : "Java Shopping", "description" : "Indonesian goods" }

优势:实时的全文检索。

不知道性能如何,不支持高亮这种展示,只有在3.2+的版本才支持中文分词。

大致了解下,暂时不会用到,以后用到可以详细看手册:

https://docs.mongodb.com/manual/text-search/

当前最新的版的Mongdb3.4开始支持创建视图(view)。

Capped collections是大小固定的collection,它们支持基于插入顺序插入和检索文档的高吞吐量操作。 覆盖的集合以类似于循环缓冲区的方式工作:一旦集合填充其分配的空间,它将通过覆盖集合中最旧的文档来为新文档腾出空间。

db.createCollection(nameoptions)方法:

因为MongoDB在集合首次在命令中引用时隐式创建集合,所以此方法主要用于创建使用特定选项的新集合。 例如,您使用db.createCollection()创建一个Capped collections,或者创建一个使用文档验证的新集合。 db.createCollection()也用于为普通集合预分配空间。

  1. db.createCollection(<name>, { capped: <boolean>,
  2.                               autoIndexId: <boolean>,
  3.                               size: <number>,
  4.                               max: <number>,
  5.                               storageEngine: <document>,
  6.                               validator: <document>,
  7.                               validationLevel: <string>,
  8.                               validationAction: <string>,
  9.                               indexOptionDefaults: <document>,
  10.                               viewOn: <string>,
  11.                               pipeline: <pipeline>,
  12.                               collation: <document> } )

capped是否Capped collections

size可选的。Capped collections指定最大大小(以字节为单位)。一旦限制集合达到其最大大小,MongoDB将删除较旧的文档,为新文档腾出空间。 size字段是封顶集合所必需的,而对于其他集合则被忽略。

max:可选的。Capped collections中允许的最大文档数。Size限制优先于此限制。如果上限集合达到最大数量的文档之前达到Size限制,MongoDB将删除旧文档。如果您希望使用最大限制,请确保限制集合所需的大小限制足以包含最大数量的文档。

validator: 可选的。允许用户为集合指定验证规则或表达式。版本3.2中的新功能。

TTL集合

通过创建TTL索引,就构建了一个TTL集合,索引建立的原则: 
- 索引字段必须为时间类型 
建立语句:

db.ttl_test.ensureIndex({“time”:1},{expireAfterSeconds:20}})

设置其为20s后删除数据,真实情况下可能并不能精确到20s.

单个文档大小的限制:

在Mongodb2.0和之后的版本中,单个文档大小的限制为16MB。Mongodb这么设计主要是出于性能的考虑,因为查询单个文档返回给客户端之前要把整个文档拷贝到缓存中,这个拷贝工作非常昂贵。

Mongodb文档的嵌套深度最大值限制是100。

MongoDB将会把不存在的字段当做一个空的BSON对象。这样的话,对文档 } 和 a: null } 在 a字段上进行排序,在排序顺序上将会看做相等。

字段名_id保留用作主键; 其值在集合中必须是唯一的,是不可变的,并且可以是除数组之外的任何类型。

存储引擎是负责管理数据的MongoDB的主要组件。 MongoDB提供各种存储引擎,允许您选择最适合您的应用程序。

journal日志可帮助数据库在严重关闭的情况下恢复。 有几个可配置的选项可以使日志在性能和可靠性之间取得平衡,这对您的特定用例有效。

GridFS 是一个通用的存储系统用来处理大文件,例如那些超过16MB文档大小限制的文件。

Mongodb的持久化:

Mongodb在内存中的文件有两种:

数据文件和journal日志。

数据文件没60同步到硬盘一次。

journal日志用于记录Write ahead log,用于出错恢复。所以journal日志一般只需要存储60秒的内容就够了。

journal日志每100ms同步到硬盘一次。可以设置为更低,不过性能就下降了。

设置命令:db.adminCommand({"setParameter" : 1, "journalCommitInterval" : 10})

 

存储引擎:

存储引擎是数据库的组件,负责管理数据在内存和磁盘上的存储方式。

存储引擎(Storage Engine)是MongoDB的核心组件,负责管理数据如何存储在硬盘(Disk)和内存(Memory)上。从MongoDB 3.2 版本开始,MongoDB 支持多数据存储引擎(Storage Engine),MongoDB支持的存储引擎有:WiredTiger,MMAPv1和In-Memory。

MongoDB支持多个存储引擎,因为不同的引擎对于特定的工作负载更好。为您的用例选择适当的存储引擎可能会显着影响应用程序的性能。

WiredTiger是从MongoDB 3.2开始的默认存储引擎。它非常适合大多数工作负载,建议用于新的部署。 WiredTiger提供文档级并发模型,检查点和压缩等功能。在MongoDB Enterprise中,WiredTiger还支持在Rest中进行加密。

MMAPv1是原始的MongoDB存储引擎,是3.2之前的MongoDB版本的默认存储引擎。它在具有大量读取和写入的工作负载以及就地更新方面表现良好。MMAPv1有一个缺陷,随着数据的增长,它会消耗大量的磁盘空间。原因是它使用内存映射文件的方式来管理内存:内存映射文件,是由一个文件到一块内存的映射。Win32提供了允许应用程序把文件映射到一个进程的函数 (CreateFileMapping)。内存映射文件与虚拟内存有些类似,通过内存映射文件可以保留一个地址空间的区域,同时将物理存储器提交给此区域,内存文件映射的物理存储器来自一个已经存在于磁盘上的文件,而且在对该文件进行操作之前必须首先对文件进行映射。使用内存映射文件处理存储于磁盘上的文件时,将不必再对文件执行I/O操作,使得内存映射文件在处理大数据量的文件时能起到相当重要的作用。

在3.0版本之后,MMAPv1可以支持集合级别的锁。但是不支持文档级别的锁。

 

内存存储引擎在MongoDB Enterprise中可用。它不是将文档存储在磁盘上,而是将它们保留在内存中,以实现更可预测的数据延迟。

 

WiredTiger存储引擎:

从MongoDB 3.0开始,WiredTiger存储引擎在64位版本中可用。

在3.2版本更改:WiredTiger存储引擎是从MongoDB 3.2开始的默认存储引擎。 这是我们为什么使用3.2版本的原因。WiredTiger已经很成熟了。

Spring的接口:

//一个根据名字查询结果的方法
@Override
public List<Student> getByName(String name) {
List<Student> students = new ArrayList<Student>();
Query query = new Query();
query.addCriteria(new Criteria("name").is(name));
students = this.mongoTemplate.find(query, Student.class);
return students;
}
////一个根据名字更新数据方法
@Override
public int updateByName(String name) {
int n = 0;
List<Student> students = new ArrayList<Student>();
Query query = new Query();
query.addCriteria(new Criteria("name").is(name));
Update update = new Update();
update.set("name", "xhj");
WriteResult result = this.mongoTemplate.updateMulti(query, update, Student.class);
n = result.getN();
return n;
}

原文地址:https://www.cnblogs.com/xiaolang8762400/p/6947136.html