一、mongo是啥东西?
MongoDB 是由C++语言编写的,基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,可以保证服务器性能。
二、gridfs是啥东西?
1.MongoDB内置GridFS,支持大容量的存储。
2.GridFS是一个出色的分布式文件系统,可以支持海量的数据存储。这使得 MongoDB能够满足对大数据集的快速范围查询
3.默认chunk的大小是256K ( public static final int DEFAULT_CHUNKSIZE = 256 * 1024)
【存】存GridFS时,如果文件大于chunksize,则把文件分割成多个chunk,再把这些chunk保存到fs.chunks中,最后再把文件信息存入到fs.files中。(GridFS并不是将单个文件直接存储为一个document,而是将文件分成多个parts或者说chunks,然后将每个chunk作为作为一个单独的document存储,然后将chunks有序保存。)
【取】读取文件时,据查询条件在fs.files中找到一个合适的记录,得“_id”,再据这值到 fs.chunks中查所有“files_id”为“_id”的chunk,按“n”排序,最后依次读取chunk中“data”对象的内容还原成原来的文件。(客户端或者driver将会重新按序组装这些chunks。用户可以range查询文件,也可以获取文件的任意部分的信息,比如:跳过(skip)视频或者音频(任何文件)的中间部,实现“range access of single file”)
4. gridfs和传统的文件管理区别:
【传统】在主数据库中存放文件的属性,并且记录文件的 path. 当查询某个文件时,需要首先查询数据库,获得path, 然后从存储系统中获得相应的文件.
【gridfs】直接存。