mongo gridfs 学习

一、mongo是啥东西?

    MongoDB 是由C++语言编写的,基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,可以保证服务器性能。

二、gridfs是啥东西?

    1.MongoDB内置GridFS,支持大容量的存储。

    2.GridFS是一个出色的分布式文件系统,可以支持海量的数据存储。这使得 MongoDB能够满足对大数据集的快速范围查询

    3.默认chunk的大小是256K  ( public static final int DEFAULT_CHUNKSIZE = 256 * 1024)

  【存】存GridFS时,如果文件大于chunksize,则把文件分割成多个chunk,再把这些chunk保存到fs.chunks中,最后再把文件信息存入到fs.files中。(GridFS并不是将单个文件直接存储为一个document,而是将文件分成多个parts或者说chunks,然后将每个chunk作为作为一个单独的document存储,然后将chunks有序保存。)

  【取】读取文件时,据查询条件在fs.files中找到一个合适的记录,得“_id”,再据这值到 fs.chunks中查所有“files_id”为“_id”的chunk,按“n”排序,最后依次读取chunk中“data”对象的内容还原成原来的文件。(客户端或者driver将会重新按序组装这些chunks。用户可以range查询文件,也可以获取文件的任意部分的信息,比如:跳过(skip)视频或者音频(任何文件)的中间部,实现“range access of single file”)

   

   4. gridfs和传统的文件管理区别:

    【传统】在主数据库中存放文件的属性,并且记录文件的 path.  当查询某个文件时,需要首先查询数据库,获得path,  然后从存储系统中获得相应的文件.

    【gridfs】直接存。

原文地址:https://www.cnblogs.com/yuzhaoblog/p/9680888.html