GridFS 是 MongoDB 规范,用于存储和检索大型文件,如图像、音频文件、视频文件等。它类似于存储文件的文件系统,但是它的数据存储在 MongoDB 集合中。GridFS 能够存储甚至大于其文档大小限制(16mb)的文件。
GridFS将文件分为多个块,并将每个数据块存储在单独的文档中,每个文件的最大大小为255k。
默认情况下,GridFS使用两个集合,fs.files
并fs.chunks
存储文件的元数据和块。每个块均由其唯一的_id ObjectId字段标识。fs.files作为父文档。files_id
fs.chunks文档中的字段将块链接到其父级。
以下是fs.files集合的样本文档-
{ "filename": "test.txt", "chunkSize": NumberInt(261120), "uploadDate": ISODate("2014-04-13T11:32:33.557Z"), "md5": "7b762939321e146569b07f72c62cca4f", "length": NumberInt(646) }
该文档指定文件名,块大小,上载日期和长度。
以下是fs.chunks文档的样本文档-
{ "files_id": ObjectId("534a75d19f54bfec8a2fe44b"), "n": NumberInt(0), "data": "Mongo Binary Data" }
现在,我们将使用put
命令使用GridFS存储mp3文件。为此,我们将使用mongofiles.exe
MongoDB安装文件夹的bin文件夹中的实用程序。
打开命令提示符,导航到MongoDB安装文件夹的bin文件夹中的mongofiles.exe,然后键入以下代码-
>mongofiles.exe -d gridfs put song.mp3
此处gridfs
是将在其中存储文件的数据库的名称。如果数据库不存在,MongoDB将自动动态创建一个新文档。Song.mp3是上载文件的名称。要查看数据库中文件的文档,可以使用find查询-
>db.fs.files.find()
上面的命令返回了以下文档-
{ _id: ObjectId('534a811bf8b4aa4d33fdf94d'), filename: "song.mp3", chunkSize: 261120, uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41", length: 10401959 }
我们还可以使用以下代码,使用上一个查询中返回的文档ID来查看fs.chunks集合中与存储文件相关的所有块:
>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})
就我而言,该查询返回了40个文档,这意味着整个mp3文档被分为40个数据块。