MongoDB 核心概念
在 MongoDB 中基本的概念是数据库 database**、集合 collection、文档 document
在 MongoDB 中部分概念与 SQL 概念相对应:
SQL 术语/概念 | MongoDB 术语/概念 | 解释/说明 |
---|---|---|
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | \ | 表连接,MongoDB 不支持 |
primary key | primary key | 主键,MongoDB 自动将 _id 字段设置为主键 |
数据库
一个 MongoDB 实例中可以容纳多个数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。默认数据库为 db
,存储在 data
目录中。
数据库也通过名字来标识,数据库名可以是满足以下条件的任意 UTF-8 字符串:
- 不能是空字符串
""
- 不得含有
' '
(空格)、.
、$
、/
、\
和\0
(空宇符) - ==应全部小写==
- 最多 64 字节
有一些数据库名是保留的,可以直接访问这些有特殊作用的数据库:
admin
: 从权限的角度来看,这是 "root" 数据库,要是将一个用户添加到这个数据库,这个用户自动继承所有数据库的权限。一些特定的服务器端命令也只能从这个数据库运行,如列出所有的数据库或关闭服务器local
:这个数据永远不会被复制,可以用来存储限于本地单台服务器的任意集合config
:当 MongoDB 用于分片设置时,config
数据库在内部使用,用于保存分片的相关信息
集合
集合存在于数据库中,是 MongoDB 文档的集合,类似于 SQL 中的表格。集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。
集合命名规范:
- 集合名不能是空字符串
""
- 集合名不能含有
\0
字符(空字符),这个字符表示集合名的结尾 - 集合名不能以
system.
开头,这是为系统集合保留的前缀 - 用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含,这是因为某些系统生成的集合中包含该字符,除非你要访问这种系统创建的集合,否则千万不要在名字里出现
$
文档
文档是一个键值 key-value 对(即BSON),MongoDB 的集合不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 MongoDB 非常突出的特点。
虽然文档存储的数据很自由,但还有一些限制:
- 文档中的键/值对是有序的
- MongoDB 的文档不能有重复的键
- MongoDB 区分类型和大小写
MongoDB 中常用的几种数据类型:
数据类型 | 描述 |
---|---|
String | 字符串。在 MongoDB 中 UTF-8 编码的字符串才是合法的 |
Integer | 整型数值。用于存储数值,根据你服务器可分为 32 位或 64 位 |
Boolean | 布尔值 |
Double | 双精度浮点值。用于存储浮点值 |
Min/Max keys | 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比 |
Arrays | 用于将数组或列表或多个值存储为一个键 |
Timestamp | 时间戳。记录文档修改或添加的具体时间 |
Object | 用于内嵌文档 |
Null | 用于创建空值 |
Symbol | 符号。该数据类型基本上等同于字符串类型,但不同的是它一般用于采用特殊符号类型的语言 |
Date | 日期时间。用 UNIX 时间格式来存储当前日期或时间,也可以传入年月日信息创建 Date 对象指定自己的日期时间。 |
Object ID | 对象 ID。用于创建文档的 ID |
Binary Data | 二进制数据 |
Code | 代码类型。用于在文档中存储 JavaScript 代码 |
Regular expression | 正则表达式类型 |
Tip
文档中的值不仅可以是字符串,还可以是其他几种数据类型,甚至可以是整个嵌入的文档;而文档的键则必须是字符串,除了少数例外情况,键可以使用任意 UTF-8 字符。
文档键 key 命名规范:
- 键不能含有
\0
(空字符),这个字符用来表示键的结尾。 .
和$
有特别的意义,只有在特定环境下才能使用。- 以下划线
_
开头的键是保留的(不是严格要求的)。
元数据
数据库的元信息存储在系统集合中,使用了系统的命名空间 dbname.system.*
,该集合包含多种系统信息
集合命名空间 | 描述 |
---|---|
dbname.system.namespaces | 列出所有名字空间 |
dbname.system.indexes | 列出所有索引 |
dbname.system.profile | 包含数据库概要 profile 信息 |
dbname.system.users | 列出所有可访问数据库的用户 |
dbname.local.sources | 包含复制对端 slave 的服务器信息和状态 |
Tip
对于修改系统集合中的对象有如下限制:
- 在
system.indexes
插入数据,可以创建索引,但除此之外该表信息是不可变的(特殊的drop index
命令将自动更新相关信息) system.users
是可修改的system.profile
是可删除的