当前位置: 首页 > news >正文

数据库 - 一文看懂MongoDB

1. 前言

MongoDB 是一种基于文档的 NoSQL 数据库管理系统,使用 JSON 样式的 BSON 格式存储数据,具有灵活的数据模型和良好的扩展性,适用于大数据、高并发和快速开发的场景。

2. MongoDB结构

数据库(Database):MongoDB中的数据库是一个容器,包含了多个集合。

集合(Collection):类似关系数据库中的表,存储在数据库当中。文档存放在集合中不需要相同的结构

文档(Document):MongoDB中的数据记录,使用BSON(二进制JSON)的形式存储,包含嵌套的键值对,数组等文档

字段(Field):文档的键值对

{"_id": ObjectId("507f1f77bcf86cd799439011"),"name": "Alice","age": 25,"address": {"city": "New York","zip": "10001"}
}

3. 安装

Windows用户可以直接进入官网进行安装

安装网址:Download MongoDB Community Server | MongoDB

Mac用户可以通过终端进行安装,以Mac用户为例,使用Homebrew

3.1 Homebrew

Homebrew 是 macOS 上的一个包管理器,旨在帮助用户简便地安装、更新和管理软件包(软件和工具)。Homebrew 类似于 Linux 系统上的 apt 或 yum,可以自动解决软件的依赖关系并简化安装流程。

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

在Homebrew中提供了以下命令方便后续安装包

安装软件包

brew install <package_name>

更新Homebrew及其软件库

brew update

升级已经安装的软件

brew upgrade

列出已安装的软件

brew lost

卸载软件包

brew uninstall <package_name>

3.2 安装

在终端中输入以下指令,从Homebrew中下载MongoDB

brew tap mongodb/brew
brew install mongodb-community

4. 启动

在终端中

brew services start mongodb/brew/mongodb-community

如果下载了MongDB Shell

可以在终端中输入以下命令进入MongoDB Shell

mongo

5. 基于python的MongoDB的使用

5.1 连接MongoDB

from pymongo import MongoClient
client = MongoClient("mongodb://localhost:27017/") #本地与MongoDB进行连接配置# 连接到数据库(如果数据库不存在,将在插入数据时自动创建)
db = client["my_database"] #创建数据库

在python中使用mongoDB需要使用本地与其连接,可以想象为使用python打开了mongoDB这个程序,下一步就是在程序中打开或者创建我们的数据库

语法类似于pandas中DataFrame创建新的列

5.2 创建&插入

collection = db['collection']

在数据库中创建新的集合,类比SQLite创建一张表格用于存储信息 

- 插入一条文档

document = {'name':'Alice','age':18,'sex':'Female'}
collection.insert_one(document)

在所对应的集合中插入一条文档,文档的格式必须以字典的形式进行,因为MongDB数据库存储noSQL类型的数据

- 插入多个文档

documents = [{'name':'Louis','age':22,'sex':'Male'},{'name':'Ricardo','age':21,'sex':'Male'}]
collection.insert_many(documents)

面临有多个文档,使用insert_many函数

5.3 查询数据

 5.3.1 基本查询

 • 查询一条文档

result = collection.find_one({"name": "Alice"})
print(result)

• 查询多个文档

results = collection.find()
for result in results:print(result)

针对多项数据,MongoDB不会直接返回数据内容,而是返回一个游标对象

游标对象(Cursor)是一种用于逐行遍历和操作数据记录的对象,通常在处理数据库或大数据集时使用。游标对象可以让我们在不一次性加载所有数据到内存的情况下,逐步获取数据,避免因数据量过大导致的内存溢出问题。

通过遍历与循环我们可以将游标对象内部的数据获取

5.3.2 条件查询

collection.find_one({'name':'Alice'})

条件判断的形式是在函数内部传入一个{'key':value},以字典的形式进行传递

collection.find_one({'age':{'$lte':20}})

还可以使用比较运算符进行一些较为复杂的比较,形式为仍然以字典的形式进行传递,{'key':{'条件判断':用于判断的值}}

以下是MongoDB支持的比较运算符语法

$gt大于
$lt小于
$gte大于等于
$lte小于等于
$ne不等于

5.3.3 逻辑运算符

使用逻辑运算符进行更为严格且细致的筛选数据

collection.find_one({'$and':[{'age':{'$gte':18}},{'name':'Ricardo'}]})

传入形式仍然是{}字典形式,内容格式{'逻辑运算符':[{},{}]},通过数组[]表达式进行不同条件的连接,在其内部的判断条件语法与正常的比较运算一致

$and与/且
$or
$not
$nor都不满足

5.4 更新文档

collection.update_one({'name':'Alice'},{'$set':{'age':20}})

在MongoDB中语法段的分割几乎都是使用{}

更新文档数据内容使用update_one函数,其中第一项传入条件判断,找到需要被更新的文档;第二项传入更新文档的内容,上述的例子将age的值修改为20 

5.5 删除文档

db.my_collection.delete_one({ name: "Alice" })
db.my_collection.delete_many({ age: { $lt: 30 } })

传入一个条件判断,删除对应的文档

deleteOne函数删除单条文档;deleteMany函数删除多条文档

5.6 索引与性能优化

创建索引,根据索引进行查找可以加速查询,但会占用内存空间;以空间换时间

创建索引

db.my_collection.createIndex({ age: 1 })  // 1表示升序,-1表示降序

查看所有索引 

db.my_collection.getIndexes()

删除索引 

db.my_collection.dropIndex("age_1")

5.7 关闭连接

5.7.1 手动关闭

client.close()

5.7.2 自动关闭

使用 with 语句(上下文管理器)来自动管理连接,离开 with 代码块后会自动关闭连接:

from pymongo import MongoClientwith MongoClient("mongodb://localhost:27017/") as client:db = client["my_database"]collection = db["my_collection"]# 执行查询或其他操作for document in collection.find():print(document)
# 离开 'with' 块后,连接会自动关闭

之后在终端中退出MongoDB

exit

6. MongoDB shell与Python中语句的区别

MongoDB Shell使用的是JavaScript风格的命令行语法,而PyMongo则是Python语言的语法

MongoDB Shell中的函数首个单词一般是小写紧接着的单词首字母大写,pymongo则使用下划线"_"进行分割

例如delete_one函数,在MongoDB Shell中语法为deleteOne

7. MongoDB的优点与缺点

7.1 优点

- 灵活的数据模型:MongoDB使用文档存储(BSON格式),允许存储复杂的数据结构。这种灵活性使得数据库能够适应变化的需求,不需要事先定义模式。

- 高性能:MongoDB在读写操作上表现出色,特别是在处理大规模数据时。通过内存映射文件和高效的索引机制,它能够快速检索数据。

- 横向扩展能力:MongoDB支持水平扩展,可以通过分片(sharding)将数据分布在多个服务器上,以处理不断增长的存储需求和负载。

7.2 缺点

- 数据冗杂:为了实现高性能,MongoDB常常采用数据冗余的方式(例如,嵌套文档)。这可能导致数据的一致性问题,需要在应用层进行额外的管理。

- 缺乏复杂的查询能力:虽然MongoDB支持多种查询,但某些复杂的查询(如连接查询)可能不如关系数据库容易实现,或者需要更多的开发工作。

- 内存使用高:MongoDB依赖于内存映射来提高性能,可能需要更多的内存资源来有效运行。大规模的数据集可能导致高内存消耗。


http://www.mrgr.cn/news/67542.html

相关文章:

  • 使用k8s RBAC和ValidatingAdmissionPolicy 配合来校验用户权限
  • cuda 环境搭建
  • hive表内外表之间切换
  • Python进阶之IO操作
  • (六)继Numpy模块之后-如何下载和使用jupyter notebook
  • 制作python的Dockerfile
  • encodeURIComponent和decodeURIComponent的使用场景
  • Misère Nim game
  • 支持高性能结构化数据提取的 Embedding 模型——NuExtract-v1.5
  • 【Python】遇到pandas 和numpy版本不兼容怎么办?
  • 船舶终端设备维修服务设计
  • uniapp开发APP后台保活机制
  • leetcode 3255 长度为 K 的子数组的能量值 II 中等
  • 五个高质量的视频素材下载网站,助力创作更高效
  • wxWidgets GUI设计教程 - 常用控件与复杂布局
  • 脉冲全闭环EtherCAT运动控制器的固件升级
  • linux驱动-i2c子系统框架学习(2)
  • 【测试语言篇二】Python进阶篇:lambda函数、异常和错误处理、Json处理、随机数、星号操作符
  • 钉钉调试微应用整理2
  • 海云安入选软件供应链安全十大代表厂商,软件供应链安全创新成果获认可
  • (十四)JavaWeb后端开发——MyBatis
  • 【Python】轻松解析JSON与XML:Python标准库的json与xml模块
  • 深度学习经典模型之Network in Network
  • 【单例模式】饿汉式与懒汉式以及线程安全
  • 嵌入向量模型与BM25算法结合:并行检索获取多种结果
  • 常见几种GB 9706.1-2020医疗器械试验工装,您有所了解吗?