MongoDB释放空闲空间的几种常用方法-巨人网络通讯

MongoDB释放空闲空间的几种常用方法

前言

当我们从MongoDB中删除文档或集合时，MongoDB并不会将已经占用了的磁盘空间释放，它会一直维护已经占用了磁盘空间的数据文件，尽管数据文件中可能存在大大小小的空记录列表（empty record list）。当客户端程序再次插入文档时，MongoDB会从空记录列表中分配存储空间给新文档。那么为了更加有效的使用磁盘空间，我们需要对mongodb的数据文件做碎片整理以及未使用空间的回收。思想无非两种：

1、对原数据进行重组

2、仅将数据复制出来，形成仅数据的完整备份

以下介绍几种常用的实施方法：

1、compact

2、db.repairDatabase()

3、secondary节点重同步

4、db.copyDatabase()

一、compat

官网对该命令的定义：对集合中的所有数据和索引进行重写和碎片整理。

使用方法

use yourdatabase;
db.runCommand({ compact : 'yourCollection' });

注意事项

1、在执行命令前请保证你有比较新的备份

2、在使用MMAPv1存储引擎的MongoDB上compact需要数据文件所在分区至少有2G的空闲空间

3、在使用WiredTiger存储引擎的MongoDB上，compact命令将重写集合和索引，且释放未使用的空间，但使用MMAPv1存储引擎的MongoDB上，该命令只对集合的数据文件进行碎片整理并重新创建其索引。不会释放空间，在使用MMAPv1存储引擎的MongoDB上回收空间，建议使用第三种方法“secondary节点重同步”

4、使用MMAPv1存储引擎的MongoDB中的Capped Collections，是无法被压缩的，但使用WiredTiger存储引擎的MongoDB在执行compact时会进行压缩。

5、在副本集上运行该命令时，要分别在每个节点执行

6、该命令只能在mongod实例上执行，不能再mongos实例上运行。也就是说针对分片集群的compact操作要分别在每个分片节点上执行。

7、一般该命令运行在secondary节点上，在执行时，会强制节点进入RECOVERING状态，RECOVERING状态的实例读写操作将被阻塞

8、再碰到特殊情况要停止运行该命令时，可通过db.currentOp()查询进程信息，然后通过db.killOp()干掉进程

9、compact可能会增加数据文件的总大小和数量，尤其是第一次运行时。但这不会增加总集合使用的磁盘空间，因为存储大小是数据库文件中分配的数据量，而不是文件系统上文件的大小/数量

10、使用MMAPv1存储引擎的MongoDB中的Capped Collections，是无法被压缩的，但使用WiredTiger存储引擎的MongoDB在执行compact时会进行压缩。

二、db.repairDatabase()

官网该命令的定义：通过丢无效或损坏的数据老重建数据库和索引。类似于文件系统修复命令fsck。所以此命令主要是用于修复数据。

使用方法

use yourdatabase;
db.repairDatabase();

注意事项

1、db.repairDatabase()主要用于修复数据。若你拥有数据的完整副本，且有权限访问，请使用第三种方法“secondary节点重同步”

2、在执行命令前请保证你有比较新的备份

3、此命令会完全阻塞数据库的读写，谨慎操作

4、此命令执行需要数据文件所在位置有等同于所有数据文件大小总和的空闲空间再加上2G

5、在使用MMAPv1存储引擎的secondary节点上执行该命令可以压缩集合数据

6、在使用WiredTiger存储引擎的MongoDB库上执行不会有压缩的效果

7、再碰到特殊情况要停止运行该命令时，可通过db.currentOp()查询进程信息，然后通过db.killOp()干掉进程

8、非常消耗时间

三、secondary节点重同步

主要思想就是：删除secondary节点中指定数据，使之与primary重新开始数据同步。当副本集成员数据太过陈旧，也可以使用重新同步。数据的重新同步与直接复制数据文件不同，MongoDB会只同步数据，因此重同步完成后的数据文件是没有空集合的，以此实现了磁盘空间的回收。

使用方法

首先必须确保数据有完整的备份。

1、若是primary节点，先强制将之变为secondary节点，否则跳过此步骤：

 rs.stepdown(120)；

2、然后在primary上删除secondary节点：

 rs.remove("IP:port");

3、删除secondary节点dbpath下的所有文件。

4、将节点重新加入集群，然后使之自动进行数据的同步：

 rs.add("IP:port");

5、等数据同步完成后，循环1-4的步骤可以将集群中所有节点的磁盘空间释放

针对一些特殊情况，不能下线secondary节点的，可以新增一个节点到副本集中，然后secondary就自动开始数据的同步了。

总的来说，重同步的方法是比较好的，第一基本不会阻塞副本集的读写，第二消耗的时间相对前两种比较短

四、db.copyDatabase()

mongodb还支持在线复制数据：db.copyDatabase("from","to","IP:port"),此种方法也能释放空间，因为db.copyDatabase复制的数据，而不是表示在磁盘中的数据文件。但，该命令在4.0版本起被弃用；3.x版本还能继续使用

如：

 db.copyDatabase("sourceDB","DistDB");

将源库sourceDB。拷贝为DistDB。

当然，该命令支持远程复制。

该命令的完整语法为：

db.copyDatabase(源数据库名称>, 目标数据库名称>, 源mongodb的IP：port>, 源数据库连接需要的账户>,密码>, mechanism>)

以上：命令必须在目标数据库服务器上执行。若源数据库与目标数据库存在于一个MongoDB服务器，源mongodb的IP：port>, 源数据库连接需要的账户>,密码>都可省略。mechanism>是身份验证类型，可选的。

注意事项

1、db.copyDatabase()不会阻塞源数据库和目标数据库数据的读写，因此可能会出现两份数据不一致的情况

2、db.copyDatabase()复制索引数据会锁定数据库，此操作也会对其他数据库产生影响

3、db.copyDatabase()不要在mongos实例中使用

4、db.copyDatabase()不要用于复制包含分片集合的数据库

5、在4.0版中更改：db.copyDatabase()仅支持SCRAM进行身份验证fromhost，mechanism>选项。

6、某些不同版本的MongoDB间不支持此种复制方法，详见链接：https://docs.mongodb.com/manual/reference/method/db.copyDatabase/

除此之外，还有一些方法，像使用导入/导出的方法（mongodump/mongorestore），这种方法在数据量非常大的情况是不适用的，因为导入导出的方法使用的全量的形式，要保证有足够的空闲空间来存放导入的数据。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

mongodb 集群重构和释放磁盘空间实例详解
详解清除MongoDB所占用的多余的磁盘空间的方法
OpenStack Ceilometer用MongoDB解决占用磁盘空间过大问题
巧妙的利用Mongodb做地理空间查询

上一篇：mongodb基础之用户权限管理实例教程
下一篇：db.serverStatus()命名执行时报无权限问题的解决方法

MongoDB释放空闲空间的几种常用方法

前言当我们从MongoDB中删除文档或集合时，MongoDB并不会将已经占用了的磁盘空间释放，它会一直维护已经占用了磁盘空间的数据文件，尽管数据文件中可能存在大大小小的空记录列表（MongoDB,释,放空,闲空,间的,...

Linux shell数组循环的实例详解

shell数组循环测试shell数组，循环的例子： arr=("a" "b" "c") echo "所有的内容如下："${arr...

山东办电销卡哪种卡好

山东办电销卡哪种卡好电销卡的使用成本相对来说是比较低的，一般来说都是套餐服务...

不可或缺的重点

其实大部分都是在不断完善自己,完善自己所做的事,这样的上进心是不可或缺的,而我们...

CentOS下如何避免文件覆盖?

[root@stu227 he]# touch he.txt [root@stu227 he]# set -o noclobber [root@stu227 he]# echo 123 he.txt bash: he.tx...

上海移动小顺子系列手机靓号15900990789

什么是电话机器人云呼_电话机器人

电话机器人在进行群呼时，会筛选出意向客户，并快速将意向客户根据A、B、C、D、E类...

电话机器人外呼模式（电话外呼智能机器人）

今天给各位分享电话机器人外呼模式的知识，其中也会对电话外呼智能机器人进行解释...

400电话办理的费用是多少呢400电话收费标准之利与弊

企业400电话处理非常简单，只要预存电话费，免费发送400电话号码，也可以免开户，免...

有关HTML5页面在iPhoneX适配问题

1. iPhoneX的介绍屏幕尺寸我们熟知的iPhone系列开发尺寸概要如下： △ iPhone各机型的开...

我在哪里可以拨打常规 400 电话？

我在哪里可以拨打常规 400 电话？是一家专业的400电话增值服务商，成立于2005年，十年...

地图上怎么显示标签入驻？百度地图上怎么显示标签入驻

快手怎么入驻开店？打开快手，点击菜单图标，点击更多并打开小店订单，点击我要开...

四川电话机器人好用吗（四川电话机器人好用吗现在）

本文目录一览： 1、电话机器人有用吗？2、电话机器人使用起来如何？3、电话机器人好...

常州电销防封线路

常州电销防封线路,办理常州电销防封线路,常州电销防封线路办理电销防封线路全国套...

外呼系统分机不可用（外呼系统合法吗）

本文目次一览： 1、w7电脑体系不克不及给电脑分级如何办？ 2、分级浮现体系分级不可...

Postgresql 实现查询一个表/所有表的所有列名

假设postgres有数据库testdb 在testdb下执行下列sql语句，得到所有表的信息 select * from inf...

MongoDB释放空闲空间的几种常用方法

全 部 栏 目

全部栏目