• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    MongoDB索引使用详解

    索引就像书的目录,如果查找某内容在没有目录的帮助下,只能全篇查找翻阅,这导致效率非常的低下;如果在借助目录情况下,就能很快的定位具体内容所在区域,效率会直线提高。

    索引简介

    首先打开命令行,输入mongo。默认mongodb会连接名为test的数据库。

    ➜ ~ mongo
    MongoDB shell version: 2.4.9
    connecting to: test
    > show collections
    > 
    

    可以使用show collections/tables查看数据库为空。

    然后在mongodb命令行终端执行如下代码

    > for(var i=0;i100000;i++) {
    ... db.users.insert({username:'user'+i})
    ... }
    > show collections
    system.indexes
    users
    > 
    

    再查看数据库发现多了system.indexes 和 users两个表,前者即所谓的索引,后者为新建的数据库表。
    这样user表中即有了10万条数据。

    > db.users.find()
    { "_id" : ObjectId("5694d5da8fad9e319c5b43e4"), "username" : "user0" }
    { "_id" : ObjectId("5694d5da8fad9e319c5b43e5"), "username" : "user1" }
    { "_id" : ObjectId("5694d5da8fad9e319c5b43e6"), "username" : "user2" }
    { "_id" : ObjectId("5694d5da8fad9e319c5b43e7"), "username" : "user3" }
    { "_id" : ObjectId("5694d5da8fad9e319c5b43e8"), "username" : "user4" }
    { "_id" : ObjectId("5694d5da8fad9e319c5b43e9"), "username" : "user5" }
    

    现在需要查找其中任意一条数据,比如

    > db.users.find({username: 'user1234'})
    { "_id" : ObjectId("5694d5db8fad9e319c5b48b6"), "username" : "user1234" }
    

    发现这条数据成功找到,但需要了解详细信息,需要加上explain方法

    > db.users.find({username: 'user1234'}).explain()
    {
      "cursor" : "BasicCursor",
      "isMultiKey" : false,
      "n" : 1,
      "nscannedObjects" : 100000,
      "nscanned" : 100000,
      "nscannedObjectsAllPlans" : 100000,
      "nscannedAllPlans" : 100000,
      "scanAndOrder" : false,
      "indexOnly" : false,
      "nYields" : 0,
      "nChunkSkips" : 0,
      "millis" : 30,
      "indexBounds" : {
        
      },
      "server" : "root:27017"
    }
    

    参数很多,目前我们只关注其中的"nscanned" : 100000和"millis" : 30这两项。

    nscanned表示mongodb在完成这个查询过程中扫描的文档总数。可以发现,集合中的每个文档都被扫描了,并且总时间为30毫秒。

    如果数据有1000万个,如果每次查询文档都遍历一遍。呃,时间也是相当可观。

    对于此类查询,索引是一个非常好的解决方案。

    > db.users.ensureIndex({"username": 1})
    

    然后再查找user1234

    > db.users.ensureIndex({"username": 1})
    > db.users.find({username: 'user1234'}).explain()
    {
      "cursor" : "BtreeCursor username_1",
      "isMultiKey" : false,
      "n" : 1,
      "nscannedObjects" : 1,
      "nscanned" : 1,
      "nscannedObjectsAllPlans" : 1,
      "nscannedAllPlans" : 1,
      "scanAndOrder" : false,
      "indexOnly" : false,
      "nYields" : 0,
      "nChunkSkips" : 0,
      "millis" : 0,
      "indexBounds" : {
        "username" : [
          [
            "user1234",
            "user1234"
          ]
        ]
      },
      "server" : "root:27017"
    }
    

    的确有点不可思议,查询在瞬间完成,因为通过索引只查找了一条数据,而不是100000条。

    当然使用索引是也是有代价的:对于添加的每一条索引,每次写操作(插入、更新、删除)都将耗费更多的时间。这是因为,当数据发生变化时,不仅要更新文档,还要更新级集合上的所有索引。因此,mongodb限制每个集合最多有64个索引。通常,在一个特定的集合上,不应该拥有两个以上的索引。

    小技巧

    如果一个非常通用的查询,或者这个查询造成了性能瓶颈,那么在某字段(比如username)建立索引是非常好的选择。但只是给管理员用的查询(不太在意查询耗费时间),就不该对这个字段建立索引。

    复合索引

    索引的值是按一定顺序排列的,所以使用索引键对文档进行排序非常快。

    db.users.find().sort({'age': 1, 'username': 1})
    

    这里先根据age排序再根据username排序,所以username在这里发挥的作用并不大。为了优化这个排序,可能需要在age和username上建立索引。

    db.users.ensureIndex({'age':1, 'username': 1})
    这就建立了一个复合索引(建立在多个字段上的索引),如果查询条件包括多个键,这个索引就非常有用。

    建立复合索引后,每个索引条目都包括一个age字段和一个username字段,并且指向文档在磁盘上的存储位置。
    此时,age字段是严格升序排列的,如果age相等时再按照username升序排列。

    查询方式

    点查询(point query)

    用于查询单个值(尽管包含这个值的文档可能有多个)

    db.users.find({'age': 21}).sort({'username': -1})
    

    因为我们已经建立好复合索引,一个age一个username,建立索引时使用的是升序排序(即数字1),当使用点查询查找{age:21},假设仍然是10万条数据,可能年龄是21的很多人,因此会找到不只一条数据。然后sort({'username': -1})会对这些数据进行逆序排序,本意是这样。但我们不要忘记建立索引时'username':1是升序(从小到大),如果想得到逆序只要对数据从最后一个索引开始,依次遍历即可得到想要的结果。

    排序方向并不重要,mongodb可以从任意方向对索引进行遍历。
    综上,复合索引在点查询这种情况非常高效,直接定位年龄,不需要对结果进行排序,返回结果。

    多值查询(multi-value-query)

    db.users.find({'age': {"$gte": 21, "$lte": 30}})
    

    查找多个值相匹配的文档。多值查询也可以理解为多个点查询。
    如上,要查找年龄介于21到30之间。monogdb会使用索引的中的第一个键"age"得到匹配的结果,而结果通常是按照索引顺序排列的。

    db.users.find({'age': {"$gte": 21, "$lte": 30}}).sort({'username': 1})
    

    与上一个类似,这次需要对结果排序。
    在没有sort时,我们查询的结果首先是根据age等于21,age等于22..这样从小到大排序,当age等于21有多个时,在进行usernameA-Z(0-9)这样排序。所以,sort({'username': 1}),要将所有结果通过名字升序排列,这次不得不先在内存中进行排序,然后返回。效率不如上一个高。

    当然,在文档非常少的情况,排序也花费不了多少时间。
    如果结果集很大,比如超过32MB,MongoDB会拒绝对如此多的数据进行排序工作。

    还有另外一种解决方案

    也可以建立另外一个索引{'username': 1, 'age': 1}, 如果先对username建立索引,当再sortusername,相当没有进行排序。但是需要在整个文档查找age等于21的帅哥美女,所以搜寻时间就长了。

    但哪个效率更高呢?

    如果建立多个索引,如何选择使用哪个呢?
    效率高低是分情况的,如果在没有限制的情况下,不用进行排序但需要搜索整个集合时间会远超过前者。但是在返回部分数据(比如limit(1000)),新的赢家就产生了。

    >db.users.find({'age': {"$gte": 21, "$lte": 30}}).
    sort({username': 1}).
    limit(1000).
    hint({'age': 1, 'username': 1})
    explain()['millis']
    2031ms
    
    >db.users.find({'age': {"$gte": 21, "$lte": 30}}).
    sort({username': 1}).
    limit(1000).
    hint({'username': 1, 'age': 1}).
    explain()['millis']
    181ms
    
    

    其中可以使用hint指定要使用的索引。
    所以这种方式还是很有优势的。比如一般场景下,我们不会把所有的数据都取出来,只是去查询最近的,所以这种效率也会更高。

    索引类型

    唯一索引

    可以确保集合的每个文档的指定键都有唯一值。

    db.users.ensureIndex({'username': 1, unique: true})
    比如使用mongoose框架,在定义schema时,即可指定unique: true.
    如果插入2个相同都叫张三的数据,第二次插入的则会失败。_id即为唯一索引,并且不能删除。

    稀疏索引

    使用sparse可以创建稀疏索引

    >db.users.ensureIndex({'email': 1}, {'unique': true, 'sparse': true})

    索引管理

    system.indexes集合中包含了每个索引的详细信息

    db.system.indexes.find()

    1.ensureIndex()创建索引

    db.users.ensureIndex({'username': 1})
    后台创建索引,这样数据库再创建索引的同时,仍然能够处理读写请求,可以指定background选项。

    db.test.ensureIndex({"username":1},{"background":true})

    2.getIndexes()查看索引

    db.collectionName.getIndexes()
    db.users.getIndexes()
    [
      {
        "v" : 1,
        "key" : {
          "_id" : 1
        },
        "ns" : "test.users",
        "name" : "_id_"
      },
      {
        "v" : 1,
        "key" : {
          "username" : 1
        },
        "ns" : "test.users",
        "name" : "username_1"
      }
    ]
    

    其中v字段只在内部使用,用于标识索引版本。

    3.dropIndex删除索引

    > db.users.dropIndex("username_1")
    { "nIndexesWas" : 2, "ok" : 1 }
    

    全选复制放进笔记> db.users.dropIndex({"username":1})

    您可能感兴趣的文章:
    • MongoDB中唯一索引(Unique)的那些事
    • MongoDB的基础查询和索引操作方法总结
    • MongoDB中创建索引需要注意的事项
    • MongoDB性能篇之创建索引,组合索引,唯一索引,删除索引和explain执行计划
    • 深入理解MongoDB的复合索引
    • mongodb处理中文索引与查找字符串详解
    • MongoDB查询字段没有创建索引导致的连接超时异常解案例分享
    • 关于MongoDB索引管理-索引的创建、查看、删除操作详解
    • MongoDB自动删除过期数据的方法(TTL索引)
    • 关于对MongoDB索引的一些简单理解
    上一篇:Mongodb 删除添加分片与非分片表维护
    下一篇:使用aggregate在MongoDB中查询重复数据记录的方法
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    MongoDB索引使用详解 MongoDB,索引,使用,详解,MongoDB,