Mongodb实战之全文搜索功能-巨人网络通讯

Mongodb实战之全文搜索功能

前言

众所周知在传统的关系型数据库中，我们通常将数据结构化，通过一系列表关联、聚合来查询我们所需的结果。而在非结构化的数据中，缺少这种预定义的结构，因而如何快速查询定位到我们所需要的结果，不是一件容易的事。

Mongodb作为一种NoSQL数据库，非常适合存储和管理非结构化数据，例如互联网上的各种文本数据。假如我们用Mongodb存储了很多博客文章，那么如何快速找到所有关于“nodejs”这个主题的文章呢？Mongodb内建的全文搜索可以帮助我们完成这个功能。下面话不多说了，来一起看看详细的介绍：

在本篇博文中，将要介绍的是我使用Mongdb text search的一些经验。

Mongodb text search是什么？

Mongodb text search是Mongodb对数据库进行搜索的功能模块，类似于数据库内建的搜索引擎。有些人可能会疑问，查数据库为什么还需要搜索引擎？直接用条件查询不就得了。例如在前面的文章主题搜索中，我们不可能事先提取出每篇文章的主题，然后用专门的字段存储，因此没办法进行条件查询。并且同一个主题词，有多种不同的表达方式，例如”node”、”nodejs”可视为同一个主题。

Mongodb text search可以自动地对大段的文本数据进行分词处理、模糊匹配、同义词匹配，解决文本搜索的问题。

建立文本索引

要使Mongodb能够进行全文搜索，首先要对搜索的字段建立文本索引。建立文本索引的关键字是text，我们既可以建立单个字段的文本索引，也可以建立包含多个字段的复合文本索引。需要注意的是，每个collection只能建立一个文本索引，且只能对String或String数组的字段建立文本索引。

我们可以通过以下命令，建立一个文本索引：

db.collection.createIndex({ subject: "text", content: "text" })

在mongoose中我们可以通过以下代码，创建文本索引：

schema.index({ subject: "text", content: "text" })

需要注意的是：由于每个collection只支持一个文本索引，所以当你需要在schema中添加或删除文本索引字段时，往往不起作用。这时候你需要到数据库中，手动删除已经建立的文本索引。

文本搜索示例

文本搜索的语法为：

{
 $text:
  {
   $search: string>,
   $language: string>,
   $caseSensitive: boolean>,
   $diacriticSensitive: boolean>
  }
}

在mongoose中，我们可以通过以下语句进行文本搜索：

var query = model.find({ $text: { $search: "hello world" } })

$search后面的关键词可以有多个，关键词之间的分隔符可以是多种字符，例如空格、下划线、逗号、加号等，但不能是-和\"，因为这两个符号会有其他用途。搜索的多个关键字是or的关系，除非你的关键字包含-。例如hello world会包含所有匹配hello或world的文本，而hello -world只会匹配包含hello且不包含world的文本。

$language指示搜索的语言类型，在最新的Mongodb 3.2 enterprise版本中，已经增加了对中文文本的搜索。

$caseSensitive设置是否区分大小写。

$diacriticSensitive设置是否区别发音符号，CAFÉ于Café是同一语义，只是重音不一样。

我们还可以对搜索的结果按匹配度进行排序：

db.posts.find(
  { $text: { $search: "hello world" } },
  { score: { $meta: "textScore" } }
).sort( { score: { $meta: "textScore" } } )

注意事项

Mongodb建立文本索引时，会对提取所有文本的关键字建立索引，因而会造成一定的性能问题。所以对于结构化的字段，建议用普通的关系查询，如果需要对大段的文本进行搜索，才考虑用全文搜索。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对脚本之家的支持

您可能感兴趣的文章:

MongoDB 使用Skip和limit分页
利用node.js+mongodb如何搭建一个简单登录注册的功能详解
mac下安装和配置mongodb的步骤详解
Windows下MongoDb简单配置教程
在Linux服务器中配置mongodb环境的步骤
Mongodb实现的关联表查询功能【population方法】
MongoDB 中Limit与Skip的使用方法详解

上一篇：mac下安装和配置mongodb的步骤详解
下一篇：Mongo复制集同步验证的实例详解

Mongodb实战之全文搜索功能

前言众所周知在传统的关系型数据库中，我们通常将数据结构化，通过一系列表关联、聚合来查询我们所需的结果。而在非结构化的数据中，缺少这种预定义的结构，因而如何快速查询Mongodb,实战,之,全文,搜索,...

地图上怎么显示标签入驻？百度地图上怎么显示标签入驻

快手怎么入驻开店？打开快手，点击菜单图标，点击更多并打开小店订单，点击我要开...

不可或缺的重点

其实大部分都是在不断完善自己,完善自己所做的事,这样的上进心是不可或缺的,而我们...

Postgresql 实现查询一个表/所有表的所有列名

假设postgres有数据库testdb 在testdb下执行下列sql语句，得到所有表的信息 select * from inf...

外呼系统分机不可用（外呼系统合法吗）

本文目次一览： 1、w7电脑体系不克不及给电脑分级如何办？ 2、分级浮现体系分级不可...

什么是电话机器人云呼_电话机器人

电话机器人在进行群呼时，会筛选出意向客户，并快速将意向客户根据A、B、C、D、E类...

常州电销防封线路

常州电销防封线路,办理常州电销防封线路,常州电销防封线路办理电销防封线路全国套...

有关HTML5页面在iPhoneX适配问题

1. iPhoneX的介绍屏幕尺寸我们熟知的iPhone系列开发尺寸概要如下： △ iPhone各机型的开...

CentOS下如何避免文件覆盖?

[root@stu227 he]# touch he.txt [root@stu227 he]# set -o noclobber [root@stu227 he]# echo 123 he.txt bash: he.tx...

电话机器人外呼模式（电话外呼智能机器人）

今天给各位分享电话机器人外呼模式的知识，其中也会对电话外呼智能机器人进行解释...

山东办电销卡哪种卡好

山东办电销卡哪种卡好电销卡的使用成本相对来说是比较低的，一般来说都是套餐服务...

400电话办理的费用是多少呢400电话收费标准之利与弊

企业400电话处理非常简单，只要预存电话费，免费发送400电话号码，也可以免开户，免...

四川电话机器人好用吗（四川电话机器人好用吗现在）

本文目录一览： 1、电话机器人有用吗？2、电话机器人使用起来如何？3、电话机器人好...

Linux shell数组循环的实例详解

shell数组循环测试shell数组，循环的例子： arr=("a" "b" "c") echo "所有的内容如下："${arr...

我在哪里可以拨打常规 400 电话？

我在哪里可以拨打常规 400 电话？是一家专业的400电话增值服务商，成立于2005年，十年...

上海移动小顺子系列手机靓号15900990789

Mongodb实战之全文搜索功能

全 部 栏 目

全部栏目