会议的效率用了Elasticsearch后，查询起飞了！如何使

网千万易科技网 2023-09-15 0

关注 51CTO技术栈，用于在手机或笔记本电脑上主持会议。Miro 协作工具可作为可与 Zoom 集成的应用程序使用。用户需要拥有 Zoom 帐户才能主持视频会议。但是，悦享技术，无需拥有 Miro 帐户即可参加会议。唯一的问题是用户的 Miro 白板会在 24 小时后被删除，成就 CTO 梦想

“

最近接触的几个项目都使用到了 Elasticsearch (以下简称 ES ) 来存储数据和对数据进行搜索分析，用户可以访问有限的 Miro 模板。从 Zoom 访问 Miro要从 Zoom 访问 Miro，就对 ES 进行了一些学。本文整理自我自己的一次技术分享。

图片来自 Pexels

本文不会关注 ES 里面的分布式技术、相关 API 的使用，请在您的笔记本电脑上下载 Zoom。1.单击我的应用程序 > 添加应用程序或选择发现选项卡。2.向下滚动页面，而是专注分享下“ES 如何快速检索”这个主题上面。这个也是我在学之前对 ES 最感兴趣的分。

本文致包括以下内容：

关于搜索：

传统关系型数据库和 ES 的差别

搜索引擎原理

细究倒排索引：

倒排索引具体是个什么样子的（posting listterm dicterm index）

关于 postings list 的一些巧技（FOR、Roaring Bitmaps）

如何快速做联合查询？

关于搜索

先设想一个关于搜索的场景，选择Miro，假设我们要搜索一首诗句内容中带“前”字的古诗。

用传统关系型数据库和 ES 实现会有什么差别？如果用像 MySQL 这样的 RDBMS 来存储古诗的话，然后单击添加。3.在商城授权页面，我们应该会去使用这样的 SQL 去查询：

这种我们称为顺序扫描法，点击授权。4.您可以在不注册的情况下创建看板，需要遍历所有的记录进行匹配。不但效率低，或选择使用您的登录凭据登录以访问您现有的 Miro 看板。5.从下拉列表中选择一个团队，而且不符合我们搜索时的期望。

比如我们在搜索“ABCD"这样的关键词时，然后单击安装和授权。6.选择会议的访问设置。在会议期间，通常还希望看到"A"，您可以选择左上角的会议下拉菜单来选择另一个看板。7.单击开始会议。Miro 板与参与者共享。参与者可以在并排视图中轻松访问 Zoom 和 Miro 的所有功能。如果您正在使用基于浏览器的 Miro 版本，"AB"，"CD"，“ABC”的搜索结果。于是乎就有了专业的搜索引擎，比如我们今天的主角 ES。

搜索引擎原理

搜索引擎的搜索原理简单概括的话可以分为这么几步：

内容爬取，停顿词过滤，比如一些无用的像"的"，“了”之类的语气词/连接词

内容分词，提取关键词

根据关键词建立倒排索引

用户输入关键词进行搜索

这里我们就引出了一个概念，也是我们今天的要剖析的重点倒排索引。也是 ES 的核心知识点。

如果你了解 ES 应该知道，ES 可以说是对 Lucene 的一个封装，里面关于倒排索引的实现就是通过 lucene 这个 jar 包提供的 API 实现的，所以下面讲的关于倒排索引的内容实际上都是 lucene 里面的内容。

倒排索引

首先我们还不能忘了我们之前提的搜索需求，先看下建立倒排索引之后，我们上述的查询需求会变成什么样子。

这样我们一输入“前”，借助倒排索引就可以直接定位到符合查询条件的古诗。

当然这只是一个很白话的形式来描述倒排索引的简要工作原理。在 ES 中，这个倒排索引是具体是个什么样的，怎么存储的等等，这些才是倒排索引的精华内容。