栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

ElasticSearch 倒排索引

ElasticSearch 倒排索引

倒排索引:是 es 中非常重要的索引结构,是从文档词项到文档 ID 的一个映射过程。

“正排索引”
我们在关系型数据库中见到的索引,就是“正排索引”。

关系型数据库中的索引如下,假设我有一个博客表:

id作者标题内容
1gblfy倒排索引标题具体内容xxx
2心灵之境es中文分词器标题具体内容xxx

一般为了提高查询效率查会给id或者标题添加索引。换句话说我们可以针对这个表建立索引(正排索引):

索引内容
1具体内容xxx
2具体内容xxx
倒排索引标题具体内容xxx
es中文分词器标题具体内容xxx

以上就是以id和标题创建的4个索引
当我们通过 id 或者标题去搜索文章时,就可以快速搜到。

但是,如果我们按照文章内容的关键字去搜索,就只能去内容中做字符匹配了(select * from 表 where 字段 like ‘%关键词%’)。为了提高查询效率,就要考虑使用倒排索引。

倒排索引
倒排索引:就是以内容的关键字建立索引,通过索引找到文档 id,再进而找到整个文档。

索引文档id=1文档id=2
java
es
gblfy

一般来说,倒排索引分为两个部分:

  • 单词词典(记录所有的文档词项,以及词项到倒排列表的关联关系(例如:上面的表格))
  • 倒排列表(记录单词与对应的关系,由一系列倒排索引项组成,倒排索引项指:文档 id、词频(TF)(词项在文档中出现的次数,评分时使用)、位置(Position,词项在文档中分词的位置)、偏移(记录词项开始和结束的位置))
    当我们去索引一个文档时,就回建立倒排索引,搜索时,直接根据倒排索引搜索。
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/654368.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号