Elasticsearch基础入门

简介

The Elastic Stack, 包括 Elasticsearch、 Kibana、 Beats 和 Logstash（也称为 ELK Stack）。能够安全可靠地获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。

Elaticsearch，简称为 ES， ES 是一个开源的高扩展的分布式全文搜索引擎，是整个 ElasticStack 技术栈的核心。

它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服务器，处理 PB 级别的数据。

入门

官方网址

官方文档

Elasticsearch 7.8.0下载页面

启动

测试工具

如果直接通过浏览器向 Elasticsearch 服务器发请求，那么需要在发送的请求中包含 HTTP 标准的方法，而 HTTP 的大部分特性且仅支持 GET 和 POST 方法。所以为了能方便地进行客户端的访问，可以使用 Postman 软件Postman 是一款强大的网页调试工具，提供功能强大的 Web API 和 HTTP 请求调试。

软件功能强大，界面简洁明晰、操作方便快捷，设计得很人性化。 Postman 中文版能够发送任何类型的 HTTP 请求 (GET, HEAD, POST, PUT…)，不仅能够表单提交，且可以附带任意类型请求体。

Postman下载页面

与传统的mysql的区别

底层原理：倒排索引

正排索引

在建立索引的时候结构比较简单，建立比较方便且易于维护;因为索引是基于文档建立的，若是有新的文档加入，直接为该文档建立一个新的索引块，挂接在原来索引文件的后面。若是有文档删除，则直接找到该文档号文档对应的索引信息，将其直接删除。他适合根据文档ID来查询对应的内容。但是在查询一个keyword在哪些文档里包含的时候需对所有的文档进行扫描以确保没有遗漏，这样就使得检索时间大大延长，检索效率低下。比如有几个文档及里面的内容，他正排索引构建的结果如下图：

倒排索引：基于正排索引，将每个文档的内容通过关键字进行排序（去掉出现频率较高的无用字，比如的，是这种，剩下的就是关键字），查询时通过倒排索引可以查询到该关键词出现的文档位置是在1和3中;然后再通过正排索引查询到文档1和3的内容并返回结果。

倒排索引主要由单词词典（Term Dictionary）和倒排列表（Posting List）及倒排文件(Inverted File)组成。

单词词典（Term Dictionary）：搜索引擎的通常索引单位是单词，单词词典是由文档集合中出现过的所有单词构成的字符串集合，单词词典内每条索引项记载单词本身的一些信息以及指向“倒排列表”的指针。倒排列表(PostingList)：倒排列表记载了出现过某个单词的所有文档的文档列表及单词在该文档中出现的位置信息及频率（作关联性算分），每条记录称为一个倒排项(Posting)。根据倒排列表，即可获知哪些文档包含某个单词。倒排文件(Inverted File)：所有单词的倒排列表往往顺序地存储在磁盘的某个文件里，这个文件即被称之为倒排文件，倒排文件是存储倒排索引的物理文件。

2、基本使用

1、HTTP-索引-创建

创建相同的数据库会进行报错

  2、**HTTP-索引-查询 & 删除**

查看所有索引在 Postman 中，向 ES 服务器发 GET 请求： http://127.0.0.1:9200/_cat/indices?v

这里请求路径中的_cat 表示查看的意思， indices 表示索引，所以整体含义就是查看当前 ES服务器中的所有索引，就好像 MySQL 中的 show tables 的感觉，服务器响应结果如下 :

具体参数如下：

查询单个索引：

删除索引：

文档的创建（需要有索引）：

在shopping的索引下创建了一个_doc的文档，文档的内容为图中所示

返回结果如下：

自定义唯一标识：

3、HTTP-查询-主键查询 & 全查询

1、查看文档时，需要指明文档的唯一性标识，类似于 MySQL 中数据的主键查询

在 Postman 中，向 ES 服务器发 GET 请求： http://127.0.0.1:9200/shopping/_doc/1

返回结果如下：

{
"_index": "shopping",

"_type": "_doc",

"_id": "1",

"_version": 1,

"_seq_no": 1,

"_primary_term": 1,

"found": true,

"_source": {

  "title": "小米手机",

  "category": "小米",

  "images": "[http://www.gulixueyuan.com/xm.jpg](http://www.gulixueyuan.com/xm.jpg)",

  "price": 3999

}

}

2、查找不存在的内容，向 ES 服务器发 GET 请求： http://127.0.0.1:9200/shopping/_doc/1001

返回结果如下：

{

  "_index": "shopping",

  "_type": "_doc",

  "_id": "1001",

  "found": false

}

3、查看索引下所有数据，向 ES 服务器发 GET 请求： http://127.0.0.1:9200/shopping/_search

返回结果如下：

{

  "took": 133,

  "timed_out": false,

  "_shards": {

    "total": 1,

    "successful": 1,

    "skipped": 0,

    "failed": 0

  },

  "hits": {

    "total": {

      "value": 2,

      "relation": "eq"

    },

    "max_score": 1,

    "hits": [

      {

        "_index": "shopping",

        "_type": "_doc",

        "_id": "ANQqsHgBaKNfVnMbhZYU",

        "_score": 1,

        "_source": {

          "title": "小米手机",

          "category": "小米",

          "images": "[http://www.gulixueyuan.com/xm.jpg](http://www.gulixueyuan.com/xm.jpg)",

          "price": 3999

        }

      },

      {

        "_index": "shopping",

        "_type": "_doc",

        "_id": "1",

        "_score": 1,

        "_source": {

          "title": "小米手机",

          "category": "小米",

          "images": "[http://www.gulixueyuan.com/xm.jpg](http://www.gulixueyuan.com/xm.jpg)",

          "price": 3999

        }

      }

    ]

  }

}

4、HTTP-全量修改 & 局部修改 & 删除

全量修改和新增文档一样，输入相同的 URL 地址请求，如果请求体变化，会将原有的数据内容覆盖

在 Postman 中，向 ES 服务器发 POST 请求： http://127.0.0.1:9200/shopping/_doc/1

请求体JSON内容为:

{

"title":"华为手机",

"category":"华为",

"images":"http://www.gulixueyuan.com/hw.jpg",

"price":1999.00

}

修改成功后，服务器响应结果：

{

  "_index": "shopping",

  "_type": "_doc",

  "_id": "1",

  "_version": 2,

  "result": "updated",//<-----------updated 表示数据被更新

  "_shards": {

    "total": 2,

    "successful": 1,

    "failed": 0

  },

  "_seq_no": 2,

  "_primary_term": 1

}

局部修改修改数据时，也可以只修改某一给条数据的局部信息

在 Postman 中，向 ES 服务器发 POST 请求： http://127.0.0.1:9200/shopping/_update/1

请求体JSON内容为:

{

"doc": {

"title":"小米手机",

"category":"小米"

}

返回结果如下：

{

  "_index": "shopping",

  "_type": "_doc",

  "_id": "1",

  "_version": 3,

  "result": "updated",//<-----------updated 表示数据被更新

  "_shards": {

    "total": 2,

    "successful": 1,

    "failed": 0

  },

  "_seq_no": 3,

  "_primary_term": 1

}

在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_doc/1，查看修改内容：

{

  "_index": "shopping",

  "_type": "_doc",

  "_id": "1",

  "_version": 3,

  "_seq_no": 3,

  "_primary_term": 1,

  "found": true,

  "_source": {

    "title": "小米手机",

    "category": "小米",

    "images": "[http://www.gulixueyuan.com/hw.jpg](http://www.gulixueyuan.com/hw.jpg)",

    "price": 1999

  }

}

删除删除一个文档不会立即从磁盘上移除，它只是被标记成已删除（逻辑删除）。

在 Postman 中，向 ES 服务器发 DELETE 请求： http://127.0.0.1:9200/shopping/_doc/1

返回结果：

{

  "_index": "shopping",

  "_type": "_doc",

  "_id": "1",

  "_version": 4,

  "result": "deleted",//<---删除成功

  "_shards": {

    "total": 2,

    "successful": 1,

    "failed": 0

  },

  "_seq_no": 4,

  "_primary_term": 1

}

在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_doc/1，查看是否删除成功：

{

  "_index": "shopping",

  "_type": "_doc",

  "_id": "1",

  "found": false

}

5、HTTP-条件查询 & 分页查询 & 查询排序

URL带参查询查找category为小米的文档，在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_search?q=category:小米

URL带参数形式查询，这很容易让不善者心怀恶意，或者参数值出现中文会出现乱码情况。为了避免这些情况，我们可用使用带JSON请求体请求进行查询。

带请求体方式的查找所有内容查找所有文档内容，也可以这样，在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_search，附带JSON体如下

查询指定字段如果你想查询指定字段，在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_search，附带JSON体如下：

分页查询在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_search，附带JSON体如下：

查询排序如果你想通过排序查出价格最高的手机，在 Postman 中，向 ES 服务器发 GET请求： http://127.0.0.1:9200/shopping/_search，附带JSON体如下：

6、HTTP-多条件查询 & 范围查询

多条件查询假设想找出小米牌子，价格为3999元的。（must相当于数据库的&&）