栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

ElasticSearch————————ik分词器

ElasticSearch————————ik分词器

简单介绍ElasticSearch ElasticSearch是什么

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。

为什么用ElasticSearch

有负载能力强、速度快、开箱即用等优势

如何用ElasticSearch

可以使用head插件进行查询也可以通过postman等可以发送Rest风格的工具操作,甚至可以发送ajax请求来实现,总之操作有很多方式。

其实java代码也有很多实现方式,比如发http请求、持久化继承Repository定义方法接口等

分词器 问题描述

我们知道ElasticSearch面对海量数据时也可以很快的进行搜索处理,而我在处理数据时遇到了一个问题,中文单词被分成了一个一个的汉字,当用Kibana作图的时候,按照term来分组,结果一个汉字被分成了一组。

这个问题在于Elasticsearch中默认的标准分词器,这个分词器在处理中文的时候会把中文单词切分成一个一个的汉字。接下来将引入es之中文的分词器插件es-ik解决这个问题。

集成IK分词工具

第一步:下载插件——————GitHub - medcl/elasticsearch-analysis-ik at 2.x

第二步:对源码编译————————————mvn clean package -DskipTests

第三步:复制粘贴文件

 

 第四步:解压文件,重启es服务。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/307632.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号