栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Elasticsearch 分词器

Elasticsearch 分词器

Elasticsearch 分词器 Standard Analyzer(默认)

standard 是默认的分析器。它提供了基本语法的标记化(基于 Unicode 文本分割算法),适用于大多数语言。【分词方式】区分中英文,英文按照空格切分同时大写转小写;中文按照单个词分词。

Simple Analyzer

simple 分析器当它遇到只要不是字母的字符,就将文本解析成term,而且所有的 term 都是小写的。【分词方式】 先按照空格分词,英文大写转小写,不是英文不分词。

Whitespace Analyzer

【分词方式】 按空格分词,英文不区分大小写,中文不再分词

ik 分词器

下载地址

https://github.com/medcl/elasticsearch-analysis-ik/releases

解压到 elasticsearch/plugins/ik 目录下

重启 ES ik_smart

上面三个模式,要么没有拆分,要么拆分的太细,我们不需要那样,于是使用ik分词器。

拆成”夏洛特“,”烦恼“。拆分了,但是力度不够细

最粗粒度划分。没有重复的

ik_max_word

最细粒度划分,字有重复的。

自定义分词词汇

相关配置文件

自定义字典文件

重启ES

测试

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/775986.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号