栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

Elasticsearch中文分词器

Elasticsearch中文分词器

使用因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉字。

因此引入中文分词器es-ik插件:

在下载使用插件时候 一定要注意 版本对应!

github地址:

Releases · medcl/elasticsearch-analysis-ik · GitHubThe IK Analysis plugin integrates Lucene IK analyzer into elasticsearch, support customized dictionary. - Releases · medcl/elasticsearch-analysis-ikhttps://github.com/medcl/elasticsearch-analysis-ik/releases/

1.download or compile

optional 1 - download pre-build package from here: Releases · medcl/elasticsearch-analysis-ik · GitHubhttps://github.com/medcl/elasticsearch-analysis-ik/releases

create plugin folder cd your-es-root/plugins/ && mkdir ik

unzip plugin to folder your-es-root/plugins/ik

2.restart elasticsearch

Analyzer: ik_smart , ik_max_word , Tokenizer: ik_smart , ik_max_word

自定义分词词汇:

在plugins里的ik目录里,config目录下的IKAnalyzer.cfg.xml




        IK Analyzer 扩展配置
        
        
         
        
        
        
        
        

 

 

 重启es后:

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/728691.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号