栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

ElasticSearch:我们可以在索引编制过程中同时应用n-gram和语言分析器吗

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

ElasticSearch:我们可以在索引编制过程中同时应用n-gram和语言分析器吗

您可以基于语言分析器创建自定义分析器。唯一的区别是您将

ngram_filter
令牌过滤器添加到链的末尾。在这种情况下,您首先会获得语言梗阻的令牌(默认链),这些令牌最终会转换为边缘ngram(您的过滤器)。您可以在这里https://www.elastic.co/guide/zh-
cn/elasticsearch/reference/current/analysis-lang-analyzer.html#english-
analyzer
中找到语言分析器的实现,以覆盖它们。这是英语更改的示例:

{    "settings": {        "analysis": { "analyzer": {     "english_ngram": {         "type": "custom",         "filter": [  "english_possessive_stemmer",  "lowercase",  "english_stop",  "english_stemmer",  "ngram_filter"         ],         "tokenizer": "standard"     } }, "filter": {     "english_stop": {         "type": "stop"     },     "english_stemmer": {         "type": "stemmer",         "language": "english"     },     "english_possessive_stemmer": {         "type": "stemmer",         "language": "possessive_english"     },     "ngram_filter": {         "type": "edge_ngram",         "min_gram": 1,         "max_gram": 25     } }        }    }}

更新

要支持特殊字符,您可以尝试使用

whitespace
标记符代替
standard
。在这种情况下,这些字符将成为令牌的一部分:

{    "settings": {        "analysis": { "analyzer": {     "english_ngram": {         "type": "custom",         "filter": [  "english_possessive_stemmer",  "lowercase",  "english_stop",  "english_stemmer",  "ngram_filter"         ],         "tokenizer": "whitespace"     } }, "filter": {     "english_stop": {         "type": "stop"     },     "english_stemmer": {         "type": "stemmer",         "language": "english"     },     "english_possessive_stemmer": {         "type": "stemmer",         "language": "possessive_english"     },     "ngram_filter": {         "type": "edge_ngram",         "min_gram": 1,         "max_gram": 25     } }        }    }}


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/403663.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号