栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

分析或未分析,选择什么

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

分析或未分析,选择什么

如果您需要进一步说明,我将尝试保持简单,让我知道,我将详细说明。

“已分析”字段将使用您为映射中的特定表定义的分析器来创建令牌。如果您使用默认分析器(当您指的是不带特殊字符的内容时,让我们说server
[1-9]),则使用默认分析器(数字小写单词经纪人(这实际上不是它的名字,它实际上就是这个名字))是要标记化:

this -> HelloWorld123into -> token1:helloworld123ORthis -> Hello World 123into -> token1:hello && token2:world && token3:123

在这种情况下,如果您进行搜索:HeL10,它将变为->“ hello”,并且它将与该文档匹配,因为这里有令牌“ hello”。

在not_analized字段的情况下,它根本不应用任何标记器,您的​​标记是您的关键字,因此被这样说:

this -> Hello World 123into -> token1:(Hello World 123)

如果您在该字段中搜索“ hello world 123”

不会匹配,因为它是“区分大小写的”(尽管您仍然可以使用通配符(Hello *),让我们在另一时间解决该问题)。

简而言之:

对要搜索的字段使用“已分析”字段,并希望elasticsearch对它们进行评分。示例:包含单词“ jobs”的标题。查询:“ title:jobs”。

doc1 : title:developer jobs in montrealdoc2 : title:java prer jobs in vancuverdoc3 : title:unix designer jobs in torontodoc4 : title:database manager vacancies in montreal

这将检索title1 title2 title3。

在这种情况下,您需要“已分析”字段。

如果您事先知道该字段上将包含哪种数据,并且要精确查询所需的内容,则需要“ not_analyzed”。

例:

从server123获取所有日志。

查询:“ server:server123”。

doc1 :server:server123,log:randomstring,date:01-jandoc2 :server:server986,log:randomstring,date:01-jandoc3 :server:server777,log:randomstring,date:01-jandoc4 :server:server666,log:randomstring,date:01-jandoc5 :server:server123,log:randomstring,date:02-jan

仅来自server1和server5的结果。

好吧,我希望你明白了。正如我所说的,保持简单是您需要的。

分析->磁盘上有更多空间(如果分析字段很大,则更多)。分析->更多时间进行索引。分析->更好地匹配文档。

not_analyzed->减少磁盘空间。not_analyzed->更少的索引时间。not_analyzed->字段完全匹配或使用通配符。

问候,



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/382461.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号