栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Solr中StandardTokenizerFactory和KeywordTokenizerFactory之间的区别?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Solr中StandardTokenizerFactory和KeywordTokenizerFactory之间的区别?

StandardTokenizerFactory:-
标记空白,并去除字符

文档:-

在标点符号处拆分单词,删除标点符号。但是,不带空格的点被认为是令牌的一部分。除非连词中有数字,否则用连字符分割单词。在这种情况下,整个令牌将被解释为产品编号,并且不会拆分。将电子邮件地址和Internet主机名识别为一个令牌。

将其用于要在字段数据上搜索的字段。

例如-

http://example.com/I-am+example?Text=-Hello

会生成7个令牌(用逗号分隔)-

http,example.com,I,am,example,Text,Hello

KeywordTokenizerFactory:-

关键字Tokenizer根本不分割输入。
对该字符串不执行任何处理,并且整个字符串被视为单个实体。
这实际上并没有进行任何标记化。它返回原始文本作为一个术语。

主要用于排序或构面需求,在筛选多个单词并进行排序时,您希望匹配精确的构面,因为排序不适用于标记化字段。

例如

http://example.com/I-am+example?Text=-Hello

会生成一个令牌-

http://example.com/I-am+example?Text=-Hello


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/498488.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号