栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

ElasticSearch —基于字段值提高相关性

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

ElasticSearch —基于字段值提高相关性

您可以在索引时间或查询时间进行增强。我通常更喜欢查询时间提升,即使它会使查询变慢一点,否则每次我想更改提升因子时都需要重新编制索引,这通常需要进行微调并且必须非常灵活。

使用Elasticsearch查询DSL可以采用多种方法来增加查询时间:

  • 提升查询
  • 自定义过滤器分数查询
  • 自定义提升因子查询
  • 自定义分数查询

如果要对与特定查询或过滤器匹配的文档进行特定的增强,则前三个查询很有用。例如,如果您只想增加上个月发布的文档。您可以将这种方法与boosting_field一起使用,但是您需要手动定义一些boosting_field间隔,并为它们提供不同的增强,但这并不是很好。

最好的解决方案是使用“ 自定义分数查询”,该查询使您可以使用脚本进行查询并自定义其分数。它非常强大,您可以使用脚本直接修改比分本身。首先,我将boosting_field的值缩放为例如0到1的值,这样您的最终分数就不会太大。为此,您需要预测字段可以包含的最小值或最大值。例如,假设最小值为0,最大值为100000。如果将boosting_field值缩放为介于0和1之间的数字,则可以将结果添加到实际分数中,如下所示:

{    "query" : {        "custom_score" : { "query" : {     "match_all" : {} }, "script" : "_score + (1 * doc.boosting_field.doublevalue / 100000)"        }    }}

您也可以考虑将boosting_field用作提升因子(

_score *
而不是
_score+
),但随后需要将其缩放到最小值为1的间隔(只需加上+1)即可。

您甚至可以调整结果,以便更改其重要性,从而增加权重以影响分数。如果您需要将多个增强因子组合在一起以赋予它们不同的权重,则将需要更多。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/381668.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号