栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

ElasticSearch实现子串查询

ElasticSearch实现子串查询

match查询和term查询

match能够实现对查询字符串的模糊匹配,term实现对查询内容的精准匹配,通常可以用来处理数字(numbers)、布尔值(booleans)、日期(dates)以及文本(text)

精准查找价格为20的文档:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "filter": [
                {
                    "term": {
                        "price": 20
                    }
                }
            ]
        }
    }
}
实现子串的查询query_string

为了避免match执行时会将查询字符串进行分词、以及term完全匹配的特点,我们可以使用query_string语法来实现子串的查询,示例代码如下:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "query_string": {
                        "default_field": "table_name",
                        "query": ""student_info""
                    }
                }
            ]
        }
    }
}

query_string的查询块中指定了两个属性:default_field 指定要查询的字段,query 指定要查询的子串。上述代码的功能就是实现查找table_name字段中包含"student_info"字符串的文档。注意query字段中字符串的表示形式,需要显示的用双引号扩起来,才不会进行分词

想到这里就猜想,在match匹配时,将查询字符串显示的用双引号扩起来是不是也可以避免分词,答案是否定的。示例代码如下:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "table_name": {
                            "query": ""student_info""
                        }
                    }
                }
            ]
        }
    }
}

返回的查询结果显示仍然对query字符串进行了分词匹配,和直接使用不带双引号的查询字符串结果是一样的。

精准搜索字符串怎么破

为什么用term精准搜索字符串会失效,示例代码如下:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "term": {
                        "table_name": {
                            "value": "student_info"
                        }
                    }
                }
            ]
        }
    }
}

我们期望能搜索出table_name为"student_info"的文档,但是却没有返回结果。原因是在建立索引的时候,会对text类型的字段进行分词,然后建立索引,所以table_name字段的倒排索引中是不包含完整的"student_info"这个信息的。

如果要实现对text类型字段的精准匹配,在建立_mapping的时候就要指定:index:not_analyzed。告诉ElasticSearch该字段具有精确值,禁止对该字段的内容进行分词。同样也就失去了模糊匹配的能力

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/680676.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号