计数不同的原因是,除非所讨论的索引具有单个分片,否则术语向量是不准确的。对于具有多个分片的索引,文档分布在所有分片上,因此返回的频率不是总数,而是来自随机选择的分片的频率。
因此,返回的频率只是一个相对的度量,而不是您期望的绝对值。请参阅“行为”部分。为了测试这一点,您可以创建一个分片索引并请求频率(它应该给您实际的总数)。

计数不同的原因是,除非所讨论的索引具有单个分片,否则术语向量是不准确的。对于具有多个分片的索引,文档分布在所有分片上,因此返回的频率不是总数,而是来自随机选择的分片的频率。
因此,返回的频率只是一个相对的度量,而不是您期望的绝对值。请参阅“行为”部分。为了测试这一点,您可以创建一个分片索引并请求频率(它应该给您实际的总数)。