朱莉娅,看来您正在寻找的是n-gram,特别是Bigrams(也称为搭配)。
这是关于从Manning和Schutze的统计自然语言处理基础中找到搭配(PDF)的一章。
为了使用Lucene做到这一点,我建议将Solr与ShingleFilterFactory一起使用。请参阅此讨论以获取详细信息。

朱莉娅,看来您正在寻找的是n-gram,特别是Bigrams(也称为搭配)。
这是关于从Manning和Schutze的统计自然语言处理基础中找到搭配(PDF)的一章。
为了使用Lucene做到这一点,我建议将Solr与ShingleFilterFactory一起使用。请参阅此讨论以获取详细信息。