Lucene正是完成此任务的正确工具。
实现目标的一种方法是使用RAMDirectory为每个文本建立索引,然后使用IndexReader从索引中获取TermEnum。现在,您可以将术语与数据库中的关键字进行匹配。
另一种方法是将每个文本索引为lucene文档,然后遍历您的关键字并获得当前术语的termDocs =>包含当前术语/关键字的所有文本。

Lucene正是完成此任务的正确工具。
实现目标的一种方法是使用RAMDirectory为每个文本建立索引,然后使用IndexReader从索引中获取TermEnum。现在,您可以将术语与数据库中的关键字进行匹配。
另一种方法是将每个文本索引为lucene文档,然后遍历您的关键字并获得当前术语的termDocs =>包含当前术语/关键字的所有文本。