您应该在种子列表中将url_id作为附加元数据传递,并使用urlmeta和index-metadata插件,以便将键/值传递到出站(如有必要)或至少可用于索引。
有关如何索引元标记的说明,请参见Nutch WIKI。
上一篇 在Elasticsearch中建模父/子关系(产品/产品变体)
下一篇 Elasticsearch过滤多个术语,仅包含匹配结果,而不包含任何匹配结果
版权所有 (c)2021-2022 MSHXW.COM
ICP备案号:晋ICP备2021003244-6号