我将查看批量API,该API可让您在单个请求中发送多个文档,以加快索引编制过程。您可以发送10、20或更多的文档,具体取决于文档的大小。
根据您要索引的内容,您可能需要解析html,除非您希望将整个html索引为单个字段(在这种情况下,您可能希望使用html strip
char过滤器从索引中删除html标签。文本)。
索引后,我建议确保映射正确无误,您可以找到想要的内容。您始终可以使用Elasticsearch存储在幕后的_source特殊字段来重新索引,但是如果您已经编写了索引器代码,则可能需要在需要时再次使用它来重新索引(当然使用相同的html文档)。在实践中,您永远不会对数据进行一次索引…因此,请小心:)即使elasticsearch总是通过_source字段为您提供帮助),这只是查询现有索引并将其所有文档重新索引到另一个索引上的问题。



