Nutch与您可能曾经尝试过的完全不同。因为它类似于框架,所以它不仅具有查询和搜索的前端,尽管solr似乎比本机的Nutch搜索前端更强大。它还具有爬网部分和索引(进入Lucene索引)。
如果要将爬网用于搜索以外的其他目的,则需要开发自己的程序,并熟悉Hadoop和MapReduce编程。
不知道要对爬网做什么,但看起来Nutch并不是解决方案

Nutch与您可能曾经尝试过的完全不同。因为它类似于框架,所以它不仅具有查询和搜索的前端,尽管solr似乎比本机的Nutch搜索前端更强大。它还具有爬网部分和索引(进入Lucene索引)。
如果要将爬网用于搜索以外的其他目的,则需要开发自己的程序,并熟悉Hadoop和MapReduce编程。
不知道要对爬网做什么,但看起来Nutch并不是解决方案