Hbase是BigTable的一个开源实现。
1.1 BigTable<分布式存储系统> 1.2 网页搜索对于网页搜索,主要可以分为两个阶段
(1)建立互联网网页索引阶段。设计一个网页爬虫,不断地去各个网站爬取相关的网页,爬过来的网页每一个都单独存储在BigTable中,在BigTable这个大表上运行MapReduce,MapReduce运行后会生成相关的网

Hbase是BigTable的一个开源实现。
1.1 BigTable<分布式存储系统> 1.2 网页搜索对于网页搜索,主要可以分为两个阶段
(1)建立互联网网页索引阶段。设计一个网页爬虫,不断地去各个网站爬取相关的网页,爬过来的网页每一个都单独存储在BigTable中,在BigTable这个大表上运行MapReduce,MapReduce运行后会生成相关的网