栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

即时搜索PB级数据

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

即时搜索PB级数据

任何现成的搜索引擎(如Lucene)都应该能够在您拥有的数据量范围内提供搜索功能。您可能需要先做一些工作来设计索引并配置搜索的工作方式,但这只是配置。

您不会立即得到结果,但是您可能会 很快 得到结果。速度可能取决于您的设置方式以及运行的硬件类型。

您提到索引大于原始数据。这是可以预期的。索引通常包括某种形式的非规范化。索引的大小通常需要权衡取舍。预先对数据进行切片和切块的方法越多,查找引用的速度就越快。

最后,您提到分配索引,这几乎肯定 不是
您想要执行的操作。分发许多PB数据的实用性令人生畏。您可能想要的是将索引放在大型胖计算机上,并在数据上提供搜索服务(将查询带入数据,而不将数据带入查询)。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/570451.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号