栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

system design关于加index搜索(nosql DB)

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

system design关于加index搜索(nosql DB)

问题定义

database是按uuid auto increase的int作为primary key。搜pk肯定不需要o(N)全表遍历,至少可以二分o(logn).

但有时候想搜某一性质的内容。比如姓名,比如车型,这样。遍历全表会很慢,如果是搜索频率比较高的性质,可以考虑做index,变成o(1) (hashmap) 或 o(logn), 提升搜索速度。

关系型数据库里,只要create index就好.

非关系型数据呢?

两种方法 1. Local Index

对每一个partition, 增加一个关于index的hashmap,这里用最简单的hash index为例子,key是想作index的那一类,比如员工姓/姓名,value是list of Primary Key. 比如:

王:1, 5, 7, 99, 。。

李:2, 12, 。。。

张明:108,222, 。。。

这样每一个partition都维护一个自己的hashmap。

每在一个partition里写一个新数据,都在该partition的hashmap里相关index后面加上这个新pk。快

那么如果我们想搜王姓员工,就要遍历(scatter)每一个partition 的hashmap, 拿到每一个的王姓的结果,再合在一起(gather)。慢

应用

cassendra,mongoDB

2. Global Index

单独维护关于index的hashmap,和数据可以不在一个partition, 所有partition的数据共用一个hashmap (即global的index)。故只有一个王姓的key,所有结果都加在该key后面。

每在一个partition里写一个新数据,就在global hashmap里面相关的tag后面加上这个数据的pk。因为可能有很多相关index,且相关index可能不在同一Partition,所以慢。往往offline 异步进行。

只需要去global hashmap里面读一次,就是所有王姓的结果。快。

应用

DynamoDB,craigslist

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/726606.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号