到目前为止的答案已经帮助定义了哈希表并解释了一些理论,但是我认为一个示例可能会帮助您更好地理解它们。
哈希表和普通数组之间有什么区别?
哈希表和数组都是允许您存储和检索数据的结构。两者都允许您指定 索引 并检索与其关联的值。正如Daniel Spiewak指出的,区别在于数组的索引是
顺序的 ,而哈希表的索引是基于与它们关联 的数据 的 值的 。
为什么要使用哈希表?
哈希表可以提供一种非常有效的方式来搜索大量数据中的项目,尤其是否则难以搜索的数据。(“大”在这里表示是
巨大的 ,从某种意义上说,执行顺序搜索会花费很长时间)。
如果我要编码一个哈希,我什至会开始吗?
没问题。最简单的方法是发明一个可以对数据执行的任意数学运算,该运算返回一个数字
N(通常是整数)。然后使用该数字作为“存储桶”数组的索引,并将数据存储在存储桶#中
N。诀窍在于选择一个易于将值放置在不同存储桶中的操作,以方便您以后查找它们。
示例: 大型购物中心保留其顾客的汽车和停车位置的数据库,以帮助购物者记住他们的停车位置。数据库存储
make,
color,
licenseplate,和
parkinglocation。购物者离开商店后,通过输入其品牌和颜色来找到自己的汽车。数据库返回(相对较短)的车牌和停车位列表。快速扫描找到购物者的汽车。
您可以使用SQL查询来实现:
SELECt license, location FROM cars WHERe make="$(make)" AND color="$(color)"
如果数据存储在一个数组(本质上只是一个列表)中,则可以想象通过扫描数组中所有匹配的条目来实现查询。
另一方面,想象一个哈希规则:
将品牌和颜色中所有字母的ASCII字符代码相加,除以100,然后将其余部分用作哈希值。
此规则会将每个项目转换为0到99之间的数字,实际上将数据 分类 为100个存储桶。每次客户需要找到一辆车,你可以哈希品牌和颜色,找到 一个
水桶出来的100包含的信息。您立即将搜索量减少了100倍!
现在,将示例扩展到大量数据,例如,基于数十个条件搜索了具有数百万个条目的数据库。“良好”散列函数将以最小化任何其他搜索的方式将数据分布到存储桶中,从而节省大量时间。



