看一下MurmurHash3的128位变体。该算法的页面包含一些性能数字。应该可以将其纯粹地或作为C扩展移植到Python。(作者建议
更新后 使用128位变体,并丢弃不需要的位)。
如果MurmurHash2
64位适合您,则pyfasthash包中有一个Python实现(C扩展),其中包括一些其他非加密哈希变体,尽管其中一些仅提供32位输出。
更新
我为Murmur3哈希函数做了一个快速的Python包装器。Github项目在这里,您也可以在Python Package
Index上找到它; 它只需要一个C ++编译器即可构建;无需增强。
使用示例和时间比较:
import murmur3import timeit# without seedprint murmur3.murmur3_x86_64('samplebias')# with seed valueprint murmur3.murmur3_x86_64('samplebias', 123)# timing comparison with str __hash__t = timeit.Timer("murmur3.murmur3_x86_64('hello')", "import murmur3")print 'murmur3:', t.timeit()t = timeit.Timer("str.__hash__('hello')")print 'str.__hash__:', t.timeit()输出:
156629014978245847827997834649920664675murmur3: 0.264422178268str.__hash__: 0.219163894653



