最近的论文“ 汉明度量标准下的最接近对问题
”仅包含涉及n ^
2因子的算法(除非K非常大)。即使只寻找一对。因此,除非您对实例的结构做进一步的假设,否则似乎很难对此进行改进。例如,如果您假设汉明距离不是很大,则可以对几列进行采样,并在假设这些列完全匹配的情况下根据这些字符串将字符串哈希到存储桶中,然后分别在每个存储桶中进行成对比较。对另一组随机列重复此操作,以最大程度地降低错过某些对的可能性。

最近的论文“ 汉明度量标准下的最接近对问题
”仅包含涉及n ^
2因子的算法(除非K非常大)。即使只寻找一对。因此,除非您对实例的结构做进一步的假设,否则似乎很难对此进行改进。例如,如果您假设汉明距离不是很大,则可以对几列进行采样,并在假设这些列完全匹配的情况下根据这些字符串将字符串哈希到存储桶中,然后分别在每个存储桶中进行成对比较。对另一组随机列重复此操作,以最大程度地降低错过某些对的可能性。