为了获得启发,请看Levenshtein距离算法。这将为您提供合理的机制来加权比较。
我还要补充一点,以我的经验,您绝对不能绝对将两个任意数据匹配到同一实体中。您需要向用户提供合理的匹配条件,然后用户才能确定1920 E.
Pine上的John Smith是否与East Pine Road 192上的Jon Smith是同一个人。

为了获得启发,请看Levenshtein距离算法。这将为您提供合理的机制来加权比较。
我还要补充一点,以我的经验,您绝对不能绝对将两个任意数据匹配到同一实体中。您需要向用户提供合理的匹配条件,然后用户才能确定1920 E.
Pine上的John Smith是否与East Pine Road 192上的Jon Smith是同一个人。