我认为,对该问题的一般回答需要一种无监督的机器学习方法,该方法会生成局部不变特征-基本上,这是一种寻找不随缩放或旋转而变化的哈希的奇特方法-
然后运行聚类算法。以下是一些可能相关的论文:
- 在大型馆藏中将近重复图像聚类
- 基于PLSA模型的新型重复图像检测方法
- 基于图像分析的有效图像重复检测 -这里有很多内容,因为这是某人的全部博士学位论文

我认为,对该问题的一般回答需要一种无监督的机器学习方法,该方法会生成局部不变特征-基本上,这是一种寻找不随缩放或旋转而变化的哈希的奇特方法-
然后运行聚类算法。以下是一些可能相关的论文: