《算法导论3rd第二十一章》用于不相交集合的数据结构

前言

如果现在有需：求从n个不同结点的中，提取不相交集合，如何处理。

不相关：即A集合的数据和B集合没关系。放在连通图里面，则表示两个集合中的点相互不可达

这里我们要使用不相交集合的数据结构，不相交集合上有两个重要操作

不相交集合的操作

不相交集合教据结构维护一组不相交的动态集合的集合S={S1， S2, …, SK}。每个集合通过一个代表来识别，代表是集合中的某个成员

在某些应用中，哪一个成员被选作代表是无所谓的，但是必须保证在两次寻找某一集合的代表两次，得到的答案应该是相同的。
在另一些应用中，关于如何选择代表可能存在着预先说明的规则，例如选择集合中的最小元素(当然假定集合中的元素是可以排序的)。

集合中的每一个元素是由一个对象表示。设x表示一个对象，希望支持以下操作：

不相交集合数据结构的一个应用

如下图，确定一个无向图中连通子图。

求联通子图代码如下，计算过程见上图：

V[G]表示结点，E[G]表示边， CONNECTED-COMPONENTS对图形进行预处理，然后SAME-COMPONENT回答两个顶点是否在同一个连通分量。

不相交集合的链表表示

如下图，每个集合用一个自己的链表来表示。链表中的每个对象包含一个指向链表中下一个对象的指针和一个指回到集合对象的指针。

在链表的实现方法中，

为了降低UNIOn的复杂度，使用一种加权合并启发式策略：可以总是把较短的表拼接到较长的表中。

不相交集合森林

在不相交集合的另一种更快的实现中，用有根树来表示集合。每棵树的根包含了集合的代表，并且是它自己的父结点。如下图：

虽然采用了这种表示的算法并不比采用链表表示的算法更快，但是，通过引人两种启发式策略：“按秩合并”和“路径压缩”。

其代码如下

主要参考

《数据结构与算法——并查集(不相交集合)》
《Data Structures for Disjoint Sets》